“实时互动作为一种未来数字生活的基础设施,其赛道潜力不亚于人工智能、大数据、区块链等专业技术赛道。”近日声网发布首个RTE(实时互动)赛道的全景报告—《实时互动场景创新生态报告》(以下简称“报告”),报告称,预计2025年,RTE行业将是千亿规模市场,5年内复合增长率将达40%以上。”


随着音视频技术的进步,以及疫情的常态化,越来越多的实时互动新场景出现,实时互动在社交、办公、娱乐、教育、工业等各行各业中落地。根据声网对国内几大应用商店在教育、泛娱乐、购物、金融、医疗、企业通讯等行业的近万个应用进行统计,2021年实时音视频渗透率已突破30%。


“RTE行业依然处在非常早期的阶段,我认为这个渗透率还有很大的增长空间,当RTE变成万千行业必备的一个模块的时候,RTE赛道可能进入到一个成熟行业的周期。”声网市场运营副总裁&合伙人曹璐说。2021年元宇宙概念火爆,曹璐认为,无论是在线上还是在线下,或者是线上线下同时开展社会活动,人与人之间的沟通和交互不可避免。“我们更多承载的是实时互动层面的技术,为元宇宙场景提供基础设施。今年我们的超音速计划里面也有不少元宇宙相关公司。”曹璐说。


不过看到实时互动领域其中机会的并不是只有声网一家,这个领域早已被巨头盯上,包括腾讯、阿里、字节跳动等互联网企业也都已入局其中。中信证券认为,声网的竞争对手包括腾讯云代表的公有云厂商、Tokbox代表的RTE厂商、Twilio代表的CPaaS厂商、ZOOM代表的视频会议厂商以及WebRTC代表的开源项目。


多家巨头企业入局

RTE赛道各方需求层出不穷


去年2月1日,特斯拉CEO马斯克在语音社交网络平台Clubhouse上创建聊天室,畅谈了关于火星计划、脑机接口技术、比特币等热门话题。随之Clubhouse在全球范围内爆红。很快,其背后的实时音频技术服务商——声网浮出水面,声网公司的股价也随热度一度上涨,这家彼时专注于实时音视频技术的ToB企业随之出圈,被更多人所知。


声网 Agora 成立于 2014 年 ,是实时互动 API 平台行业开创者,也是专业服务商。开发者只需简单调用 API,即可在应用内构建多种实时音视频互动场景。公司透露,声网 SDK 已经服务于社交直播、在线教育、游戏电竞、IoT、AR/VR、金融、保险、医疗、企业协作等 20 余行业,共计 200 多种场景。


声网的实时互动技术服务覆盖全球 200 多个国家和地区。其官方透露,2021 年 Q1,声网实时音视频分钟数月均用量超 500 亿分钟。截至 2021 年 9 月 30 日,声网全球注册应用已超37.2万。使用声网服务的企业包括小米、陌陌、新东方、晓黑板、The Meet Group、Bunch、Kumu等分布在全球的巨头、独角兽及创业企业。2020年6月26日,全球实时互动云服务商声网Agora正式在美国纳斯达克挂牌交易,股票代码为“API”,成为“全球实时互动云第一股”。


在今年RTE大会上,声网发布的“RTE万象图谱”展示了涵盖教育、泛娱乐、IoT、企业协作、金融、医疗等20多个行业赛道的200多个实时互动场景。图谱显示,除了在线教育、直播、视频会议等已经逐渐走向常态化的场景,也有更多正处在萌芽阶段的新兴场景正在爆发。


RTE万象图谱    图源:声网


报告显示,实时互动赛道的兴起,得益于政策、经济、技术和社会几大要素。5G、AI、音视频编解码、IoT等技术突飞猛进的发展,使得交互更加还原、真实,甚至体验超越线下互动。


不过,看到这一领域机会的并非只有声网一家公司。实际上,这个领域也早已被巨头盯上,包括腾讯、阿里、字节跳动等互联网企业也都已入局其中。以腾讯为例,早在2014年12月份,腾讯云计算公司就对外宣布,推出一体化云视频解决方案,开放音视频能力,正式涉足具有巨量需求的网络视频市场。次年5月份,腾讯云又正式对外开放QQ音视频云通讯服务,此后一路运营和发展。


去年5月份,腾讯成立腾讯云音视频品牌,同时发布三合一的RT-ONE网络。该网络整合了腾讯云实时通信网络(TRTC)、即时通信网络(IM)以及流媒体分发网络(CDN)三张网络,面向教育、零售、泛娱乐等行业需求提供服务。腾讯云称,基于RT-ONE网络,腾讯云构建了业界最完整音视频通信PaaS平台,可以帮助开发者在各个垂直场景快速开发行业应用。


中信证券认为,声网的竞争对手包括腾讯云代表的公有云厂商、Tokbox代表的RTE厂商、Twilio代表的CPaaS厂商、ZOOM代表的视频会议厂商以及WebRTC代表的开源项目。


对此,声网市场运营副总裁&合伙人曹璐表示,“从定位来看,声网是RTE PaaS的开创者。我们最初是定义RTC,近年来也是更多地聚焦迭代这个概念,往RTE方向,始终希望把我们的体验和服务以最普惠的方式提供给开发者。”声网市场生态高级总监杨慧则表示,声网的底层是技术服务商,永远会在技术服务这条道路上走下去,这是和其他玩家不一样的地方。”


然而纯技术道路也并非坦途。在采访中曹璐坦言,RTE赛道各方需求层出不穷,尤其到了IoT领域会面临各种终端设备,对音视频的要求可能不一样。当进入某个行业或者纵深场景,都会对技术提出更多新的挑战。杨慧也表示,随着前端应用场景的爆发式扩张,带来的挑战可能是几何倍数增长。“我们单从实时音视频互动来说,必须匹配市面上数千款移动终端和其使用的OS系统,才能达到最终效果。回到刚才讲的这些IoT设备和应用类型,如果我们想把每个都服务好其实是有挑战性的,需要梳理一条清晰的线给研发技术排序,让他们想用的时候就用得起来。”


声网的营收在增长。2020年全年,声网总营收1.34亿美元,同比增长107.3%。


2021年Q1、Q2、Q3营收分别是4022.5万美元、4233万美元、4504万美元。


同比增长分别为13%、25%、46%。但声网总体上仍然处于亏损状态。2018年,声网净利润38万美元。2019年声网净亏损618万美元,2020年,声网净亏损311万美元,2021年Q1、Q2、Q3其亏损额分别为1469.1万美元、1540万元、2110万美元。亏损有扩大趋势。


“RTE行业处在早期阶段”

“元宇宙内人与人的实时交互不可避免”


为了加速行业发展和繁荣,声网推出一系列计划,包括超音速计划、声选伙伴计划、共鸣计划,预备从场景、产品、业务三方面对RTE行业合作伙伴进行孵化和扶持。曹璐坦言,“我们看到了实时互动行业的兴起和市场潜力,但由于赛道还处于早期,需要更多的玩家加入行业分工协作,共同扩大赛道的规模。”


“RTE行业依然处在非常早期的阶段,原因是可以看到今天的渗透率。2015年的时候是5%以下,2021年是超过30%,我认为这个渗透率还有很大的增长空间,当RTE变成万千行业必备的一个模块的时候,我认为RTE赛道可能进入到一个成熟行业的周期。”曹璐说。


杨慧也强调称,实时互动带来的是新的、过去没有体验过的价值,是一个可持续的影响。“当疫情结束时,大家可能就会持续性地把这个东西延续下去。另外,有些人可能不喜欢面对面社交,要是弄一个Avatar,他们就会觉得很有意思,敢于表达,因为可以“伪装”自己,这种体验是以前在线下感受不到的。”


被问及哪个行业比较容易达到成熟的时间节点,曹璐表示,任何一个行业和技术的成熟都有赖于两个方面:一个是技术和基础设施的完善,之后是应用平台逐步滋生出来,然后又会对这种基础设施、底层技术的突破提出更高的挑战和要求,两者是正相关的关系。“比如K歌房和实时合唱,三年前就有客户给我们提出,但当时没有人做到这种技术,非常非常难。经过这么多年的发展到了今天,我们很难讲这个场景已经到了非常完美的阶段,比如合唱可以把延迟做得多么低,但已经比三年前有了很大的进展。”


她坦言,行业节点其实很难判断。应该聚焦于真正让不同行业的创新者更多地使用,理解这一块的价值。“等到其中有些人能够做出颠覆式体验,就会成为一个行业的共识,也就是“可以利用RTE来做”。其实这不是一个很准确的一刀切的点,反而是不断变化的过程。”


2021年元宇宙概念大火。按照目前业内对于元宇宙的主流畅想,元宇宙或是一个仿真的虚拟世界。在杨慧看来,元宇宙就是要把所有线下的工作、生活、娱乐以及各种各样的社会活动无缝地搬到线上,做到线上和线下结合。那么元宇宙和声网相关的是什么?


“无论是在线上还是在线下,或者是线上线下同时开展社会活动,人与人之间的沟通和交互绝对是不可避免的。我们更多承载的是实时互动层面的技术,为元宇宙场景提供基础设施。今年我们的超音速计划里面也有不少元宇宙相关公司。”曹璐说。


杨慧则发现,在新场景的创业者中,含“元宇宙”量越来越大。“比如去年的第一届RTE创业大赛,冠军叫做绿洲Oasis,类似这样的技术型公司越来越多,有的把自己定位于元宇宙虚拟社交的应用,包括虚拟身份系统,一半以上参赛企业都说自己是元宇宙应用开发商。”


曹璐表示,一个行业的爆火背后一定是有大量的创业公司去探索。“我们现在的定位就是聚焦RTE赛道,也是大家的生态共创伙伴。未来哪个场景、行业能火起来,什么节奏,元宇宙会不会明天爆发,我们无法判断。但我们能够做好的还是基于自己这样的定位,把所有相关技术和可能性都准备好。哪一天元宇宙真的火了,我们提供的沉浸感音视频和虚拟的沉浸技术,可以实时无缝地使用。”


新京报贝壳财经记者  孙文轩 编辑 岳彩周 校对 薛京宁