晚上十点,我躺在家里的床上,点开一场直播带货。
主播一会儿叫小助理手忙脚乱地上链接,一会儿和另一个主播连麦PK价钱,一会儿又和弹幕里的听众互动。直播间的在线人数冲上了十几万,我当然也并不是很想买东西,但听主播的叫卖和听众的互动,一种20年前“电视购物”的辣味直冲脖子,有趣。
与此同时,我想到,弹幕、视频通话、直播、连麦都是十年前就开始有的东西,为什么从今年开始,突然就人人都能做起直播了?
大主播不说,现在普通人开直播并不需要签约,整个直播的过程主播是不需要付费的。观众倘若不打赏,不买货,直播对听众来说也是免费的。但视频和直播的成本多高,相信每个人心中都有数。
屏幕上的弹幕飞快地上滚,我发觉主播和我几乎是同时听到的,他几乎立即回复了一个对商品的疑惑。我觉得我们之间没有距离。
十万人级别的直播,实时的多人连麦,无延后的弹幕和上链接的操作。各项体验渐渐提高,量变积累成质变,这让十年前就存在的直播产品,成为了当下新电商形态的重要支撑。
你发出的弹幕,你疯抢商品的链接,你刷的礼物,都要在1秒以内穿过上千公里在数个数据中心中经历流转和估算,以确保让数十万的听众和主播自己在同一时刻看见的是相同的内容。
我开始好奇一个问题,不考虑收入的情况下,办一场这样的直播,技术成本是多少?或者说,如果企业想自己玩一场直播带货,要花多少钱。
三网合一的对策
花多少钱是个复杂问题,因为“电商直播”是个复杂场景。我们不妨把电商直播分拆一下, 看看是什么某些的需求组合而成:
直播的画面本身,是一个实时的音视频传输,也可以说是一个“网络电视”;
直播的弹幕和评论,各种好友、粉丝关系,以及直播间本身的主播、房管、用户结构,则很像是一个即时通信场景,或者说是一个“QQ群”;
而直播联接的商品,各种让利操作、代金券领取和主播专用链接,则是一个“小电商”,或者说是一个大电商中的一部分。
不得不说,对于非互联网企业来说,想把“网络电视”“即时通信”和“电商”全都做下来,显然不是非常容易;而对于许多传统企业用户,做好其中的任何一项,都是一个令人失望的挑战。
更何况,服务一两个用户与服务成千上万个用户是完全不同的逻辑。随着直播规模的下降、观看人数的增多,企业必须不断升级自己的相关软硬件。这促使单一企业自备“直播电商”这种复杂场景,是一个不经济的选择。所以,一般来说,企业就会用到打包的直播服务,实现几种需求的“合一”。
翻翻现在各类云产品的计费方法:根据数据量、码率和时长,不同主播可以依照自己听众多少、直播环境及音质需求分别找到对应的产品。也就是说,成本、延迟、并发、画质等,都是可以定制的条件,大主播有大主播的高配,小主播也有小主播的让利。
今日的云产品,已经注意到了主播各种各样的需求。同时被注意到的,也有其他商业形态的其他需求。例如,对于高音质、低延后的追求,常常在网路直播平台观看各种赛事、尤其电竞比赛的用户,应该特别了解。有时,团战胜负只在几秒之间;如果你观看的平台延后较大,甚至会在亲眼见到结果之前,收到弹幕中其他用户的“剧透”——这或许会令人心中很不是滋味儿。
而在并发方面,各类大会软件、在线教育软件,都须要容纳数百乃至上千人的大卧室。在疫情影响下,一些原本多见于线下的业务也开始转移至线上,比如房产经纪人带着一群租户“VR看房”,同样对高并发提出了要求。
至于成本,则是任何商业都要力求增加的。大带宽固然是解决问题的一种方式,但流量燃烧的同时,经费也在燃烧。云服务如何能帮助顾客既多、快、好还要“省”,方法也是各异的。通常来说,这考验了各家AI的设计和运用,是否能照料到多变的音视频场景,比如在“云上”增强音质,而非直接把原始码流一股脑推给每位用户。
无论是多人的语音聊天,还是一对一的视频通信,都已经不是这个时代的技术和产品。只不过,如今的视频通信可能弄成了多对多,聊天室更是时常高达数百上千人。曾经和“即时通信”(IM)配对出现的实时音视频通讯,如今已然不再局限于QQ、微信等IM软件,成为一种新的普遍需求。而这种需求的背后,又全都有云服务的影子。
所以,既做IM又做云的企业,便捕捉到了这些变化。今年5月,腾讯云整合后发布的“腾讯云音视频”品牌,便是新环境下的一种应对。这次整合最令人印象深刻的,便是腾讯意识到了TRTC实时音视频通信网络、IM即时通信网路、CDN流媒体分发网路在需求端彰显出的一致,而“三网合一”后推出的RT-ONE网路。
产品和服务一次打包,在用户看来,不用再迟疑“想要哪些该找谁”;而在腾讯自己,几张网路融合,也易于查缺补漏、整个“新活儿”。腾讯自家的腾讯大会,在腾讯云音视频的支持下,就成为了用户人数最早破亿的视频会议软件。不过,除了大通话时长、高连麦并发等技术基础的展示,三网合一带来的,还有好多更醇厚的方案。
我们回到电商直播场景。如今主播的方便操作、观众的丝滑体验,离不开许多细节的积累:
在直播中,主播向听众介绍商品,赠送代金券,观众通过商品链接进行秒杀、抢购,发弹幕跟主播互动等等,是“文本”性质的操作,需要用到IM的消息处理能力;
而主播与听众连麦互动,主播与其他主播PK价钱,是音视频的综合解决方案,需要TRTC的实时音视频能力;
一场带货直播所面向的听众群体特别庞大,峰值时并发人数可能超过百万,这就须要借助CDN的流媒体分发能力。
这些仅仅是电商直播场景中最基本的功能。除此之外,PK带货、点赞送礼、抢红包、抽奖等等,也借助IM、TRTC、CDN三张网路的共同实现。如果让每家企业单独来做,将会是整个社会巨大的资源浪费。而选用成熟的云服务,则确实在一定程度上同时实现了“多快好省”。
RT-ONE除了是三张网路的叠加,更是“云、边、端”的整合。高并发的CDN网路吸收低延时的RTC技术后,就进化出了“快直播”这样的应用,在极小容积、极简操作的基础上,实现了百万用户并行下300~1000ms(区别于往年直播技术的3~5s延后)的电商直播延后。目前,快直播早已成为中小企业电商带货的首选之一。
国际数据公司(IDC)发布的《中国视频云市场跟踪(2020下半年)》中,中国视频云整体市场规模达到38.1亿美元,同比下降75%,而腾讯云早已抢占了解决方案市场份额的第一位。中国云视频的快速下降,主要深受在线音视频互动娱乐、电商平台直播带货、在线教育等三大场景驱动。
可以看见,电商直播早已成为了一个需求大头——2020年一年,整个直播电商市场流量下降了400%,背后的估算能力又下降了多少呢?在“大主播”之外,中小企业做直播电商各有各的选择,比如小程序就成为了疫情期间中小企业直播带货的首选,腾讯云音视频支持企业直播的场次,累计早已超300万。
那么,这么多企业不再“重复造轮子”,省出来的钱做了哪些?直播成本的急剧增加,一方面让企业才能掏出更多成本投入实际的业务,比如直播电商中给听众的折扣和代金券;另一方面,当成本低到一定程度,曾经一些只存在于想像的产品,将逐步成为现实。
从还原现实,到改建现实
很明显,随着成本增加,一些从前不敢规划的产品,已经在现实中渐渐出现。比如说,在手机上还原一座城市,是异想天开吗?“云上南头古城”小程序,在云服务的加持下,就真的做到了。
除了本身“电影级音质”的水景还原,“云上南头古城”并不只是一个“视频”,而是一个沉浸式的场景。打开小程序,我们会发觉,与一般的地图、街景不同,“云上南头古城”并非只有街道及两旁建筑对立面,就连建筑内部也达到了1:1呈现。
如果这么庞大的数据量完全通过视频输出,不仅开发商心中要嘎吱一下,就连每一位小程序用户的流量怕是也吃不消。当然,现实操作中,大部分渲染是在云端完成的,开发商万科和万翼科技只须要对接SDK就可以了——RT-ONE在整合品牌与基础网路之外,也向下整合了SDK,提供了一站式的云音视频快捷服务。
在对延后和分辨率有高要求的行业,如今的云服务也有可圈可点的表现。医疗影像在实践中,对多部位去骨,探针,肋骨提取,组织更改,血管/软组织生长,裁剪,体勾画等功能,都有一定技术层面的需求,如影像的画质、延迟等。
这些需求涉及实时调用多种算法,需要花费大量的估算和图象显示资源。因此,现实生活中,3D成像阅片一般须要在诊所筹建私有的医疗影像工作站,需要配套的软硬件支持,一般只有小型诊所可以负担。
而通过云渲染、多端支持和对条件各异的底层硬件的调度,云服务能将这些影像处理能力赋于硬件配置较差的中小型诊所,让“慢”“卡”变得流畅。我们在图中可以见到,在现有测试中,帧率和延后的表现,都能达到一线大夫的需求。这对于做大医疗资源总数、平衡医疗资源分布,同时又不明显降低医疗成本,会有帮助。
此外,云服务还有一些更“未来”的应用,比如云游戏,和依托云游戏而生的元宇宙。看似“产品企划与设计”的彰显,实际上在多个层面都离不开基础的功能拓展和性能提高,就单纯的性能而言:如果云游戏的延后低到与一般网路游戏的反应速率别无二致,云游戏的操作还会无限接近本地游戏的操作;如果云游戏的帧率可以提高到现今乃至次世代大作的水平,游戏体验都会不输主机乃至PC。
而这也只是很基础的应用。一旦明了云渲染的强悍之处在于“赋予甚至远超本地的算力和资源”,就会意识到云游戏虽然有着更大的想像空间。
常看vtuber的用户应当了解,vtuber相关的虚拟偶像技术,早已脱离“主播自己抚弄”的领域,进入成熟公司提供完整解决方案的时代。虚拟偶像的急剧提高,也是一种技术“赋能主播”的过程。
这个道理在云游戏中也是相同的。例如,假如云游戏可以与游戏主播、虚拟偶像联动,以直播的方式输出游戏内容,游戏直播的形态都会形成极大变化,届时,我们除了能看到主播“捏人”玩游戏,甚至能看到主播、偶像自己成为游戏角色。当然,这离不开云端对个人主播的巨大资源倾斜。
而云端能改善的,显然也不止角色形象如此简单。如果云端AI才能赶超本地算力的限制,撇开硬碟上固有的内容,通过实时演算输出“千人千面”的不同结果,云游戏就真的走向了“元宇宙”的领域。而这一切的本质,都在于云服务规模效应造成的用户个体成本增加。可以说,降低的成本、提升的效率,使得各个产业都有余力去精进业务本身,让“传统”和“现实”更进一步。
云服务与元宇宙
其实类似的觉得,热爱魔改的单机玩家,在往年做mod、打mod的过程中,就以前体验过。“全网为单机赋能”所带来的多种可能性,任何“创意工坊”和“N网”用户都十分熟知。上古卷轴弄成少女卷轴,就是一种全网资源灌注到单机的过程。而在云游戏中,这一过程会显得更快、更完善、更多样。
如今的云游戏,离“千人千面的内容”还有一定距离,但“千人千面的输出”则基本早已实现了。在《Rival Peak》等元宇宙案例中,多人决策,以及“上帝视角”等赶超传统游戏的改变早已出现。
啥叫“上帝视角”?举个反例,你可以不局限于主播或导播,自由探求地图上的每位角落,而整个游戏依然照常进行——嘿,我总算能一边看球赛一边学出装,不用再事后回头翻录象了。
当元宇宙概念被反复提到,国内也纷纷对比各家游戏厂商实力时,我在想,决定元宇宙能够令用户满意的关键,或许不仅仅是游戏开发和企划能力,反而更多在于音视频的支持,在于云渲染,在于AI带来的百人千面。所以我们也能看到,是FB而非传统的游戏公司,搞出了《Rival Peak》这种小型试验田。
对比其他场景,“元宇宙”显然更是一种综合的即时通信和音视频交互活动。而在国外,直播与游戏的高速结合,也让两个基于类似需求的行业越走越近。未来,游戏与直播会否形成如IM和音视频通信般的结合,而升级的或新生的产品形态,毫无疑问会同直播电商类似,对于音质、延迟、并发……等有着极高考验。
恐怕还是要先把基础打好吧。在各行各业上云之前,“元宇宙”的突破,还有的等呢。