文|刘旷
一直以来,追逐风口都是互联网企业的天性。因此,继元宇宙风口以后,横空出世并火遍全省的AIGC和ChatGPT,便又成为了各行业企业追逐的焦点。在此背景下,无论是国外互联网大厂,还是科技公司,亦或是内容平台,但凡有些实力的玩家都纷纷下场,围绕AI大模型展开了一场激烈争夺,"千模大战"也就此拉开了序幕。
一场基于大模型的创业浪潮开始风靡开来,国内相继布局大模型的企业也如雨后春笋般争相涌现。只不过,与百度、阿里、华为这类构筑通用大模型的"高端"玩家不同,知乎、小红书、快手等则选择了另辟蹊径。而作为内容问答、短图文、短视频等主流内容方式的代表,知乎、小红书、快手那些小大鳄们对大模型的探求,自然也就成为了外界关注的重点。
竞逐大模型
大模型无疑是去年最热的风口,国内企业早就陆续宣布对大模型展开探求,而不管是投资还是自建,已经开始进场分羹的不在少数,知乎、小红书、快手自然也不会错过这班"列车"。众所周知,互联网大厂对大模型展开研制及相关布局,是高度符合其产业互联网战略的,而相比之下,知乎、小红书、快手这三个平台的进场,虽是意料之外,却也仍然在情理之中。
一方面,AI技术日渐普及,玩家们充分受惠于人工智能技术浪潮,自然不想错过这个时代的变迁。AI技术的发展将会带来产业的进步和新机遇的诞生,而伴随着人工智能技术不断取得突破,AI大模型也呈现蓬勃发展态势。AI大模型浪潮风靡全球,只有先上牌桌,才能捉住规则这张"王牌",因此,知乎、小红书、快手等玩家挺进大模型就显得刻不容缓了。
另外,对于那些玩家来说,一旦别家的大模型落地,或会对其构成一定的恐吓,而为了防范风险,入局就显得顺理成章了。进入AIGC时代,基于深度学习的大模型将极大提高内容生产的速率和数目。在此背景下,拥有了"技术优势"的竞争对手很可能会迅速突破知乎、小红书、快手的护城河,因此,布局大模型就弄成了那些小大鳄们保持竞争力的一种形式。
另一方面,在联通互联网红利消散的背景下,选择拥抱大模型,可以让那些玩家的内容显得愈发多样化,有望带来新的增长点。由决策式AI到生成式AI的演化正在将大模型应用推向愈发多样化的场景,知乎、小红书、快手等平台推出大模型产品,则可以增强内容生产的速率和质量,以拓展更多新内容;还可以更好地满足用户的需求,从而吸引更多用户存留。
另外,这些玩家都或多或少地面临着商业化窘境,而借助大模型,有望助其更好地实现商业化。一直以来,小红书都困于"站内拔草,站外种草",商业化闭环难重构;知乎和快手也分别由于难抵广告收入下降和营业成本昂贵,以及陷入直播电商竞争,而长期处于巨亏之中。而其对AI大模型的训练,能给内容社区带来一波红利,从而反哺业务下降以及商业化加速。
从以上角度来看,布局大模型,似乎早已成为了知乎、小红书、快手等冷门玩家不得不打的一场仗。只不过,由于每家的商业逻辑和入场角度不同,每家在大模型上的优势和表现也是不尽相同。而凭着着自身在AI技术和内容上的积累,这些平台们也开始在大模型领域各显神通。
知乎快人一步
作为国外领先的问答社区及原创内容平台,知乎早就将大模型能力应用到了平台中。据悉,4月,知乎发布了大语言模型"知海图AI",并公测首个站内大模型应用功能"热榜摘要";随后,又发布了一款大模型智能应用功能"搜索聚合"。得益于此,知乎已然成为国外首批具备大语言模型能力的公司,而知乎之所以能加入生成式AI的战局,自然是具备了一些特色和优势。
一是,知乎大规模、高质量的英文数据池是训练大模型的良好素材,将大幅度提高训练效率。知乎PUGC的营运模式为其积累了海量、优质的数据。据悉,截至2022年第四季度,知乎社区上累计内容达6.5亿条,其中包括5.1亿条问答,就连谷歌NewBing都将其视作英文数据源之一。可见,知乎对于训练大模型类的AI来说,无疑是一个特别优秀的数据库资源。更何况,这些数据从形式上就非常契合大模型输入、输出的训练方法,能有效提高训练效率。
二是,知乎基于问答的讨论场是大模型天然的应用场景,能够快速精准地为用户提供大模型服务。众所周知,知乎是国外最有名的知识问答社区,这些年知乎积累了海量的问答资源,而提供这一资源的用户来自各行各业,拥有不同的知识背景和经验,他们的答案一般会更为专业、详细和科学,可以有效确保内容的准确性和深度。而这也就意味着,知乎大模型可以从多个角度学习和理解问题,并对用户进行更精准的推荐和问答。
三是,知乎与面壁智能的合作,能助其在训练人工智能模型时,获得更专业、更先进的技术支持。由于没有大厂的雄厚实力,知乎这类中厂便开始通过联合研制与战略投资的形式,与国外大模型团队共同开发英文大模型。知乎的合作伙伴——面壁智能是一家专注于大模型研制的企业,其在自然语言处理和机器学习领域拥有深厚的技术积累。与面壁智能的合作,可以为知乎AI大模型的研制提供愈发专业和及时的技术支持。
小红书逐步推动
事实上,除知乎之外,小红书已秘密筹办了"大模型"团队,抢先参与到大模型技术的研制布局中。有消息报导称,小红书在4月渐次上线了一款名为"Trik"的AI创作应用,主打AI书法。
显然,与大厂相比,小红书的资金储备和技术实力都不够雄厚,而鉴于大模型研制须要昂贵的算力、数据以及人力成本,小红书参与大模型研制的机率并不高,更多地可能会聚焦大模型应用环节,围绕平台内用户营运,以及创作者工具提供等方向展开。尽管如此,小红书布局大模型,依旧有着自己的胆气。
一来,小红书多类型数据的内容社区,是大模型绝佳的实践场景。经过多年积累,小红书的社区内容生态中的内容量丰富且多样,据悉,小红书早已成长为一个月活超2亿的UGC内容社区,涵盖了视频、图片、文字、笔记、用户评论等多个类型的数据。而这种数据也将会为自然语言处理、AI辅助内容的生成提供多模态的数据基础和应用场景。
二来,小红书结构化的笔记内容,更方便大模型进行套路的学习和输出。根据小红书在"WILL商业会议2023"上公布数据显示,通过将笔记、用户行为数据结构化,小红书辨识了26万的属性词、600万+的爱称词、700万+的情感描述词。而小红书可拆解、规律化的平台属性,更有利于大模型应用的模仿,从而也就能为平台带来生产效率的提高。
三来,小红书万人千面的推荐系统,有望成为大模型训练的样本。基于大规模的用户行为的形成,小红书团队依据用户的特性去做了愈加个性化的搜索。小红书中的大瀑布流或则内容流,就是系统按照用户行为中的规律,找出了用户感兴趣的内容并推荐给了用户。而针对小红书平台形成的海量数据参数,将有可能会被实时送到模型中去做预估,而且随着样本的不断变化,模型参数也将会不断更新。
快手跃跃欲试
知乎和小红书仍然在积极筹办,快手自然也不能落后。据程一笑介绍,快手目前已成立了大模型研制团队,并依托过去在AIGC算法和大规模语言模型方面的技术积累,按计划推动大模型开发和训练,只是当前模型还处于训练阶段。快手似乎暂时没有对外发布大模型产品,但能看出其对大模型是持积极拥抱心态的。而在快手积极布局背后,自然也有着进军大模型的驱动力。
一方面,快手的视频生成是生成式AI相对缺少的细分领域,有助于产生差异化优势。入局大模型赛道的玩家有很多,但相比较而言,作为国民级短视频应用的快手的探求方向就变得非常与众不同。据了解,快手目前在大模型方面的尝试包括大规模语言模型、多模态预训练大模型、智能创作工具等。除了文本之外,快手还在语音、图像、视频、3D图形等各个模态的内容生成方面均有所尝试。
另一方面,快手短视频平台具有娱乐化属性,能给与大模型一定的试错空间。据目前透漏的消息来看,快手大模型目前主要由两部份功能组成,一种是类似于Midjourney的文生图功能,一种是类似于ChatGPT的对话式AI工具。而虽然快手称"语言描述的精准度不及Midjourney",但相较于极其追求专业化的Midjourney,以UGC为主的快手本身对大模型的要求不会有太高。
作为各行业的代表企业,知乎、小红书、快手争相拥抱大模型,固然有其必要性和优势条件,但AI大模型所伴随的深重危机感也不容忽略。上面所提及各个内容平台的表现,都只是其降低了一些有关大模型的"新功能",其AI大模型产品距离成熟还有很远,实现商业化落地,更是难上加难。
目前来看,国内大中小厂扎堆大模型的现象早已是屡见不鲜,对于参赛的玩家而言,大模型的能力虽是比拼的重点,但具体的场景和落地应用同样关键。而最终谁能在这场"大模型角力"中存活出来,并拔得夺魁,也还须要时间来检验。不过,可以肯定的是,知乎、小红书、快手想要从中突围,还有很长的路要走。