爱收集资源网

AI助力,快手短视频平台引爆大模型之战!

网络整理 2023-09-20 09:09

短视频平台的大模型之战早已打响?

快手的AI大模型落地应用,就这样渐次开始了。

8月18日晚,快手公布了基于自研大语言模型应用的最新进展——「快手AI对话」功能早已在快手APP安卓版开放了公测。

不须要demo网站,也不用独立的分类,快手这项新功能直接放到了安卓的即将版APP上。这个搜索框门口的AI对话按键,获得测试资格的用户点击即可步入。

「快手AI对话」是短视频直播行业首个基于大语言模型的类ChatGPT落地产品。我们期盼已久了,它体验怎样呢?

第一时间评测

机器之心第一时间获得了公测资格,让我们瞧瞧快手的大模型产品处于哪些水平。

每家的大模型都各有特征,先让它介绍下自己的能力,好判定一下该从哪开始聊起。

它说自己能回答「任何问题」,也可以提供建议,进行说明,其实也可以和你闲聊,看上去是有点革新搜索引擎的意思。那就先问它一个让人头痛的问题:

除了有回答,令人惊喜加意外的是,它能够推荐快手上相关的视频,看上去用AI找资源会很便捷。

搜索更多的概念,我们发觉它除了可以和人持续聊天对话,也可以在给出回答时附送引用内容的链接,做到有理有据。假如查询个天气哪些的,都会直接显示个天气预报的卡片。

从快手那儿得到的消息是,这些卡片方式的工具就会越来越多。

从这儿,我们也能看出快手对大模型技术落地应用的思索:充分发挥自身优势。聪明的智能可以借助站内丰富的内容生态,通过互动对话的方式帮你快速查找短视频、达人、百科等内容。这是一种全新的信息获取形态。

同时,快手AI对话也为快手搜索打破了站内内容的壁垒,可为用户提供全网内容的检索服务。你的下一个搜索引擎,又不必是搜索引擎。

快手上热门可维持多久_快手长期上不了热门_快手热门最长多久

值得一提的是,在我们测试时,快手AI回答每位问题的响应速率都是很快的。已知单A100在高度量化(用llama.cpp)的条件下推理Llama的速率是每秒30个词,莫非我如今正在用的是一块英伟达A100?可以未经预告直接在应用里上线,想必工程师们早已做了不少优化。

接出来,国外的大模型都说自己的英文语义理解水平有优势,我们让它来做一道去年的中考英语题:

回答无误,再试试数学题:

理科题目也能做对,可见快手AI是读过不少书的。

作为一款大语言模型快手长期上不了热门,文案创作水平必需要高。大多数公司发布的大模型都可以快速生成内容丰富的文章、建议和回复,但好多生成的文字只是看似可以用,实则经不起推敲。对于一些特定的任务,或是须要深入理解语境,符合人类情感的问题来说,有时侯AI会输出一些奇怪的结果。

在快手上我们总会遇到各路高手,但大多数人都是菜鸟,能不能借助AI的帮助快速涨粉呢?值得尝试一下。近来大热的话题是笔记本装机,我想干翻奸商,开个装机店:

快手大模型给出了长长的建议,从确立定位、了解行情到培训职工、制定营销策略……数了数一共有八条。从前人实践来看,在做这些大事时很有可能忽视个别细节,AI助手的思维是愈发周密的,给人一种靠得住的觉得。

我们继续和它聊,在看完快手建议选好店面名子以后,怎样拍摄一个视频宣传我的店面呢?

看起来内容中规中矩,其实并没有快手老铁别具一格的思路,不过要给什么镜头都说得很清楚。

既然你说话那么严谨,那考考你逻辑问题吧:

智障吧里出现的问题,在这儿根本难不倒它,不过是否精彩是回答的艺术。

那崩铁里拿来对付民科的教育部困局又该怎么呢?

快手热门最长多久_快手上热门可维持多久_快手长期上不了热门

其实没有做对,但我们晓得这题的答案并不是三个选项里的任何一个(在游戏里后续对话会出现正确选项162),AI给出的答案算比较接近了。

近来,开源的Llama2正在改变大模型领域的格局,有了一个媲美初期GPT的开源产品,诸多公司会朝什么方面进一步探求?

在技术和落地上都还有好多要做的事,卷是一定的,机会其实也好多。

快手大模型,有备而至

大模型是现在诸多科技公司竞争的重要赛道,在这方面,快手早有打算。

去年5月一季度的业绩电话会上,快手科技创始人兼CEO程一笑曾透漏,公司早已成立了大模型研制团队,依托过去在AIGC算法和大语言模型方面的技术积累,正在按计划推动大模型开发和训练,各项进展顺利。

事实上,已有消息表明快手在大模型落地方面进展迅速。

据透漏,和目前好多科技公司展示的大模型demo相比,「快手AI对话」利用对内部资源的高效索引,部份解决了大语言模型的幻觉问题,提高了问答的确切性,另一方面也很早就在多个应用场景开始了产品和功能的探求。

在7月8日,快手宣布正在公测智能问答产品,计划在搜索场景中为用户带来智能问答和文本创作等新功能,此后在8月8日开启「快手AI对话」内测。以搜索场景为入口,我们获得了愈加方便的搜索形态,新技术带来的便利覆盖也更广泛。

明天中午,这种产品功能背后的快手大模型总算浮出水面。有媒体报导称,来自快手AI团队的自研大模型——「快意」(KwaiYii)已开启公测,并为业务团队提供了标准API和多样化项目合作方案。该大模型甫一出世便在多个著名大模型排名榜上均高踞前列,在最新的CMMLU英文向排行中更是跃居首位。

依照其GitHub主页介绍,「快意」是由快手AI团队从零到一独立研制的大规模语言模型,而本次引起关注的正是其新版本KwaiYii-13B。该模型在多个Benchmark上都处于领先水平,证明了其在自然语言处理任务中的出众性能。

其中,KwaiYi-13B-Base预训练模型具备优异的通用技术基座能力,在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平,显示了快意大模型在英文和法文上都具备特别强大的能力。

而KwaiYii-13B-Chat对话模型具备出众的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编撰、多轮对话等广泛任务,人工评估结果表明KwaiYi-13B-Chat超过主流的开源模型,并在内容创作、信息咨询和物理解题上接近ChatGPT(3.5)同等水平。

更值得期盼的是,机器之心了解到,快手AI团队将持续迭代「快意」大模型快手长期上不了热门,一方面将继续优化模型性能并研制多模态能力,另一方面也在推动更多C端与B端业务场景下的落地。

从生产力工具、手机OS到短视频直播平台,国外大模型只花几个月就快速覆盖了各类平台,背后的技术也越来越靠谱。转型到了这一步,量变已在形成质变。

大模型的到来,正让我们步入一个全新的世界。

快手长期上不了热门