再次在AI视频生成领域掀起了波澜,最新的技术实现了突破,使得专业级创作的门槛大幅度地降低了。
模型性能突破
可灵2.0于动态质量范畴获显著提升,其具备精准模拟物理运动规律之能力,测试表明此模型对头流体情景及烟雾等复杂场景的渲染效果近乎真实,人物动作连贯性相较于前代提高幅度超40% 。
于语义理解这一层面,新模型针对于复杂文本指令的响应准确率可达92%之高。当用户输入 “夕阳下奔跑的金毛犬” 这般包含多要素的描述之际,系统能够自动识别出时间、主体、动作等关键信息,进而生成与之相对应的画面。
多模态编辑创新
一种新推出的功能,名为多模态编辑功能,它支持图像转视频创作,当用户上传了静态图片以后,能够凭借文字描述来添加动态效果,而这项技术把从前的传统视频制作流程从数小时压缩到了分钟级别。
测试者用线条绘制火焰轮廓,该功能还允许用户通过简笔画生成动画视频,绘制后系统自动生成逼真燃烧效果,这种直观创作方式极大降低了动画制作的专业门槛。
行业应用前景
在广告营销这个领域当中,此时早已开始运用AI视频生成这样的技术了。有一个美妆品牌,它使用可灵2.0来制作产品展示视频,在制作成本降低了70%的这种情况下,广告的点击率还提升了25% 。
对于影视创作行业而言,AI技术被运用在了剧本可视化环节,导演能够借助文字描述迅速生成分镜脚本,这把传统情况下需要数周时间的前期准备工作快速缩短到了数天,从而明显提升了制作效率。
市场表现数据
可灵AI的用户规模出现了呈现爆发式增长的情况,在2024年第一季度的时候新增用户达到了500万,其中专业创作者的占比从15%提升到了32%,这表明技术正从尝鲜阶段进入实用阶段。
数据显示用户生成内容,其中电商推广视频占总生成量的45%,此为最主要应用场景,其次教育科普内容占比28%,社交娱乐内容占比27%。
技术对比优势
处于跟国际同类产品相互对比的情形下,可灵2.0于文字相关性进行测试时,胜率显著突出,在输入“透明玻璃杯中的渐变果汁”这个内容之际,可灵能够精准地呈现出材质通透的感觉,与之形成对比的产品却出现了材质失真方面的问题。
画面稳定性开展测试表明,可灵2.0于生成长视频之际,画面闪烁频率相较于Sora下降了60%。尤其是在生成超出60秒的视频的时候,画面连贯性维持得不错,不存在明显的跳帧情况。
未来发展规划
快手打算于2025年把AI技术深度融合到本地生活业务之中,当下在餐饮行业对AI菜单视频生成系统展开了测试,商家上传菜品图片后能够自动生成宣传视频。
聚焦新线城市用户特性,快手着手开发方言语音转视频功能,此功能会支持四川话、河南话等十种方言,助力不擅文字输入的用户借由语音去创作视频内容 。
你于运用AI视频生成工具之际,最为看重的究竟乃是生成速度呢,还是画面质量呀?欢迎于评论区去分享你的观点哟,要是觉着本文存有帮助的话那就请点赞予以支持吧!

