字节跳动“即梦AI”上线:能否在视频大模型领域超越快手?

AI资讯8个月前发布 xiaotongyan
9.5K 0

近日,字节跳动旗下的剪映团队推出了一站式AI创作平台——即梦AI移动版,正式上架至苹果应用商店。该应用目前具备文生图和文/图生视频等多种功能,并已推出会员订阅服务。通过与Sora和快手的可灵进行对比测试,《每日经济新闻》记者发现这三款视频生成大模型在捕捉和理解提示词方面表现出色,但在其他方面各有优劣。

即梦AI在人物塑造、内容丰富度和视频流畅度等方面仍存在改进空间。特别是在生成视频时长上,即梦仅支持最多12秒的视频生成,而流畅视频的秒数被认为是评估视频生成大模型能力的重要指标。一名大模型工程师指出,视频的流畅度取决于多个维度,如内容准确性、空间感等。

即梦AI的技术进步

今年初,Sora的出现标志着“视频的ChatGPT时代”的开启。随后,快手推出了可灵,引发了人们对国产AI视频大模型的关注。作为短视频领域的巨头之一,字节跳动也被视为最有潜力超越竞争对手的选手。自3月底开始,即梦AI经历了多次迭代升级,从最初的图片生成、智能画布和视频生成三大功能,逐步扩展至更多功能。

今年7月初,全国首部AIGC生成式连续性叙事科幻短剧集《三星堆:未来启示录》在抖音上线,即梦AI作为首席AI技术支持方参与其中。在此过程中,即梦AI改进了视频生成功能,增加了24fps、30fps、60fps的补帧及二倍超分能力,新增了镜头移动方向和幅度控制等功能。

即梦AI与其他产品的对比

为了评估即梦AI的实际效果,《每日经济新闻》记者使用了OpenAI官方提供的多个Sora视频提示词进行了对比测试。结果显示,三款大模型都能准确理解和捕捉提示词,生成连贯且流畅的视频内容。然而,在人物形象刻画和动作自然度方面,即梦AI的表现稍显逊色。例如,在“东京街头的女士”这一主题下,即梦AI生成的人物在转头时出现了头颈部扭曲的情况,拎包的手部动作也显得不自然。

此外,在元素丰富度方面,Sora的表现更为出色。以“太空人”为主题时,Sora不仅呈现了穿着宇航服的角色,还联想到了飞船和舱外景象等元素,而即梦AI和可灵则仅展示了宇航员本身。

即梦AI的商业化挑战

随着AI视频生成大模型市场的竞争加剧,商业化成为一个重要议题。尽管Sora、寻光、Vimi等平台相继推出,但这些大模型在C端市场的商业化仍面临诸多挑战。一方面,高昂的模型训练与推理成本使得盈利变得困难;另一方面,C端用户的付费意愿较低,导致视频大模型在这一市场的商业化进程较为缓慢。

相比之下,B端市场的前景更为广阔。AI视频大模型可以通过与影视制作、广告创意、媒体内容策划等领域结合,实现复杂工序的自动化处理和智能化内容生产。关键在于这些模型能否有效地融入实际工作流程,从而提高效率并降低成本。

即梦AI的未来发展

即梦AI目前专注于服务UGC(用户生成内容),并与抖音生态系统深度融合。未来,即梦AI将继续优化其技术和功能,致力于为用户提供更优质的体验。虽然在某些技术参数上与竞争对手存在一定差距,但即梦AI更注重应用落地和生态整合能力,力求在短视频领域占据一席之地。

© 版权声明

相关文章

暂无评论

none
暂无评论...