具备掀桌子实力的玩家下场了。字节跳动正式宣告进军AI视频生成。
日前,旗下火山引擎一举发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。而字节版Sora的主要特点,是能实现自然连贯的多拍动作与多主体复杂交互。做到这点并不容易。
从策略上看,火山引擎的思路是,先在ToC打磨产品,模型能力具备竞争优势后开始拓展ToB市场。我们注意到,豆包视频生成模型的早期版本早在今年2月就在即梦(Dreamina)上应用,并且持续迭代优化。这次官宣,说明火山引擎做好了十足的把握。
从产品上看,字节版Sora也打出差异化,此前视频生成模型大多只能完成简单指令,豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包视频生成模型时发现,其生成的视频不仅能够遵循复杂指令,让不同人物完成多个动作指令的互动,人物样貌、服装细节甚至头饰在不同运镜下也保持一致,接近实拍效果。
页码:下一页