自去年至今,AI视频生成发展迅速,近期Sora的公布更是一石激起千层浪。随着这种发展,将AI视频生成放进业务工作流,也逐步成为了可能。
目前在网络上比较常见的工具,主打的更多为文生视频,其在创意激发、以及非设计与设计人员沟通中能够起到很好的作用,但是由于其较大的不稳定性和很低的可控性,直接商用的难度很高。相比之下,图生视频能够更可控的进行内容产出,在目前的阶段能够更容易的插入到工作流当中。所以本文的重点会放在图生视频上面,期望本文能够对有这方面需求的个人或团队提供帮助。
Runway
Runway是一款自由度较高的AI视频生成工具,如下图
除了支持添加提示词之外,Runway支持通过笔刷圈定希望产生动态的部分,同时支持设置动态的幅度(分XYZ轴),以及可以通过增加噪声让AI有更多自己发挥的空间。
在不添加任何提示词,不使用笔刷的默认设置下,生成的效果:
当如上方截图设置了笔刷后,生成的效果:
可以看出,AI很好的理解了我把画面中飞舞的美元刷上的目的,不过衣服并没有如我希望的飘起来;同时未做笔刷的部分也加入了小幅的动画效果让整个画面看起来更加自然。
PIKA
Pika的自由度不像Runway这么高,除了提示词之外可调的项目基本只有动幅和帧数而已,生成的效果:
可以看出Pika自己能够抓出画面中可以动态化的点,选择了zoomin的前提下,自己能够对画面人物的头发飘扬做出处理,同时动画基本没有出现类似Runway的bug情况。
Stable Video
Stable Video是近期新开放的能够图生视频的工具,由于该工具对于尺度要求较高,所以更换了一张图片进行生成,效果如下:
可以看出其在空间上的处理效果非常强,甚至接近了近期仅发布了宣传视频的Sora,但是其对人物的处理较为粗糙,更像是对静物的处理。
总结
三款工具各有千秋,Runway自由度更高但是需要尝试多次才能获得可商用的版本;Pika自由度低但是生成效果相对稳定一些;Stable Video空间感很强更加适合静物(例如家装)的处理。
总体来说,这三款工具都已经达到了可商用的AI视频生产水平,目前的主要限制主要还是视频长度较短(4秒左右)和动幅较小。不过按照目前的发展速度来看,AI视频生成的能力依然会有持续性的大幅提升,这些问题的解决应该也只是时间问题。