2月16日凌晨,OpenAI 推出了一项惊艳的人工智能技术Sora。该技术可以根据用户的文字描述,生成逼真的视频,为创意产业和视频制作领域带来了无限可能。从演示效果看,Sora 的表现非常出色。
Sora 凭借其卓越的能力,只需根据用户的文字描述,即可快速生成长达 60 秒的视频。这些视频中,场景细腻精致、角色表情栩栩如生,镜头运动也极为复杂。这无疑使视频制作变得更为高效、便捷,不禁让人们对文生视频的未来充满了期待。
目前Sora还没有开放使用。AIGC最本质的问题:算力资源一直没有有效解决。在GPT4.0文字生成都存在使用频率限制的情况下,将高质量文生视频的能力赋予千万级别以上的用户,这一目标在当前算力资源有限的情况下显得遥不可及。目前,我们的计算能力还无法满足大规模生成高质量视频的需求,因此,实现这一愿景需要我们进一步突破技术瓶颈,提升算力水平。
商业宣传是有目的性的,大胆猜测,openAI通过Sora的发布,目的是为了说服资本投钱。归根结底,技术上的进步,已经树立了信心,剩下的就是钱的事情了。
我对文生视频充满了浓厚的兴趣,坚信在未来的算力资源得到有效解决后,每个人都能释放出自己的想象力,创造出独特的视频画面。这一愿景预示着AI技术将惠及千家万户,这是一个非常美好的未来憧憬。
当然,也有人借此吹嘘文生视频在未来会颠覆电影产业、视频产业等等,其实没必要杞人忧天,但凡对电影产业稍微有点常识,都没必要焦虑。电影产业本质上是创意主导的产业。AIGC高级人工智能,从用户体验上来说,总结为:一流的逻辑,二流的内容,三流的文采。你问他问题,回答更加简明流畅,概括性极强,然后它能够抓住问题的要点。如果你就某个细节追问的话,它也能对答如流,所以它的上下文理解能力,已经和自然人是不相上下,但是在创意型问题上,其内容表达以及想象力空间,是不尽如人意的。
本质上分析,我们回归三个世界理论。第一个世界是我们接触到的物理世界,五官能够感知的。第二世界,人的心理世界,这个心理世界包括思想、意识、情感、主观体验,第二世界是一定和人的主体性是不能分离的。第三世界,第三世界是一个抽象的世界,这个抽象的世界,各种符号系统,就是今天世界上已经存在的各种知识、语言、逻辑,这个知识是独立于人的,它具有另外一种知识的客观性,全世界所有人能理解。AI所拥有的知识是第三世界的知识,它对第三世界的理解掌握,现在已经远远超过人类了。但是它对第一世界的直观感受和第二世界的心理活动。
所以AI再怎么强,它只有理性,它就是一个超级大学霸,但是它缺乏我们人类所具有的直觉、悟性、想象力。