时间:2024-03-11 06:40:01来源:新媒体
最近人工智能领域最火的,无疑就是OpenAI的AI视频生成模型SORA。以前的AI生成视频非常短,基本不能用,但现在Sora可以生成一分钟的视频,融易新媒体消息,且相似度非常高。可以看出,在这个领域的发展速度增长提升,人工智能正在各个角落不断突破边界,显示出强大的自我迭代和延伸的能力。
Sora是源于日文“空”,有天空之意,以示其无限的创造潜力。无论它是凭空想象,还是暗示万事万物的实相都是一个“空”,眼下能看出的就是它在理解真实世界场景并与之互动的能力方面实现飞跃。它显示了视觉算法近年来的在泛化性、可提示性、生成质量和稳定性等方面均出现了突破,再不是完全的懵懂探索期了。
所以我们不能忽视了Sora等模型的创新性,它作为人工智能中的一个分支视觉智能,对于处理我们大量的直观信息是非常有用的。比如用在自动驾驶上。我们开车基本上就是一个纯视觉与环境的交互过程。只要能够识别道路、标识、车辆、行人、障碍物,并产生避障或超越的行为,就能很好的完成驾驶任务。因此激光雷达反而就显得成了一种冗余的存在。在纯视觉上的大量训练,就会导致机器更加聪明的预判和决策。
当然,AI走出懵懂期,却还是没有到人类的童年期,业界形容目前的Sora的水平相当于动物智能的级别。因为要理解复杂的世界需要充分的理性知识,这方面,仅仅靠感性和感官经验的动物性是不足够的。比如现在的大模型训机制,就是靠大量的数据输入进行训练,最终形成了智能反应,但是它未必是理性的,得出的结果可能还是荒谬的。比如会有各种不符合物理规律的地方。
不过,考虑到Sora在视频预演、基础剪辑、对已有成品二次加工等方面都有突出的贡献,因此确实能极大的提供生产效率。这个提高会让传统上很多岗位因此可以消失,也会让有本身具备创新能力和审美训练的人获得更好的工具,贡献更精彩的产品。
考虑到公众的短视频阅读已经成为认知世界的主流方式。谁能更快的生成视频,谁就能占据更强有力的话语权。这种速度甚至已经到了以分钟为计的程度,按照传统人力根本无法胜任,甚至做一个短片都可能会把整个机构拖进成本陷阱。但是有了机器生成却能加快提升速度,且不用多雇佣的情况下,让制作成本越来越低。至少关于版权的争议,也会更加的突出,因为文字智慧还有归属的模糊性,那么视频取材可能会带来更加直接的版权证据。那么对Sora的“融合创新”能力要求也就更强了。