时间:2024-02-20 21:39:25来源:新媒体
Sora概念股引爆AI行情,引领龙年首日“开门红”!
2月19日,Sora概念股掀起涨停潮。该AI视频模型系日前OpenAI发布的“核弹级”产品,文生视频60秒一镜到底,效果堪称“炸裂”!中证君收集了多个市场最关心的问题,让我们一起看看机构和业内人士如何剖析Sora。
Sora到底是什么?
2月16日,OpenAI发布文生视频模型Sora。它能够根据用户输入的提示词、文本指令或静态图像,生成长达一分钟的视频,其中既能实现多角度镜头的自然切换,还包含复杂的场景和生动的角色表情,且故事的逻辑性和连贯性极佳。
OpenAI一共展示了48个文本生成的视频。如:
文本提示:一位时尚的女人走在东京的街道上,街道上到处都是温暖的发光霓虹灯和动画城市标志。她身穿黑色皮夹克,红色长裙,黑色靴子,背着一个黑色钱包。她戴着墨镜,涂着红色口红。她自信而随意地走路。街道潮湿而反光,营造出五颜六色的灯光的镜面效果。许多行人四处走动。
OpenAI视频截图
工银瑞信:AI视频生成的难点在于,一方面视频是连续的多帧图像,并且要有逻辑性,并非简单的图片组合;另一方面是带来模型复杂度提升、计算难度和成本的提升。此外,文生视频需要大量的“文本-视频”配对数据,而目前缺乏多样化的数据集,且数据标注的工作量较大。因而此前视频大多为5-15秒,而Sora将视频时长提升至1分钟,支持生成多个镜头,同时基本维持了角色和视觉风格的一致性,并能在确定程度上“理解”现实世界。
国泰君安:Sora具有三大突出亮点:一是60秒长视频,可以保持视频主体与背景的高度流畅性与稳定性;二是在一个视频内实现多角度镜头,分镜切换符合逻辑且十分流畅;三是理解真实世界的能力,对于光影反射、运动方式、镜头移动等细节处理得十分优秀,极大地提升了真实感。
Sora发明者之一是天才少年谢赛宁?
2月19日,针对有自媒体称Sora发明者之一是毕业于上海交大的天才少年谢赛宁,谢赛宁本人通过朋友圈对此进行否认称,一点关系都没有,是该自媒体标题党AI写稿,胡乱挂钩,误导事实。
OpenAI官网披露的Sora技术团队信息显示,Sora团队由Peebles等3人领导,核心成员包括12人,其中有多位华人。不过谢赛宁不在名单中。
Sora的技术思路与其他产品有何不同?
工银瑞信:技术角度来看,Sora采用了“扩散+Transformer”的视频生成大模型技术路线,可谓有了里程碑式的技术进步。相比以往使用的同为扩散模型的U-Net,Transformer架构的参数可拓展性强,即参数量增加,性能加速提升,同时支持任意分辨率、长宽比、时长的视频训练数据,融易新媒体消息,不会因为压缩导致训练数据质量下降。此外,Sora训练了能在时间和空间上压缩视频的自编码器,这也是其能够大幅提升生成视频时长的原因。
360集团创始人周鸿祎:Sora的技术思路完全不一样。之前做视频做图用的都是Diffusion,是多个真实图片的组合。这次OpenAI利用其大语言模型优势,把LLM和Diffusion结合起来训练,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出2D的范围模拟真实的物理世界。
Sora有何商业价值?
安爵资产董事长刘岩:Sora模型的出现预示着行业变革的来临。在内容创作与媒体领域,它将彻底改变视频制作的传统方式,助力创作者以更高效、更低成本的方式创作出高质量视频,从而推动整个行业的工作效率提升。对于广告、电影预告片和短视频等行业,Sora模型更是可能带来颠覆性的创新。同时其在模拟世界方面的能力为虚拟现实、游戏开发等领域开辟了巨大的潜力空间。
工银瑞信:商业角度来看,从“idea或IP→内容生产→内容分发”的产业链,长期预计视频生产的成本将大幅降低。目前AI生成视频的水平还有待提升,可能更适合做对视频质量要求低的互联网广告素材,如游戏买量素材等。由于Sora基本处于闭源状态,技术细节并未公布,相比于GPT有较多开源模型而言,国内视频生成模型方面尚有差距,利好有idea但落地较慢的动画电影公司、IP公司,以及能够降本增效的游戏行业。