时间:2025-01-31 15:20:01来源:新媒体
冯彬说:“虽然目前国内外的AI生图工具还不能直接生成复杂的异兽,但可以大大提高制作效率。比如1条鱼有10个翅膀,每个翅膀花纹都不同,用AI生成各种花纹,再合成到主图中,比一个个手绘节省近一半的时间。”
真实的AIGC创作
冯彬告诉经济观察报,他将这部影片定义为“AI纪录片”,而非“AI短剧”。一方面因为大量的细节都是经过缜密地考据,经得起观众推敲。
AI制作一个场景或一个神兽要生成上百张图片,冯彬再从中选择几张最优的进行手绘处理,然后用AI视频应用使之“动起来”。他的电脑里保存着超过10000张底稿图片以及几千段空镜、奇珍异兽的视频。这一制作体量能排进国内外AI创作者的第一梯队。
另一方面,他认为“剧”对故事情节和人物设定的要求更高,但《山海经》的文本并不适合这一表现形式。全文都是介绍性的文字,没有剧情,往往是从一座山系到另一座山系,以及其中的飞禽走兽、花草树木等,更像“人在画中游”的体验。
在创作《山海经》纪录片之初,冯彬曾考虑过用其他风格呈现,比如传统水墨画、《哪吒闹海》的彩绘风,或者线条感更强烈的二次元风,但最后还是选择了写实风格,他希望能做到类似《恐龙星球》的超写实感,“让观众能真切地感受到那个世界存在,或者至少曾经存在过”。“真实的不像AI做的”“博主在现场拍的吧”是这部纪录片最常见的弹幕。
在故事线的设计上,冯彬完全遵循原文中的顺序,用镜头语言进行自然过渡。
以第一集首幕为例,《山海经·南山一经》开篇的招摇山。首先以空镜展示俯瞰招摇山的全貌,承接招摇山内部特写镜头,展现其“多桂,多金玉”的特点。然后是山上独具特色的“状如韭而青华”的祝余草等植物,以及形似猕猴、直立行走的异兽狌狌。最后过渡到发源于招摇山的丽麂水,向西奔腾汇入大海。
制作这一幕时,冯彬强调了代入感:“就像导游一样,要规划出一条漫游路径,引领着观众游览。”此时创作者对AI生成提示词的控制至关重要,要逐步替换提示词,形成两个场景同时存在、衔接有序的情况。这种创作在前期阶段相当耗时。
例如,视频里先介绍招摇山上的桂树,然后通过一个穿过桂树的镜头来到金玉满堂的山洞里。这时需要推动镜头的表现方式,让观众代入自己正在逐步向前行动。如果是硬性切换或者闪回,会出戏。10秒的镜头要反复打磨至少1个小时。《山海经》纪录片借助AI工具,首集制作只用了8天。但是冯彬告诉经济观察报,实际过程并不如外界想象得那么简单,“完全交给AI是行不通的”。第一集约15分钟的内容包含200—300个镜头,70%的内容都经过手绘重置。大量的素材是在过去2—3年日积月累出来的。
冯彬向经济观察报展示了一部分神兽的初稿,比如“四大凶兽”、精卫、鹿蜀、九尾狐等都是在2023年至2024年初完成。他为奇珍异兽的草图分门别类建立了文件夹,等待着AI工具快速迭代“复活”它们的那一天。
青丘九尾狐设计图(受访者供图)
AI进化快 工作效率快速提升
从2022年起,冯彬开始接触国外AI文生图应用Midjourney,并且成为最早期版本邀请的开发者,从V2版本开始使用。但是那时模型能力有限,只能做出一些草图,无法生成视频。
他从2023年开始构思《山海经》系列,当时Midjourney扩大了模型训练数据,发展到V4和V5版本,能够较好地呈现原画中的构图、色彩关系、明暗色调等元素,也能保证风格统一。前述的初稿大部分是在这时完成。
当时国外也有一些AI生成视频应用,比如Runway和Pika,它们也开启了文生视频和图生视频的序章,但技术不成熟,存在一致性差、时长短、价格贵等问题。
2024年2月,OpenAI的文字生成视频模型——Sora首次面世,但直到12月Sora才正式上线。在近300天的空白期中,国内AI视频工具的爆发为冯彬《山海经》的视频化带来了机会。
据经济观察网不完全统计,2024年,国内外近20个公司发布AI视频产品,包括字节跳动、快手、阿里云、腾讯等大厂,以及Minimax、智谱、爱诗科技与生数科技等大模型初创公司。
在利用这些工具制作了几千个镜头后,他总结出来了一些经验:字节跳动的即梦擅长人物细节动作,快手的可灵擅长大画面、场景空镜和高分辨率,生数科技的Vidu更适合动画等风格化作品……组合起来能达到很好的效果。
图片生成视频这一过程遭众多AI创作者形容为“抽卡”,凭运气获得一个质量过关的素材。随着模型能力不断升级,抽到好素材的概率已经大大提高,尤其是山川湖海等自然景观的空镜素材,几乎都能做到“3—5条内得到想要的画面”。