时间:2024-05-15 00:15:04来源:科技日报
数字孪生可以遭形象地理解为“画皮”,即通过对形象、声音的克隆,实现人类肉体的数字映射。这是最基础的一步,目前的技术水平已经能让数字人惟妙惟肖。前不久,刘强东的数字形象“采销东哥”就令网友们直呼“太逼真了”。视频中,“采销东哥”不仅还原了本人的口音和口头禅,连细微的小动作也模仿得十分到位,让人一时难以分清这具体是真人还是数字人。
数字原生是更高级的阶段,也谓“画骨”。这个阶段意味着数字人能够一定程度上模仿人类的知识体系,实现两者之间的对话,目前已经有很多成功案例。360公司创始人周鸿祎就拥有一个可以与人类正常对话的数字分身。大模型通过对周鸿祎相关书籍、讲话稿、开会记录、采访等大量资料的学习训练,实现了对本人思想、逻辑的部分模仿。
无论是“画皮”还是“画骨”,多位业内人士提到,数据量对模仿效果起着关键作用。“给大模型投喂的资料越多,数字人就越像本人。这如同写一本人物传记,作者对人物跟踪、观察的时间越长,传记就越真实地贴近本人。”司马华鹏说,他接触的客户中,有少数人以提供人物自传的方式去“投喂”大模型,更多的是通过回答问题的方式,来丰富人物经历。
“他出生在哪里?在哪里上学?在哪里打拼?在哪里落地生根?”孙凯向记者介绍了几个常规问题。他透露,想要数字人更贴近本人,至少需要回答上百个问题。如果要进一步实现对人思维的模拟,必须依赖大量的数据。
正所谓“巧妇难为无米之炊”,目前克隆数字人最缺的就是数据。张泽伟是南京一家数字人创业团队——超级头脑工作室的创始人。作为数字永生派,他不仅给自己制作了数字人,而且已经开始有意识地为自己留存资料。“我会隔三岔五把自己的一些资料‘投喂’给机器,希望能够通过这种方式,给后代留下一些记忆和思想。”
为获取更多数据,有业内人士提出用“人生记录仪”的硬件设备来记录个人生活资料,提供给大模型进行训练。但张泽伟认为这种方式并不现实:“一方面很多人不愿意上传自己生活的各类细节。另一方面,如果一个人时刻带着记录仪,很可能对人们的正常社交造成障碍。”
实际上,数据的采集与使用是一把双刃剑。“数据不仅关乎克隆效果,目前数字人面临的主要法律问题,也是因不当获取、使用数据造成的。如未经同意使用他人数据克隆数字人,就会侵犯他人的肖像权、隐私权。”北京交通大学法学院副院长郑飞指出,虽然自然人死后不再享有作为民事权利的肖像权,但是这不代表其肖像可以遭任意使用。根据民法典第九百九十四条,死者的肖像、隐私受到侵害的,其配偶、子女、父母有权依法请求行为人承担民事责任。
此外,根据个人信息保护法相关规定,处理敏感个人信息应当取得个人的单独同意。2023年1月10日起施行的《互联网信息服务深度合成管理规定》中也提到,深度合成服务提供者和技术支持者提供人脸、人声等生物识别信息编辑功能的,应当提示深度合成服务使用者依法告知遭编辑的个人,并取得其单独同意。
“因此,融易新媒体消息,在‘复活’逝者的情形中,理应取得对死者肖像权负有保护义务的近亲属同意。”郑飞提醒。
数字永生面临技术、伦理双瓶颈
电影《流浪地球2》中,这样一幕令人记忆深刻:图恒宇把女儿的意识上传到超强计算机,出现了拥有自我意识的数字图丫丫。这一情节体现了克隆数字人技术的终极阶段——数字永生。
如果说克隆数字人技术的前两阶段,只停留在对人的外在复制和思维的模仿上,那么第三阶段的数字永生可谓是“触及心灵”。
司马华鹏介绍,数字永生可以理解为利用AI技术,将人类的形象、声音、思想用数字化形式保留下来,让人类生命以数字化形式存在。“画心”二字表达了其内涵,即可以达到对于思想的完整复制,全方位进化成为具备情感人格、思维模式、语言习惯、知识体系,可交流对话的智能体。相比于克隆外在的音容笑貌,数字永生更强调数字人自我意识和自我涌现能力,也更接近生命的真正意义。
采访中,多位从业者认为,要实现科幻场景中的数字永生,还有很长一段路要走。
北京大学哲学系教授周程指出,从技术层面看,数字永生的挑战在于把人类意识精确地复制或转移到数字平台上。这至少包含两道程序,一是理解复杂的人脑结构,二是把这种结构以数据形式存储和再现。“即便实现以上技术,也不意味着可以成功复制出人类意识,因为意识的本质及其与大脑物理结构之间的联系仍是科学界的未解之谜。”周程说。