时间:2023-10-28 17:36:24来源:解放日报
至此,数字人主播的赢利逻辑和真人主播已十分不同,使用者大多不太期待直播间产生实际的成交额,而是看重平台露出价值。毕竟在直播平台上争夺流量愈发艰难,增加直播间数量、拉长直播时间或许有机会,数字人能成为不错的帮手。
“千人千面”
面对现在的行业情况,硅基智能首席技术官林会杰有心理准备。2017年,硅基智能推出AI电话机器人,提高人工客服打电话的工作效率。随着应用逐渐成熟,骚扰电话甚至电信诈骗也用上了这项技术。
“无论是电话机器人还是数字人主播,都只是为人服务的一种工具。”林会杰说。最近数字人主播热潮渐退,这是件好事,行业发展像大浪淘沙,核心技术、研发实力遭留下,蹭热点、挣快钱的投机者终将遭淘汰。
数字人主播只是人工智能领域实现商业化应用的一个案例。“技术本身不算新鲜。”林会杰说。2008年,他还在读大学时,便在实验室里尝试人机语音交互,“输入一张照片,合成面部说话时的口型、眼部动作和表情。”2010年前后,实验室研发出一款产品,叫“小黄鸡”,在校园网上线,可以调教它,再让它去跟别人对话。
实验室还研发了一款3D建模的数字人形象,取名“晶晶”,起初是半身模型,后来拓展到全身。通过合作项目,“晶晶”去了企业成为前台接待,能和来访者对话,介绍公司情况,还去过旅游景区,成为导游,承担景点讲解和指路引路的任务。
“人工智能的技术已经出现70多年了,上世纪六七十年代,人们便开始用计算机合成语音、合成图像,只不过技术的精细程度不够,声音机械,面部表情呆滞。”林会杰说。这些年,技术发展明显加速:2007年,siri人机语音交互出现;2016年,“小爱同学”“小度”出现;同年,AlphaGo大战围棋冠军李世石引发全球关注;2019年,机器人翻译能生成有表现力的答案……非常明显,几乎每隔几年便有新的代表性产品诞生。
“现在的技术和十多年前的技术相比,另外加入了深度学习的部分,整体方向上没有太大变化。”林会杰说,技术之外,人工智能正在寻找相应的商业闭环,把人机对话的能力转化为能够对人类社会创造价值的能力,这和技术进步本身同样关键。
硅基智能仍是创业型科技企业的模样——公司研发人员占比70%以上,为了保密,即使在内部系统中也看不到究竟人员名单,连林会杰入职都以半秘密的形式进行;林会杰的办公室布置十分简单,接待来访者的椅子甚至型号不一,两块能写能画的白板占去大部分空间;他和记者约了下午5点的采访,办公桌上摆着一份盒饭,那是他的晚饭。
林会杰仍在推进的工作是数字人的“千人千面”,不仅电商主播,数字人可以扮演各种角色,“适应不同场景,不同年龄,不同性别,不同地域,数字人的形象也应当有差别,比如,新闻播报和知识分享,风格就十分不同。”若要实现,声音克隆的音色要舒适清晰,表达抑扬顿挫,肢体动作和面部表情得真实流畅,声音和画面也需要一致协同,配合自然。
除了丰富场景,还要提高效率。以前制作一个数字人的时间以“月”为单位,后来压缩到“周”,现在是“天”,进一步压缩到几个小时,或者几分钟;以前运营一个数字人需要一台价值百万元的服务器,现在一台普通的电脑,甚至一部手机就可以。
企业都有更大的野心。硅基智能喊出口号,提供1亿个硅基劳动力,让人回归人的价值。童宁和彭瑞已经决定转型,或者说是升级,从以真人形象为主的2D克隆数字人,转变为生产超写实形象的3D动画建模数字人。刚结束不久的杭州亚运会上,开幕式和闭幕式出现的数字人火炬手,便可算在3D数字人之列。“推出3D形象数字人,打造成知名博主,切入元宇宙赛道,短视频或开直播变现,搭一个虚拟直播间,照样卖货。”彭瑞说。