时间:2024-06-24 00:20:01来源:新媒体
王昕:大模型本身最重要的是总结能力、自学泛化能力,但做搜索本身,不论是AI搜索,还是传统搜索,信息源要准确、不泛滥。微信公众号是整个中文语料里最好的信息源,微信公众号的优质文章便是元宝的优质语料。
经济观察报:外界十分关心元宝跟腾讯生态怎么结合。元宝在腾讯内部打通其他业务的难点在哪里?
王昕:元宝接入了微信搜索、搜狗搜索等搜索引擎,可以覆盖微信公众号等腾讯生态的资讯和内容。
业务之间打不打得通,根本上要解决一个问题:如何实现双赢?怎样既能实现对方业务的成功,又能让元宝实现更好的用户体验。
经济观察报:除了微信,还有哪些业务可以结合?
王昕:腾讯生态不只有微信,腾讯视频、腾讯体育等都是我们在合作的兄弟团队。
AI可以给内容粉丝群体带来更多互动,比如角色模型。以近期热播剧《庆余年2》为例,我们通过混元的努力,例如通过投喂小说等做训练和学习,训练出了林婉儿、范闲等人物的角色模型。当粉丝跟元宝中的角色模型互动时,他们能够明显地体验到对方的性格、倾向、说话的方式。
“犟宝”
经济观察报:我同时向元宝等国内外主流大模型产品提问“单词straw-berry中有几个r”,得到的谜底都是2个。为什么它们在这种基础功能上也会出现错误?
王昕:大模型因为幻觉偶尔会出现错误,但这些错误会遭技术团队在训练中逐步修正。
经济观察报:然后我依次向元宝提问“正确谜底不是3个吗?不是6个吗?”元宝重新分析后,明确回复是3个r。而当我问其他大模型产品同样的问题时,多数大模型产品都会顺着提问者的说法,将谜底改为6个r。
王昕:元宝的个性有一点犟,我们内部还叫它“犟宝”。当它重新分析后,落实自己的谜底是对的,会反驳提问者:“我已经分析了每个字符,我落实我的谜底是对的。”“犟”的前提是回答的精准性。因为现在很多用户会诱导模型,比如问“你落实1+1等于2吗”,很多模型一下子就会“滑跪”:“对不起,我算错了,1+1等于3。”元宝会告诉你:“我落实就是2。”它会坚持自己的判断。
经济观察报:有些用户也经常“刁难”元宝,比如在腾讯今年第一季度财务业绩公布前夕,他们提前问元宝腾讯该季度的业绩,有时候会获得一个不准确的谜底。
王昕:这是一个时间幻觉。我们也在逐步训练元宝,一是要让模型知道还没有发生的事情,你就是不知道的。
二是在模型的生成过程中,当时间的插件或指数不是很准确时,模型的信息源应该更卡时间。比如用户问“昨晚欧冠谁夺冠了”,这里的时间参数不够精准,模型就会到处搜,可能搜到去年、前年的欧冠冠军,那就有可能增加幻觉的可能性。
更多想象
经济观察报:从元宝的项目立项到正式上线期间,国内外互联网大厂纷纷发布自己的大模型产品,这段时间你们团队经受了哪些压力?
王昕:公司管理层给团队的价值观方向非常明确:不争一时之先。元宝的内测版本今年初就出来了,在这个过程中迭代了近40个版本,直到它变成现在的状态。当然元宝现在可能还会有小失误,但整体的准确率已经很高了。我们觉得AI大模型是一条很长的雪道。此时急于一时,没有太大的意义。
经济观察报:元宝还有哪些想象力,比如文生视频什么时候上线?
王昕:我们只是还没有把文生视频功能包装成独立的应用或者放到元宝里。但文生视频的能力我们早就开发出来了,我们只是想找到一个更好的用户切入口。
视频可以有两个落地方向。一个是专业场景下的创作,赋能专业人士或设计师、新媒体、自媒体等的创作过程;第二是对普通用户来说,大模型可以像PS图片功能一样,未来通过视频风格化做一些泛娱乐尝试。
经济观察报:元宝近期是否有商业化计划?
王昕:放眼C端AI产品,整个行业都处在非常早期的阶段。ToB(面向企业用户)侧的商业化相对而言走得更靠前一点,因为它确实在解决生产端的问题,比如AI作图会提升美工的生产效率。