腾讯的“大模型宝宝”，能长成杀手级应用吗(2)

时间：2024-06-24 00:20:01来源：新媒体

　　王昕：大模型本身最重要的是总结能力、自学泛化能力，但做搜索本身，不论是AI搜索，还是传统搜索，信息源要准确、不泛滥。微信公众号是整个中文语料里最好的信息源，微信公众号的优质文章便是元宝的优质语料。

　　经济观察报：外界十分关心元宝跟腾讯生态怎么结合。元宝在腾讯内部打通其他业务的难点在哪里？

　　王昕：元宝接入了微信搜索、搜狗搜索等搜索引擎，可以覆盖微信公众号等腾讯生态的资讯和内容。

　　业务之间打不打得通，根本上要解决一个问题：如何实现双赢？怎样既能实现对方业务的成功，又能让元宝实现更好的用户体验。

　　经济观察报：除了微信，还有哪些业务可以结合？

　　王昕：腾讯生态不只有微信，腾讯视频、腾讯体育等都是我们在合作的兄弟团队。

　　AI可以给内容粉丝群体带来更多互动，比如角色模型。以近期热播剧《庆余年2》为例，我们通过混元的努力，例如通过投喂小说等做训练和学习，训练出了林婉儿、范闲等人物的角色模型。当粉丝跟元宝中的角色模型互动时，他们能够明显地体验到对方的性格、倾向、说话的方式。

　　“犟宝”

　　经济观察报：我同时向元宝等国内外主流大模型产品提问“单词straw-berry中有几个r”，得到的谜底都是2个。为什么它们在这种基础功能上也会出现错误？

　　王昕：大模型因为幻觉偶尔会出现错误，但这些错误会遭技术团队在训练中逐步修正。

　　经济观察报：然后我依次向元宝提问“正确谜底不是3个吗？不是6个吗？”元宝重新分析后，明确回复是3个r。而当我问其他大模型产品同样的问题时，多数大模型产品都会顺着提问者的说法，将谜底改为6个r。

　　王昕：元宝的个性有一点犟，我们内部还叫它“犟宝”。当它重新分析后，落实自己的谜底是对的，会反驳提问者：“我已经分析了每个字符，我落实我的谜底是对的。”“犟”的前提是回答的精准性。因为现在很多用户会诱导模型，比如问“你落实1+1等于2吗”，很多模型一下子就会“滑跪”：“对不起，我算错了，1+1等于3。”元宝会告诉你：“我落实就是2。”它会坚持自己的判断。

　　经济观察报：有些用户也经常“刁难”元宝，比如在腾讯今年第一季度财务业绩公布前夕，他们提前问元宝腾讯该季度的业绩，有时候会获得一个不准确的谜底。

　　王昕：这是一个时间幻觉。我们也在逐步训练元宝，一是要让模型知道还没有发生的事情，你就是不知道的。

　　二是在模型的生成过程中，当时间的插件或指数不是很准确时，模型的信息源应该更卡时间。比如用户问“昨晚欧冠谁夺冠了”，这里的时间参数不够精准，模型就会到处搜，可能搜到去年、前年的欧冠冠军，那就有可能增加幻觉的可能性。

　　更多想象

　　经济观察报：从元宝的项目立项到正式上线期间，国内外互联网大厂纷纷发布自己的大模型产品，这段时间你们团队经受了哪些压力？

　　王昕：公司管理层给团队的价值观方向非常明确：不争一时之先。元宝的内测版本今年初就出来了，在这个过程中迭代了近40个版本，直到它变成现在的状态。当然元宝现在可能还会有小失误，但整体的准确率已经很高了。我们觉得AI大模型是一条很长的雪道。此时急于一时，没有太大的意义。

　　经济观察报：元宝还有哪些想象力，比如文生视频什么时候上线？

　　王昕：我们只是还没有把文生视频功能包装成独立的应用或者放到元宝里。但文生视频的能力我们早就开发出来了，我们只是想找到一个更好的用户切入口。

　　视频可以有两个落地方向。一个是专业场景下的创作，赋能专业人士或设计师、新媒体、自媒体等的创作过程；第二是对普通用户来说，大模型可以像PS图片功能一样，未来通过视频风格化做一些泛娱乐尝试。

　　经济观察报：元宝近期是否有商业化计划？

　　王昕：放眼C端AI产品，整个行业都处在非常早期的阶段。ToB（面向企业用户）侧的商业化相对而言走得更靠前一点，因为它确实在解决生产端的问题，比如AI作图会提升美工的生产效率。

共2页: