时间:2023-03-18 16:13:01来源:互联网
一阙《青玉案·元夕》,辛弃疾用时间制造了顺理成章的浪漫。八百多年后,由词化名的科技公司百度,用大语言模型开启了“生成式AI”时代。通过文心一言,“众里寻他”只需要几秒钟的时间。
3月16日,百度召开新闻发布会。从百度创始人、董事长兼首席执行官李彦宏现场演示的demo效果上看,文心一言具备文学创作、商业文案创作、数理推算等大语言模型较常见的优势和能力,还在中文理解、多模态生成能力上更具特色。
不过,文心一言、ChatGPT背后的技术逻辑,与通过海量无标注数据训练的大模型之间差异鲜明,即需要人的参与。整体而言,这类大语言模型还未到发展完善的阶段,部分场景足够惊艳,但一些场景下也有bug出现,存在很大进步空间。
人类向往科技,是期待它更好地理解人类意图,生成符合人类价值观、表达习惯的回复。这一点上,唯有真实的体验才能带给用户惊喜。从技术发展趋势上,大语言模型和生成式AI成为新的技术范式已毋庸置疑,百度方面透露,已有超650家合作伙伴宣布加入生态,如李彦宏所说,AI的长期价值,对千行百业的颠覆性改变,才刚刚开始。
“十年分娩,一朝怀胎”
今起开放首批测试
ChatGPT出现后,一向走在创新路上的百度立刻官宣了对标产品文心一言。看似突然,但李彦宏介绍,百度在过去十几年间一直在AI研发上持续投入,文心大模型的第一个版本在2019年就发布了,此后每一年都要发布一个新的版本。
最新的版本在新闻发布会现场亮相,李彦宏与文心一言在5个场景展开了问答互动。
在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。面对《三体》电视剧演员于和伟和张鲁一“有哪些共同点”“谁更高”这类问题,文心一言也基于推理能力得出了准确答案。
除了文学创作,商业文案也是用户使用较为广泛的场景。在这一创作场景中,李彦宏对文心一言下达了“如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起个什么公司名”“数智云图这个名称不错,给我起一个公司的服务Slogan,表达共赢的概念”“帮我生成一篇公司成立的新闻稿,数智云图以共赢的服务理念用大模型服务中小企业数字化升级,字数600字”等指令。
搜索业务的基因是文心一言的基石。
李彦宏介绍,文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,及5500亿事实的知识图谱,是数据规模发生的“智能涌现”。而在百度搜索中,问答和生成类的搜索请求占比极高,因此文心一言在自然语言问答和创意内容的生成上有相对突出的表现。
值得关注的是,过去的几个月,让AI自行展开创作,“一本正经地胡说八道”是用户最头疼的问题。在这方面,文心一言表现如何?根据李彦宏的介绍,为减少错误率,百度对文心一言做了知识增强和检索增强,大幅度提升了事实性问题的准确率。
此外,李彦宏介绍,文心一言具备一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
不过,李彦宏也直言,现阶段文心一言的准确率还不是100%,需要更多的时间学习和成长。