时间:2023-09-09 21:34:25来源:IT新闻网
AI大模型在中国经过了半年的发展,经历了哪些技术的变化?泡沫破灭了吗?什么样的AI应用更有商业前景?我们用提问的方式,围绕国内AI创业者在市场选择、融资策略、商业模式、未来判断等问题,邀请波特公司创始人刘大鸿谈谈观点。
低估了AI的想象空间,高估了AI的能力边界
1. 问:你第一次用AI大模型是什么时候?当时有什么感觉?
刘大鸿:2022年12月。当时很震惊,感觉计算机突破了一个边界。过去,计算机主要用于语言理解,回复的范围也有限。现在大模型似乎能够回答任何问题。我觉得这个技术变革比区块链技术的突破带来的颠覆力更大,一个新时代要开始了!人可以和机器在一个对话窗口展开对话,还可以对接后端的业务,解决人们的某些究竟问题。我当时觉得大模型会取代搜索引擎,现在我觉得不能用搜索引擎或者问答类的产品形态来与之类比。
2. 问:上半年AI经历哪些技术变化?
刘大鸿:上半年,我们一边做应用一边训练自己的AI模型。回头再看大模型技术,我觉得它有更大的想象空间,但也有能力边界。它在解决语言交互、索引、给内容打标签、切换不同语言等方面有优越性,还能把人的意图转换成另外一种指令……大模型已经慢慢融入了我的生活,就像水、电一样,AI也成为我日常生活依赖的“能源”,电厂输出电能,大模型输出智能。
从“人与人对话”到“人与机器对话”,其中有巨大的想象空间,通过给AI赋能,拓展出“人和物”的对话协议,AI的对话接口可以接到电视机、冰箱、机器人,甚至万物皆可接入AI……可是,它也有自身的局限,比如,目前它还是一个语言模型,不是“数学家”或“物理学家”,它不具备解数学题和物理题的能力,多模态尚需要时间来做工程叠加,因此,大模型暂时还没有推理能力。
3. 问:你什么时候决定用大模型技术跟自己的产品做结合?
刘大鸿:2022年5月,我们团队研发过一个AI语音交互人机对话模块,是用第三方技术集成的,不太好用,那半年,我们一直在改进AI的技术准确度和交互。我们当时面临两个难题,一是机器很难理解人的语言和意图,当时市面上还未有能解决这个问题的技术;二是机器无法输出一个像样的答案。然而,大模型来了,我突然感觉,大模型是一个技术上的突破,我们也不需要再做技术自研发,用好大模型的技术能力就行,所以在产品技术战略思考的时候,我们列了一些不做清单(stop doing list),第一条就是不做大模型。
4. 问:你做的产品是如何结合大模型技术应用的?
刘大鸿:我们将产业的需求抽象归纳成一个产品的交互,让AI成为人机交互的接口,通过它可以实现多重事情的交互和处理,让系统能够理解人的意图并提供相应的服务。这种模型可类比为一个魔盒,你告诉它,你需要什么,它会将信息翻译到数字世界,并将结果反馈给你。至于魔盒内部是怎么实现的,用户可能不那么关心。我有时候觉得人类对出现的新技术和新世界,有孩童般的好奇心,我曾看过一个孩子不停地按灯的开关,他按一下,灯亮了,再按一下,灯灭了,孩子很开心,在我看来,这就是人机交互,这个孩子在跟世界交互,现在,开关和灯泡由AI来驱动了。一千年前,点亮世界是魔法,今天AI技术的突破,所有的机器和设备或许都可接入AI接口,人对机器的“操作”变为人和机器之间的对话,万物有灵,机器能按照人的意图完成任务,甚至能读懂人的表情,这是很好玩的事情。
“一花百放”和“百花齐放”
5. 问:上半年,你觉得中国的大模型取得了哪些实质进展?
刘大鸿:目前国内的大模型方向,在技术上有两类,一类是以百度“文心一言”为代表的大模型技术,它在文字和语言模型处理方面取得了非常大的进展。比如,内容的精准度,上下文的关联性等方面,中文语料库比国外大模型的数据更齐全。
第二类是腾讯这类提供大模型基础服务的公司,它们做了非常多向量数据库等基础工具,给开发者们使用。像腾讯这种以产品驱动的公司,一定会推出自己的大模型,我猜,腾讯这类公司将诞生某个“杀手级”的应用。
单纯的大模型未来会成为一种智能云,类似阿里云、华为云、亚马逊云等产品。
6. 问:据你所知,融易新媒体消息,上半年,美国的大模型有哪些实质进展?