AI大战进入实体化阶段谷歌刚发布的PaLM-E模型有哪些亮点？

时间：2023-03-09 12:21:01来源：互联网

　　过去几个月里，由ChatGPT引发的AI热潮向人类展现了通用语言模型的生产力前景。就在聊天机器人逐渐变成生产力工具之时，利用通用语言模型驱动真正的机器人也已经提上日程。

　　本周老牌AI大厂谷歌与柏林工业大学的研究人员联合发布PaLM-E视觉语言模型，通过同时处理图像和语言文本，解锁人类与机器人交互的新篇章。

(预印本论文，来源：谷歌、柏林工业大学)

　　顾名思义，PaLM-E模型源自于谷歌的大型语言模型PaLM，E指的就是具象化(Embodied)。通过将通用语言模型与视觉转换模型ViT相结合，PaLM-E成功实现让AI同时具备“理解文字”和“读懂图片”的能力，不仅能够输出文字，还能输出指令使得机器人的智能化跃上一个新的台阶。

　　研究人员介绍称，PaLM和ViT的结合，使得PaLM-E的参数量最高可达5620亿组，也是全球已知的最大视觉语言模型。

　　回归到资本市场最关心的问题，这个听上去很厉害的AI模型，到底能干什么事情呢？对此研究人员也给出一系列案例，帮助外界理解这个模型的妙处。

AI大战进入实体化阶段谷歌刚发布的PaLM-E模型有哪些亮点？

(PaLM-E模型的案例，来源：谷歌、柏林工业大学)

　　首先，融易新媒体，具备视觉属性的AI模型将拥有解读图片并进行思维推理的能力。例如可以通过一张禁行交通标志(除自行车外)的图片，来解答“我能否在这条马路上骑自行车”；通过OCR识别餐馆的手写菜单，能进行账单的计算；或是通过识别一系列烘焙材料的照片，向机器人传达“制作蛋糕胚”的流程。

　　此外，在AI模型与机器人结合的实验演示中，机器人得到“从抽屉里拿出米饼”的指令后，能够顺利地从十多个开放式抽屉中找到米饼，拿给研究人员。

AI大战进入实体化阶段谷歌刚发布的PaLM-E模型有哪些亮点？

(来源：谷歌、柏林工业大学)

　　在后续的实验中，研究人员还要求机器人完成“将所有色块按颜色堆放到不同角落”的指令，以及将“绿色色块推到乌龟旁边”的指令，即便机器人之前没有见过这只乌龟摆件，也能顺利地完成任务。

AI大战进入实体化阶段谷歌刚发布的PaLM-E模型有哪些亮点？

(来源：谷歌、柏林工业大学)

　　虽然从演示视频中来看，受限于演示机器人较为简单的设计，执行指令的时候仍显得“笨手笨脚”。但随着PaLM-E模型赋予机器思考如何执行人类指令的能力，工业应用和工业设计上的突破也指日可待。或许在不久的将来，就会出现一款风靡全球的智能机器人硬件。

　　值得一提的是，作为AI大战的老对手，微软也已经在“图像语言模型”的路数上有所布局。在今年2月底发表的研究中，微软就展现了如何使用ChatGPT为大疆Tello无人机编写“找饮料”程序的案例。

AI大战进入实体化阶段谷歌刚发布的PaLM-E模型有哪些亮点？

相关文章

AI大战进入实体化阶段谷歌刚发布的PaLM-E模型有哪些亮点？
过去几个月里，由ChatGPT引发的AI热潮向人类展现了通用语言模型的生产力前景。就在聊天机器人逐渐变成生产力工具之时，利用通用语言模型驱动真正的机...: “前连板王”再创新高！军工赛道持续升温国企重组概念发酵全国政协委员、中联资产评估集团董事长范树奎：提升估值定价全国政协委员、证监会市场二部一级巡视员刘云峰：提升网络非 5620亿参数！谷歌发布史上最大“通才”AI模型可让机器人更自主 不畏浮云遮望眼，军工长宜放眼量

近期热点

最新消息：央视将播中美合拍《变形金刚：哪吒》？网友求不毁 05-04

北京自行车专用路启用首日上班族专程测试通勤时间 06-01

最新消息：三名韩国男子从美国走私千株多肉或面临10年刑期 06-03

醉酒男子“不服”狗叫持刀狂砍大门结果悲剧了 06-08

融易媒体：长春矿震致9死10伤相关部门：事故中未发生爆炸 06-10

热门文章

AI大战进入实体化阶段 谷歌刚发布的PaLM-E模型有哪些亮点？