融易新媒体
快捷导航 融易新媒体
主页 > 财经 >

关于AI和大模型 工信部、上海市、商汤科技等重磅发声(2)

时间:2024-03-27 03:19:36来源:互联网

  三是算力是门槛。“你需要非常强大的算力,千卡、万卡都是钱堆出来的。”沈向洋表示,“现在讲的最多的是Scaling Laws(尺度定律)。随着参数的增加,你对算力的需求几乎是平方的关系,随着参数的增加,数据量也在增加。如果干GPT 3.5的话,可能要一万张卡;干GPT 4的话,可能要两万五千张卡;干GPT 4.5的话,可能要五六万张卡;大家弄GPT 5的话,可能要十万张卡。”

  四是AI的社会冲击。它有对民众的冲击、公司的冲击、政府监管的冲击和社会发展的冲击。

  五是智能的本质。虽然通用人工智能蓬勃发展,但大家对智能的本质没有一个清晰认识,深度学习理论非常欠缺。沈向洋表示,“很多人相信尺度定律,但今天的深度学习,理论非常欠缺。从宇宙到量子,物理学有一套大一统的理论统一起来,叫作Theory of Everything。今天深度学习没有这样的理论,所以叫作Theory of Anything。”

  商汤科技:AI模型有知识、推理、执行三大能力层

  “最近大家在讨论一个热词——新质生产力。对于开发者来说,生成式AI是带来生产力工具、生产力突破的最好行业。”徐立表示。徐立带来了商汤科技对于AI 2.0时代的新质生产力工具的理解。

  徐立把作为生产力工具的AI模型分成能力圈的三层。这三层之间互有依赖,但又不完全是相关的。

  第一层是知识层。世界的知识遭灌输到大模型能力中。今天很多生产力工具、代码解决的是知识层的问题。“你提出问题或者你需要它补全,需要它解决一些问题,背后的道理是世界上没有新鲜事,你做过的事情前人做过,所以你可以完成任务。”徐立说。

  第二层是推理(演绎)。有了世界知识之后,从一个起点再往前演进。“你可以通过AI的过程,逐步把这个事实推理出来,给出更多的可能性。知识和演绎构造出来的两层,是作为生产力工具的大模型最重要的两层。”他表示,但从推理层面来说,目前成长还相对有限,这也是后面要集中突破的能力之一。

  第三层是执行,即如何跟这个世界互动、反馈。

  “这三层可以组成一个完备的、对世界提供生产力工具的大模型。”徐立表示,映射到大模型的代码上,知识是世界知识的完整灌注,中间的推理是用更高阶的思维逻辑导出一些知识所不具备的。最后是执行,某种意义上是具身智能的大脑,在执行上会有很大的突破。


近期热点

不忍了!“贵妇”们状告爱马仕:买包竟然还有“潜规则”!有 03-27

热搜!这里山上“长满”韩国人!多家航司宣布:扩增航班 03-27

关于AI和大模型 工信部、上海市、商汤科技等重磅发声 03-27

“麻辣烫热”考验文旅功底 03-27

深圳楼市重磅!“70/90政策”取消?记者求证! 03-27

热门文章
热点 热点追踪 网站首页 热点 观点