时间:2024-12-31 10:40:01来源:新媒体
最近还有媒体报道,OpenAI员工再度燃起了对人形机器人项目的研发热情,计划重新启动四年前已解散的内部机器人软件团队。在此之前,OpenAI已投资了igure AI、1X、Physical Intelligence三家机器人公司,其副总裁Peter Welinder还曾表示,通过与Figure等公司合作,OpenAI希望探索在大型多模态AI模型支持下,人形机器人的智能化水平能够达到何种程度。
国盛证券预计,2025年以Tesla为首的国内外人形机器人厂商都将逐步进入大规模训练阶段,人形机器人大规模训练阶段的关键是庞大的训练数据集,训练数据集的生产主要有四种方式:基于真实本体/人体/虚拟本体/合成数据的数据集生产。数据集和动作捕捉设备需求有望放量。
大模型的热度
上个周末最热的消息,其实来自国内的一款大模型——DeepSeek-V3。据最新发布的 DeepSeek-V3技术报告,在英语、代码、数学、汉语以及多语言任务上,基础模型 DeepSeek-V3 Base的表现非常出色,在AGIEval、CMath、MMMLU-non-English等一些任务上甚至远远超过其他开源大模型。即便与GPT-4和Claude 3.5 Sonnet这两大领先的闭源模型相较,DeepSeek-V3也毫不逊色,且在MATH 500、AIME 2024、Codeforces等竞赛中展现出显著优势。尤为重要的是,该模型的训练成本极低,因此市场一度认为这将对算力板块产生重要影响。
根据国盛证券的点评,DeepSeek-V3在编码和数学方面表现优异,融易新媒体消息,但与o1、o3相比,从数据上看仍存在一定差距。特定领域实现了很好的数据优化,实现了细分应用比较好的效果和训练性价比。目前看,如果有相对明确的技术路线参考,不做特别多探索性工作的话,能用有性价比的方式达到很好的效果。国内基础模型剩下的几大核心厂商对海外市面上发布的模型都有一定的跟随能力,可能无法预计的是尚未发布的模型。从o3体现的超强能力和训练、推理来看,算力爆发逻辑没有影响。