时间:2024-05-27 00:27:43来源:界面新闻
通用大模型现已基本告别单纯拼性能,“双轮驱动”理论下,其产品验证也进入白热化阶段。
5月22日,百川智能发布最新一代基座大模型Baichuan 4,并推出成立之后的首款AI助手“百小应”。
Baichuan 4仍然是一个数千亿参数级别大模型。百川智能方面称,相较Baichuan 3,新一代模型通用能力提升超过10%,数学和代码能力分别提升14%和9%。“百小应”定位于专业AI助手,功能涉及整理资料、辅助创作、多轮搜索等。
百川智能创始人兼CEO王小川表示,与信息时代工具属性的产品所不同,AI 2.0是将工具变为“伙伴”,即AI可以像人一样使用工具,会思考、有情感。只不过受限于模型能力,相关应用将逐步具备全面能力。在“百小应”上,这个追求初步体现在应用本身“会提问”“定向搜索”等能力上,例如对用户问题进行细化的反问和追问。
同为国内大模型领域的独角兽,在Minimax、月之暗面、零一万物、阶跃星辰等公司先后发布消费端应用之后,百川智能面向普通用户的产品姗姗来迟。对此,王小川回应称不是百川智能太晚,而是行业太早。他认为,行业已经发布的应用只是模型的展现,而一个应用要做到何种程度才能遭广泛应用,整个行业都还没有到成熟状态。
事实上,“百小应”只是百川智能实施产品路线图的第一步。
百川智能是大模型“双轮驱动”(指研发和应用)理论的坚定支持者,并认为靠消费端可最终取胜。王小川指出,创业公司一定要有自己的“超级应用”,“如果只是学OpenAI一样一开始有个模型、做API服务,在中国对创业公司而言是走不通的。”
之所以得出此结论,一方面,他认为中国商业环境中企业级生意规模比消费端少10倍;另一方面则体现在成本模型上的不合理,“你收的(订单结算)是人民币,花的(显卡成本)是美金。”王小川这样比喻道。
这番言论直指最近大模型领域最为热议的企业端价格战。5月初,私募巨头幻方量化旗下DeepSeek宣布其DeepSeek-V2 API的最新定价为每百万token输入1元、输出2元(32K上下文),价格几乎等同于GPT-4-Turbo的百分之一。
此举煽动了大模型领域的蝴蝶效应。随即,阿里云通义千问、字节跳动豆包、腾讯混元等大模型纷纷跟进API接口服务的降价策略,百度文心一言则宣布两款主力模型ENIRE Speed和ENIRE Lite免费。
这场延续在互联网大厂之间的降价接力赛中,创业公司们表现得相对低调,但话事人的口径几乎一致:创业公司不能盲入价格战,而是要坚持在自身的模型性能上发力。
谈及对价格战的看法,王小川认为“大家实在太看好这个时代的前景了,不愿意失去任何机会,侧面反映了大家对这个时代AI能力有足够的憧憬。”并且,他判断云厂商借由大模型的机会,甚至有可能走出行业此前跑不出明确盈利模式的困境。
按照他的理解,这一轮大厂降价的实质是云厂商进到新战场,降价不仅是这些大厂射程范围内的事,也是仅限于云厂商的动作。如果是针对企业端服务,这场战争最后也会变成售卖整套云服务而不是模型本身。这很像曾经发生在“AI四小龙”(通常指商汤、旷视、依图和云从)身上的故事。
王小川称自己并未因眼前正在发生的争端而产生任何焦虑,但他建议创业公司不要掺和进去。在他看来,这并不等同于滴滴、美团时代的烧钱动作,不能改变以供需双边网络为基础的生产关系。同时,“不要把这样一种商业模式(指以开放API接口为代表的企业端模式)当成你的重点位置,这不是一个创业公司双轮驱动的逻辑。”
相较于企业级市场激战正酣的状态,消费端市场虽然暂时没有出现价格战,融易新媒体消息,但也出现了创业公司投流买量、跑马圈地的营销战雏形。
对此,王小川依然认为这并不是健康的行为,甚至可能只是一种加速融资进程的手段。大模型公司在产品和营销的配合上有不同路径选择,有的先拱模型,有的先拱应用,但模型和应用之间的平衡,是每个公司最顶层战略要考虑的问题。