五月全球“AI大爆炸”：卷技术、拼落地、比价格(3)

时间：2024-05-19 00:26:27来源：互联网

豆包主力模型pro-32k版的模型推理输入价格仅为 0.0008 元 / 千 Tokens，相当于一元钱就能买到125 万Tokens，比行业价格低 99.3%；在处理 128K 长文本时，豆包通用模型 pro 的推理输出价格为 0.005/ 千 Tokens。

这堪称是行业“地板价”。以OpenAI发布的全新模型GPT-4o为例，GPT-4o的价格已经来到输入5美元 / 百万Tokens（约为0.035 元/千Tokens），输出15美元 / 百万 Tokens（约为0.1元/千Tokens）；而像阿里、腾讯等国内大模型均价在0.12元/千Tokens左右。

火山引擎总裁谭待在接受媒体采访时提到，“降价是用技术优化成本来实现的。如果只是补贴，用亏损换收入是不可持续的，火山引擎不会走这条路。”

如何进行技术优化，据介绍，模型本身就有优化的空间，模型结构、训练方法都可以持续改进，包括业界很关注的MoE（混合专家模型），就是优化推理成本很好的解决方案。

其次是工程上的优化。大模型的调用量越大，优化推理成本的空间也越大。以前的模型都是单机推理，大模型用的是分布式推理。所以如果能把各种各样的底层算力用得更好，推理成本就会大大降低。事实上，为了让用户可以低成本地使用AI，并推动应用的发展，降价是国内大模型厂商的共识。

今年2月份，阿里云宣布全线下调云产品官网售价，平均降价幅度超过20%，最高降幅达55%，涉及100多款产品、500多个产品规格，4月份，阿里云将降价策略扩大至海外公有云产品。

大厂们之所以打起价格战，是因为大模型价格越低，使用的人越多；使用量越大，大模型才能遭调用得越来越好。简言之，价格力的出现，才能推动大模型更好地落地。

2024年，遭行业看作是大模型落地元年，推出大模型已不再是新鲜事，重要的是充分释放大模型的生产力，如何真正实现落地。

对于大模型厂商而言，如何真正服务好企业，是考验各家AI产品是否是个好商品的重要标准。

3、火热和洗牌并行，资本市场更冷静看待大模型

从ChatGPT横空出世后，大模型的火热有目共睹。面对大模型带来的技术革命，不仅是微软、谷歌、百度、字节、阿里、腾讯等大厂下场做大模型，众多与AI相关的创业公司涌现出来。

在我国，更是诞生了“新AI四小龙”：百川智能、月之暗面、MiniMax、智谱AI。从估值上看，除百川智能估值超百亿元外，月之暗面、MiniMax目前估值分别为超23亿美元和超25亿美元，智谱AI估值超百亿元。

“新AI四小龙”快速成长的背后，是资本的助推。CBInsights数据显示，2023全年生成式AI新创在全球获得约204亿美元融资，是2022年36亿美元的5倍以上。

火热的背后，也有一些现象值得思考。最为明显的一点是，与上一代移动互联网创业潮相比，这场AI掀起的创业潮，资本和创业者都显得更为冷静谨慎。

从创业者角度看，大模型创业从研发大模型，到落地应用场景，这条路的成功不仅依赖资金的投入和人力的积累，更需要过硬的技术和清晰的落地路径，缺一不可。

从资本角度看，创业公司烧钱换增长在大模型行业是行不通的，投资者不会因为短暂的增长就不遗余力地押注真金白银。

市场研究机构CB Insights发布的《2023年人工智能行业现状报告》指出，2023年中国AI领域的投融资案例数量约为232起，与去年同期相比下降了38%；融资总额约为20亿美元，同比大幅下降了70%。

肉眼可见的是，市场冷静下来了，在钱少的时候，对于创业公司而言，活下来更加重要。尤其是到了今年，商业化、落地等关键词成为大模型新的竞赛点后，商业模式不清晰，营收增长乏力的企业或面临危机，行业或将迎来真正洗牌阶段。

从新变化看，今年，场上大模型玩家都从围绕模型层的“参数之争”，转变为发力应用层的“用户之争”，百度创始人李彦宏也多次表示“卷模型不如卷应用”。

海外市场和国内类似，投资Facebook和Salesforc的Meritech Capital，以及TCV、General Atlantic、Blackstone等机构纷纷暂停对生成式AI的关注。Gartner分析师John-David Lovelock称，大模型数十亿美元的投资数量已经放缓且几乎已经结束，热钱涌向AI 应用。

今年5月这波技术大爆炸后，玩家们都瞄准了“更像人”的方向，即推出互动能力更强的AI助手。