时间:2024-05-19 00:26:27来源:互联网
豆包主力模型pro-32k版的模型推理输入价格仅为 0.0008 元 / 千 Tokens,相当于一元钱就能买到125 万Tokens,比行业价格低 99.3%;在处理 128K 长文本时,豆包通用模型 pro 的推理输出价格为 0.005/ 千 Tokens。
这堪称是行业“地板价”。以OpenAI发布的全新模型GPT-4o为例,GPT-4o的价格已经来到输入5美元 / 百万Tokens(约为0.035 元/千Tokens),输出15美元 / 百万 Tokens(约为0.1元/千Tokens);而像阿里、腾讯等国内大模型均价在0.12元/千Tokens左右。
火山引擎总裁谭待在接受媒体采访时提到,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这条路。”
如何进行技术优化,据介绍,模型本身就有优化的空间,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。
其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样的底层算力用得更好,推理成本就会大大降低。事实上,为了让用户可以低成本地使用AI,并推动应用的发展,降价是国内大模型厂商的共识。
今年2月份,阿里云宣布全线下调云产品官网售价,平均降价幅度超过20%,最高降幅达55%,涉及100多款产品、500多个产品规格,4月份,阿里云将降价策略扩大至海外公有云产品。
大厂们之所以打起价格战,是因为大模型价格越低,使用的人越多;使用量越大,大模型才能遭调用得越来越好。简言之,价格力的出现,才能推动大模型更好地落地。
2024年,遭行业看作是大模型落地元年,推出大模型已不再是新鲜事,重要的是充分释放大模型的生产力,如何真正实现落地。
对于大模型厂商而言,如何真正服务好企业,是考验各家AI产品是否是个好商品的重要标准。
3、火热和洗牌并行,资本市场更冷静看待大模型从ChatGPT横空出世后,大模型的火热有目共睹。面对大模型带来的技术革命,不仅是微软、谷歌、百度、字节、阿里、腾讯等大厂下场做大模型,众多与AI相关的创业公司涌现出来。
在我国,更是诞生了“新AI四小龙”:百川智能、月之暗面、MiniMax、智谱AI。从估值上看,除百川智能估值超百亿元外,月之暗面、MiniMax目前估值分别为超23亿美元和超25亿美元,智谱AI估值超百亿元。
“新AI四小龙”快速成长的背后,是资本的助推。CBInsights数据显示,2023全年生成式AI新创在全球获得约204亿美元融资,是2022年36亿美元的5倍以上。
火热的背后,也有一些现象值得思考。最为明显的一点是,与上一代移动互联网创业潮相比,这场AI掀起的创业潮,资本和创业者都显得更为冷静谨慎。
从创业者角度看,大模型创业从研发大模型,到落地应用场景,这条路的成功不仅依赖资金的投入和人力的积累,更需要过硬的技术和清晰的落地路径,缺一不可。
从资本角度看,创业公司烧钱换增长在大模型行业是行不通的,投资者不会因为短暂的增长就不遗余力地押注真金白银。
市场研究机构CB Insights发布的《2023年人工智能行业现状报告》指出,2023年中国AI领域的投融资案例数量约为232起,与去年同期相比下降了38%;融资总额约为20亿美元,同比大幅下降了70%。
肉眼可见的是,市场冷静下来了,在钱少的时候,对于创业公司而言,活下来更加重要。尤其是到了今年,商业化、落地等关键词成为大模型新的竞赛点后,商业模式不清晰,营收增长乏力的企业或面临危机,行业或将迎来真正洗牌阶段。
从新变化看,今年,场上大模型玩家都从围绕模型层的“参数之争”,转变为发力应用层的“用户之争”,百度创始人李彦宏也多次表示“卷模型不如卷应用”。
海外市场和国内类似,投资Facebook和Salesforc的Meritech Capital,以及TCV、General Atlantic、Blackstone等机构纷纷暂停对生成式AI的关注。Gartner分析师John-David Lovelock称,大模型数十亿美元的投资数量已经放缓且几乎已经结束,热钱涌向AI 应用。
今年5月这波技术大爆炸后,玩家们都瞄准了“更像人”的方向,即推出互动能力更强的AI助手。