时间:2024-03-04 08:05:01来源:界面新闻
但近年来的共识是,互联网迅速造富的时代已接近尾声。创业公司的融资速度与估值能够反映这一趋势,根据《财经十一人》不完全统计和调研数据,2022年中国新增独角兽数量大约为40家上下。而2018年至2020年,这个数据分别是156家、137家、111家。
大语言模型的出现让创业者们再次看到了改变命运的机会窗口。在元璟资本刘毅然看来,就像“PC+windows”、“智能手机+操作系统”扮演了互联网时代的底层技术栈,大语言模型在当下扮演着同样重要的角色。
重要性人尽皆知,但大语言模型极其考量投资人对于出手时机的判断。特别是去年以来,投资人圈普遍认为,投基础大模型需要5000万起步,明年则会更高。
制图:顾乐晓2023年,AGI和大模型创业成为国内一级市场唯一逆势上扬的赛道。根据华兴资本的调研,接近80%的一线机构在该领域都有出手,出手轮次以A轮之前为主,币种上以美元和双币基金为主构成。
按照架构层次划分,大模型赛道初创公司从下至上可分为算力层、基础层、模型层及应用层。
最受关注的模型层主要包括通用大模型和行业大模型。通用大模型竞争格局初定,除了知名互联网大厂之外,第一梯队的公司如智谱AI、百川智能的估值都达到了独角兽级别,他们大多手握20亿的现金,具备与大厂阶段性竞争的实力。
行业大模型的崛起是另一个不容忽略的现象。其背后逻辑是一些有行业积累的公司在接入通用大模型后,利用专业数据精调,在金融和法务等领域取得了不错的表现,并开始与头部厂商竞逐客户,自然语言处理NLP领域的追一科技以及熵简科技是其中代表。
基础层(AI infra)的热度也不逊色,目前该层尚无明落实义,基本认为是介于算力和应用之间用于支撑和交付模型的工具,下到通信、推理优化等,上到中间件、数据库都属于基础层范畴,尤洋创办的潞晨科技,袁进辉的Oneflow以及无问芯穹是其中比较突出的代表。
应用层的创业及投融资热度略微逊色于模型层与基础层,且与美国差距较大,原因是全新的AI场景尚未完全形成,而且应用层对底层模型和基础设施依赖程度很高,多模态(图像、视频等多媒体形式)是此间的研究热点。
相较美国,我国正经历着从模型层到应用层的追赶阶段,但现有的一些模型参数规模依然较低。
制图:顾乐晓 2Frank本以为这一轮大模型创业热潮能一直火热下去,但到2023年下半年大家突然发现,形势变了。年初200余家号称做大模型的创业公司,在市面上仅剩20余家活跃着。
“去年年中大家普遍发现大模型创业这事没那么好做。不管是训练行业模型,还是训练通用模型,都不是一门很好的生意。”企业级生成AI平台猴子无限CEO尹伯昊告诉界面新闻。
最大的阻碍源于技术差距。GPT4的出现拉高了所有人的期待,它是OpenAI公司在3月份发布的多模态大语言模型产品,它处理图片和文字的能力又超出了业内预期。
科大讯飞董事长刘庆峰曾公开表示,国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上跟GPT4还有差距。有创业者专门测试对比了国内主流大模型产品与GPT4,得到的结论是“有很大进步空间”。
科大讯飞董事长刘庆峰 图源:WAIC官方而为了追赶技术,基础大模型的投入是巨大的。据Information报道,OpenAI在2022年营收仅为2800万美元,亏损则高达5.4亿美元。它能持续进化背后靠的是微软的资金和算力支持。
所以,国内大模型创业公司面临的首要难题是,如何找到下一轮融资?已经融到钱的头部公司暂时不慌,而其他融不到钱的只能离场或者另寻方向。
Oneflow一流科技创始人袁进辉就全面经历了这一轮融资环境的变化。去年年初行业大热,他的公司及团队遭王慧文的光年之外以约2亿美金的估值收购。光年之外借此又获融资,开始了创业狂飙之旅。
但由于王慧文突然病退,美团最后接盘,袁进辉不久之后宣布了单独创业的消息。但转头就碰上了行业转冷,有FA称其新公司融资进展并不顺利。直到1月2日晚间,袁进辉的新公司硅基流动才浮出水面,据记者了解,其已获得了头部资本如创新工场的投资。