融易新媒体
快捷导航 融易新媒体
主页 > 科技 > IT业界 >

讯飞星火发布深度推理模型X1,全国产算力平台训练有多大含金量?

时间:2025-01-16 08:00:01来源:界面新闻

1月15日,科大讯飞发布深度推理大模型讯飞星火X1,其表现最为突出的是中文数学能力,目前已应用于教育和医疗场景。

在科大讯飞研究员的演示中,讯飞星火X1展现出了对复杂问题多步拆解的“思维链”能力,自我反思能力,并能够针对谜底正确与否等反馈信息进行强化训练。

小初高/大学(含竞赛)、AIME、MATH 500等多项测试中,讯飞星火X1得分高于多个同样强调多步思维能力的模型,其中包括月之暗面的K1。

值得注意的是,讯飞星火X1是国内目前全量开放可下载大模型中,唯一在全国产算力平台上训练完成的。 

此次训练任务是由科大讯飞与华为合作完成。2023年10月,科大讯飞就曾联合华为推出国产万卡规模大模型算力平台“飞星一号”,并于去年10月再次宣布启动国产超大规模智算平台“飞星二号”。 

事实上,科大讯飞对于算力平台的搭建一直围绕国产算力。科大讯飞研究院院长刘聪曾在接受采访时坦言,讯飞的算力规模不及头部大厂,并且使用国产算力平台,也需要花费不少额外精力进行适配等工作。

他表示,在国内芯片和算力集群相较于国外领先水平有一定差距的情况下,讯飞的坚持仍然做出了可观的效果。

算力成本是国内通用大模型坚持迭代升级的一个重要门槛。随着Scaling Law的技术曲线放缓,更大算力投入与所获性能提升的比例开始缩小,融易新媒体消息,这意味着算力的“性价比”开始下跌,除非不顾成本,否则很难有大模型公司能够继续攻坚大参数模型的预训练。

日前,作为大模型“六小虎”之一的零一万物就公开表示放弃超大模型的预训练,转向务实的、小而快的,以商业性价比来评估的模型。

如此可见,面对海外AI芯片高企的价格成本,以及日趋严格的购买限制,国产超大规模算力平台很可能是未来大多数通用模型及产业模型的主要选择之一。不过,缺乏生态支持、单卡算力有限等依然是国产算力长期面临的问题,就超大智算平台的搭建而言,行业还需要通信传输技术等AI基础设施层面的能力提升。

在这场发布会上,科大讯飞还发布了讯飞星火4.0 Turbo的更新版本,重点在于图文、数学和长文本能力,在多模态能力水平上进一步接近GPT-4o。

图文识别能力方面,该模型对通用文档版面分析、文字识别的准确率相对提升了40%,复杂表格结构、潦草手写文字等方面的准确率相对提升了60%。模型还加入了混域知识搜索技术,可以更准确分析不同领域的文本内容,提高一次性提问的信息搜索效率。

此外,科大讯飞还推出了星火语音同传大模型,具备端到端语音到语音同传能力,最快实现5秒同传时延,接近人类专家译员水平。

无论是深度推理大模型讯飞星火X1,新版讯飞星火4.0 Turbo,还是星火语音同传大模型,科大讯飞都在强调其落地应用的实际场景与价值。 

目前,讯飞星火X1已应用于教育和医疗场景。除了讯飞自己所拥有的核心业务对应的行业资源,还有其智能硬件终端AI学习机。星火语音同传大模型也明确计划应用于讯飞录音笔、讯飞翻译机、讯飞办公本。

这是相较于其他创业公司,科大讯飞大力投入AI大模型的差异化之处,这家公司自身拥有大量的落地场景,包括ToB(企业端)业务资源,以及智能硬件终端场景。

据科大讯飞此前披露,2024年1-9月,公司在中国大模型招投标市场成功中标38个项目,披露的中标金额为2.16亿元,在项目数量和金额上均为行业第一。

作为上市公司,科大讯飞在AI大模型上的投入也将受到投资人们的持续关注与质疑。

2024上半年,科大讯飞亏损4亿元,上年同期则盈利7357万,这是其上市以来首份亏损的半年报。其中,2024上半年围绕大模型相关的总投入超过13亿,包括围绕大模型新增1.2亿营销推广费用。上半年的研发总投入高达21.9亿,同比增长32.32%。

彼时,公司董事长刘庆峰明确表示,要剔除不盈利的小业务,把战略业务做得更大。


近期热点

讯飞星火发布深度推理模型X1,全国产算力平台训练有多大含金 01-16

小米正式进军韩国市场,计划开设线下实体店 01-16

董明珠:以旧换新应成常态,格力累计处理废旧产品6800万台 01-16

华为参投的赛目科技登陆港交所,股价较发行价涨超10% 01-16

联想高管近期预测:未来三四年内,每台PC都会成为AI PC 01-16

热门文章
热点 热点追踪 网站首页 热点 观点