融易新媒体
快捷导航 融易新媒体
主页 > 科技 > 互联网 >

专访昆仑万维CEO方汉:国产大模型的差距不在算力或数据,在于工程经验

时间:2023-04-19 14:40:03来源:界面新闻

界面新闻记者 | 李彪

接力OpenAI、微软的重磅产品轰炸,国产大模型在四月开启了“鸣枪冲刺”。

4月17日,昆仑万维(300418.SZ)旗下“天工3.5”类GPT大模型正式启动邀请测试。按照官方说法,天工大模型参数规模达千亿级,名字中的“3.5”源于“ ChatGPT基于GPT3.5大模型 ”,代表“天工大模型已经非常接近OpenAI ChatGPT的智能水平 ”。

事实上,从ChatGPT开年带火A股市场概念股以来,昆仑万维一直是声量最大、股价显著受影响的龙头公司之一——从1月伊始的14.39元/股涨至48.75元/股,不满三个月涨幅已高达239%。

专访昆仑万维CEO方汉:国产大模型的差距不在算力或数据,在于工程经验

​数据来源:股价来自Wind,证监会关注函、昆仑万维年报
制图:界面新闻

除产品直接对标ChatGPT外,昆仑万维还计划将现有资金最大程度用于支持AIGC领域的研发和商业化。在上周最新发布的业绩年报中,集团董事会决议在2022年不派发现金红利、不送红股、不以资本公积金转增股本 ,未分配利润全部转入下一季度。

据此,昆仑万维提出了未来十年的战略口号——“All in AGI与AIGC”。昆仑万维CEO方汉接受界面新闻专访时表示,AIGC内部优先级的提升经过了一个动态变化过程。“我们在2020年6月开始布局AIGC时,最早作为一个实验性项目立项。直到去年年底,‘All in AIGC与AIGC’才上升为了集团战略。”

专访昆仑万维CEO方汉:国产大模型的差距不在算力或数据,在于工程经验

根据先前回复深交所的关注函介绍,天工大模型产品由昆仑万维与初创公司奇点智源合作自研。昆仑万维主要为奇点智源提供硬件方面的支持,已合计采购价值4400万美元的硬件设备。双方开发的中国版类ChatGPT的知识产权归奇点智源所有,昆仑万维享有未来商业化产生的净利润的50%。

凭借游戏业务起家、2015年上市的昆仑万维还将“All in AIGC”战略描述为寻找第二增长曲线。

专访昆仑万维CEO方汉:国产大模型的差距不在算力或数据,在于工程经验

数据来源:证监会关注函
制图:界面新闻

方汉表示,起步调研阶段,OpenAI当时的GPT-3模型未开源,且市面上的同类开源模型并不多。由于围绕底层开发上层的AIGC应用走不通,自2020年年底,昆仑万维便决定自建大模型。

方汉告诉界面新闻记者,从一片蛮荒到一拥而上,国产大模型在极速变化中发展。各家目前抢发大模型还是在追求“大力出奇迹”,首先要入场,然后追赶和竞争。

以下为采访内容,经过不改变原意的编辑:

界面新闻:天工大模型对标GPT-3.5是基于什么标准?

方汉:对于专业研发,大模型能力的量化其实都是有一系列公开的测试数据集作为统一参考标准。我们自己内部已经利用了这些公开的测试数据集对模型进行一个评测,公开数据的测试是天工对标GPT3.5的一个重要原因。

GPT-3.5、GPT-4的论文中都附了相应的大型测试数据集,目前可能有将近20类,涵盖了大模型多维度的各项能力测试。大模型厂商发布产品前都会用这些数据做评测,并得到一组分数,这是专业圈子内比较认可的公平、公正的评价标准。

界面新闻:各家大模型产品都会去测试吗?天工的分数是多少?

方汉:不仅是发布产品,做研发也要靠测试去保证下一阶段工作的推进。

现在各家宣传模型参数级别动辄千亿、万亿,其实统计口径是不一样的。谁都没有说谎,但是模型表现不能简单粗暴地靠参数量比较。用公开数据集测试后,各家对于自己处在什么梯队、竞争对手的得分都是心中有数的。

天工在17号才开始邀请测试,具体分数现在还无法对外公布。

界面新闻:去年12月,昆仑万维发布了一系列天工系列的多模态应用,包括作画、编程、作曲,其中天工巧绘是基于开源的Stable Diffusion模型,天工3.5发布后会做迁移吗?

近期热点

中经评论:家装服务行业亟待规范 10-28

扶持中小企业尚需发力 10-28

强镇兴村需精耕细作 10-28

法国开启再工业化“绿色纪元” 10-28

银行也不能乱收费 10-28

热门文章
热点 热点追踪 网站首页 热点 观点