融易新媒体
快捷导航 融易新媒体
主页 > 财经 > 资讯 >

Kimi爆火后 阿里、百度等大厂角逐长文本

时间:2024-03-25 03:35:01来源:新媒体

K图 BK1169_0

  月之暗面不再“晦暗”。近期,由这家公司创作的大模型应用Kimi,吸引了大量目光。Kimi产生的效应已经从大模型圈外溢至资本市场,Kimi概念股在本周应运而生。用户激增,巨大流量突然涌入,甚至让Kimi服务器一度宕机。

  Kimi在这一轮大模型应用当中突围,核心优势在于长文本读取和解析能力。颇为巧合的是,就在22日晚间,阿里高调宣布通义千问开放1000万字长文本能力。360当晚紧随其后,宣布360智脑正式内测500万字长文本处理功能,即将入驻360AI浏览器。

  而据《科创板日报》了解,百度也将在下个月开放200万-400万的长文本能力。

  阿里巴巴百度等互联网巨头纷纷布局并升级自家的大模型产品,强化长文本处理能力,正让业界重新审视长文本处理在大模型领域的必要性和重要性。而随着Kimi的崛起,这也让大模型的讨论焦点从大模型本身转移到了应用端,2024年是否会成为AI大模型应用落地元年?

  长文本是必要的吗?

  相较于其他大模型应用,Kimi的长处在于长文本分析联网搜索、文档处理和等功能上,尤其在深度解析厚重书籍内容方面,其性能远超远超其他模型。3月18日,月之暗面甚至一口气将无损上下文长度提升了十倍,直达200万字级别。

  据目前的用户体验来看,Kimi也不是全能选手。有用户反馈表示,对于一些较为困难的任务,包括结构化信息处理和图像中潦草文字的识别,对话连续性上,Kimi仍显示出一些短板。在生成能力和语音能力上,目前Kimi还未加入这些模态。

  尽管如此,长文本能力的重要性不言而喻。目前,市面上的大模型应用,GPT-4Turbo-128k公布的文本范围约为10万汉字,Claude3200k上下文约16万汉字。

  一家AI上市公司大模型架构业务人士告诉记者,由于模型训练结构的限制,以往大模型的文本范围都不算长,但复杂任务和行业知识通常是长篇巨制,这种情况下,只能拆分输入提问,但这可能会导致输出的结果上下不连贯逻辑不通顺。长文本可以全篇连贯的去理解上下文,满足理解和问答的需求,长文本能力在此时是具备优势的。

  而国内大厂们,则正在长文本领域快速布局。

  《科创板日报》记者从知情人士方面了解到,百度在下个月将对文心一言进行升级,届时也将开放长文本能力,文本范围在200万-500万。目前,文心一言的文本最高上限在3.2万。

  而阿里已经先行一步。22日晚间,阿里的通义千问官宣升级,向所有人免费开放1000万字的长文档处理功能。用户可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。

  360紧随其后,其在当晚宣布,360智脑正式内测500万字长文本处理功能,即将入驻360AI浏览器。

  Kimi成功在前,阿里、百度、360先后角逐长文本。长文本能力会是大模型未来差异化的竞争点吗?

  上述大模型架构人士表示,长文本能力目前在训练和效果上仍存在一些难点,比如如何避免遗漏细节。事实上,文本长度也可以通过RoPE等算法技术去拓展,但是此时会严重丢失细节,这就导致输出效果不准确。因此,核心标准是看输出结果的精准性连贯性,并不是文本长度越长越好。

  另外一名大模型行业人士也告诉记者,长文本实际是大模型的基础能力,只要算力资源足够,理论上长文本可以追求无限长,“但是如果使用场景根本用不上长文本,那么此时的长文本就没有任何意义”。

  2024年是大模型应用落地元年吗?

  Kimi的火爆,一定程度上也反应了当下国内大模型的发展阶段,从打基建开始走向应用落地。那么,2024年是否会成为AI大模型应用落地元年?

  澜舟科技CEO周明认为,从长远来看,人工智能在逼近AGI。而经过去一年的发展,大模型已经具备了落地的能力,企业侧也积攒了很多业务落地场景。加上国家政策的推动,2024年将会是大模型落地元年。


近期热点

Kimi爆火后 阿里、百度等大厂角逐长文本 03-25

发改委主任郑栅洁:开辟量子技术、生命科学等新赛道 开展人工 03-25

中原策略:诸多利好提振 股指预计将维持震荡格局 03-25

证监会重拳出击!许家印遭罚4700万 终身市场禁入!恒大地产遭 03-25

2年虚增收入5600亿!证监会重拳出击:恒大地产遭罚41.75亿 许家 03-25

热门文章
热点 热点追踪 网站首页 热点 观点