时间:2024-04-02 21:41:38来源:新媒体
2023年4月17日,昆仑万维发布自研双千亿级大语言模型「天工1.0」正式奠定了国产大模型崛起之路。
在即将到来的2024年4月17日,在「天工」大模型一周年之际,昆仑万维重磅宣布,「天工3.0」正式开启公测!
「天工3.0」采用4千亿级参数MoE混合专家模型,并将同步选择开源,是全球模型参数最大、性能最强的MoE模型之一。相较于上一代「天工2.0」MoE大模型,「天工3.0」在模型语义理解、逻辑推理、以及通用性、泛化性、不落实性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。
同时,「天工3.0」新增了搜索增强、研究模式、调用代码及绘制图表、多次调用联网搜索等能力,并针对性地训练了模型的Agent能力,使得「天工3.0」能够独立完成规划、调用、组合外部工具及信息,以精准高效地完成产业分析、产品对比等各类复杂需求,带来全新的颠覆式人工智能体验。
同时,「天工3.0」也是全球首个多模态“超级模型”(Super Model),其集成了AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力,是大模型时代的“超级应用”。
其中,「天工3.0」AI音乐生成大模型SkyMusic还将在4月2日(明日)面向社会开启邀测。
四大创新 颠覆升级
MoE混合专家模型是全球技术最领先、性能最强大的基座模型(Foundation Model)技术路径,相较于其他模型,MoE大模型应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。
在上一代「天工2.0」MoE大模型的领先基础上,「天工3.0」更是实现了完整的性能升级,其采用4000亿级参数MoE混合专家模型架构,是目前全球模型参数最大、性能最强的MoE模型之一。
「天工3.0」的模型能力提升体现在以下四大方面:
1、逻辑推理能力更强:更聪明
逻辑推理能力的提升对于大模型解决复杂问题至关重要,「天工3.0」的数学与推理能力均提升超过30%,强大的逻辑推理能力使其能够在实际应用中更加准确和高效地处理信息。例如,在「天工3.0」AI搜索的研究模式中,模型能够围绕用户的某个简单指令进行相关问题的延伸,并实时判断该段落信息是否需要联网搜索,能够实现如对某个行业进行细致的拆解分析,总结相关事件、拆解产业链地图等复杂功能,并以结构化或思维导图的形式进行最终展示,让模型更“聪明”。
2、语义理解能力更强:更懂你
「天工3.0」能够更好地理解和处理用户自然语言Query中的复杂语义信息,包括隐喻、多义词等。例如,在「天工3.0」AI搜索的增强搜索中,模型能够针对用户的复杂Query进行拆解、细化、并进行追问、信息理解与补全,使其在自然语义理解方面性能更强,面对不落实性知识时表现更好,融易新媒体消息,能够更精准、高效地满足用户需求。
3、专项Agent训练,应对复杂需求能力更强:更全能
大模型时代,AI Agent(智能体)已经成为大模型技术的主流落地方向。「天工3.0」针对模型独立规划、调用、组合外部工具及信息的能力进行了专项训练,使其能够独立生成并调用代码,完成包括产业研究、产品横评、信息分析、图片生成、图表绘制等多种复杂用户需求,并成为具备多个领域专业知识和能力的全能专家,以强大的语义理解及逻辑推理能力对用户需求进行深度理解,并把任务拆解成细分环节,发到不同的最优模型去处理,最大程度提升模型性能。同时,针对B端用户,「天工3.0」也在知识库能力、任意工具调用能力、复杂角色指令追寻能力等领域进行了完整升级,企业用户可以通过上传知识文档构建专属知识库及Agent,并实现自动调用制定工具、完成复杂指令遵循Agent构建等实用能力。
4、内容创作能力完整升级:多才多艺
内容创作能力一直是「天工」系列大模型的强项,在上一代「天工2.0」大模型的基础上,「天工3.0」更是进行了完整的内容创作能力升级,其不仅能实现AI音乐生成、AI语音、AI对话、AI二次元漫画生成等强大的内容创作能力,更是通过专项Agent训练实现了在对话中结合文本需求实时生成图片、结合文本需求实时内容分析及图表构建等能力,成为真正能搜、能写、能读、能聊、能听、能说、能画、能看、能唱的超级模型,带来全新的颠覆式AI体验升级。
全球首个“超级模型”