OpenAI的劲敌发了一款新模型，Claude 3.5 Sonnet多模态能力超过GPT-4o

时间：2024-06-21 21:41:49来源：界面新闻

在GPT-4o炸场一个月后，OpenAI最大的竞争对手Anthropic放出了一款颇有竞争力的新模型。

北京时间6月21日，Anthropic正式发布Claude 3.5 Sonnet，这是其Claude系列的最新AI模型。从Anthropic透露的信息来看，在阅读、编码、数学和视觉等几个主要AI基准测试中，新模型能力不仅超过了Claude 3 Sonnet，还超越了Anthropic此前最强版本的旗舰模型Claude 3 Opus。

按照惯例，Anthropic也释出了一系列与行业竞争对手的测试结果榜单，融易新媒体消息，令人瞩目的是，Claude 3.5 Sonnet的大部分成绩优于OpenAI、Google、Meta的旗舰模型，其中自然也包括刚推出不久还处于风口的GPT-4o。

细致来看，Claude 3.5 Sonnet在研究生水平推理 (GPQA)、编码能力 (HumanEval) 、文本推理（DROP）等方面的成绩均好于GPT-4o，但在数学问题解决能力上稍逊于后者。

Claude 3.5 Sonnet强调了自己在创意写作方面的突出表现，公司表示它能够更好理解prompt（指令）之间的细微差别以及有更强的幽默能力。

而作为一款多模态大模型，Claude 3.5 Sonnet与GPT-4o相比，没有将重点放在实时音频交互能力上，而是暂时着重突出了图像处理能力的提升。

Claude 3.5 Sonnet在大多数视觉基准测试中比Claude 3 Opus平均表现高出10%。公司称，Claude 3.5 Sonnet可以更准确地解释图表和图形，在带有扭曲和视觉伪像的这类“不完美”图像中，它也能顺利完成文本转录任务。

据TechCrunch报道，Anthropic的产品主管Michael Gerstenhaber表示，这些技术改进的来源是架构调整和新训练数据（包括人工智能生成的数据），但他并未透露究竟数据内容。

性能提高、成本降低的规律也体现在这款最新模型上。根据公司分享的信息，Claude 3.5 Sonnet比Opus速度更快（以聊天机器人为例其速度大约是Opus的两倍），但价格仅为后者的五分之一。

在定价上，该模型的输入价格为3美元/百万Tokens，输出价格为15美元/百万Tokens，上下文窗口长度达200K Tokens。

除了大模型产品，Anthropic此次还推出了一款应用产品Artifacts预览版。这是一个可供用户添加和编辑其模型生成内容的工作空间，例如用其生成的代码、文档、图像、网站设计等内容创建作品。

这款产品会在Claude的web客户端设置一个专用窗口，产品形态类似于将大模型接入工作流。Anthropic表示，Artifacts后续还可能会与其他团队合作以接入新功能。

此外，Anthropic透露，公司将在今年晚些时候陆续更新其余两款大模型Claude 3.5 Haiku和Claude 3.5 Opus。

作为Anthropic背后的科技巨头，亚马逊云科技也随即宣布，Claude 3.5 Sonnet已正式接入其Amazon Bedrock。

上一篇：东方甄选越来越像线上超市
下一篇：平台焦虑、商家逃离，“最卷618”的尽头是否只能是低价？

相关文章

担心AI造假怎么办？首个AI实时鉴伪工具来了
随着AGI（通用人工智能）等话题日益火热，AI安全的重要性也在快速提升。这背后，是全球范围内的企业、机构与个人对AI造成的技术恶用、滥用问题的重视...: 十年铸剑，破茧成蝶：余承东在开发者大会宣布原生鸿蒙应用开平台焦虑、商家逃离，“最卷618”的尽头是否只能是低价？ OpenAI的劲敌发了一款新模型，Claude 3.5 Sonnet多模态能力超过GPT- 东方甄选越来越像线上超市 不拼低价的小红书电商拿什么求增长？

近期热点

担心AI造假怎么办？首个AI实时鉴伪工具来了 06-21

十年铸剑，破茧成蝶：余承东在开发者大会宣布原生鸿蒙应用开 06-21

平台焦虑、商家逃离，“最卷618”的尽头是否只能是低价？ 06-21

OpenAI的劲敌发了一款新模型，Claude 3.5 Sonnet多模态能力超过GPT- 06-21

东方甄选越来越像线上超市 06-21

热门文章

日榜
周榜

热点

财经

科技

观点

产业

专栏

OpenAI的劲敌发了一款新模型，Claude 3.5 Sonnet多模态能力超过GPT-4o