返回上一页  首页 | cnbeta报时: 04:21:58
Anthropic发布Opus 4.5模型 新增Chrome与Excel集成功能
发布日期:2025-11-25 03:57:41  稿源:cnBeta.COM

Anthropic正式发布了其旗舰人工智能模型的最新版本——Opus 4.5。这是Anthropic 4.5系列中最后一个亮相的版本,此前Sonnet 4.5于今年九月发布,Haiku 4.5则在十月推出。

Opus 4.5在多个基准测试中表现突出,包括编码基准(SWE-Bench和Terminal-bench)、工具使用(tau2-bench和MCP Atlas)以及通用问题解决能力(ARC-AGI 2、GPQA Diamond)。值得注意的是,Opus 4.5成为首个在权威编码基准SWE-Bench Verified得分超过80%的模型。

除了性能提升,Anthropic还着重展示了Opus 4.5在计算机操作和表格处理方面的新能力,并同步推出一系列相关产品,用以验证模型在实际应用中的效果。Opus 4.5发布的同时,Claude for Chrome和Claude for Excel这两款此前处于试点阶段的产品将面向更广泛的用户开放。Chrome扩展将向所有Max用户开放,Excel版本则覆盖Max、团队及企业用户。

新版本还通过对模型记忆管理方式进行重大优化,在长文本和长上下文任务中带来了显著提升。Anthropic产品管理负责人Dianne Na Penn指出:“我们在长上下文质量上做了改进,但仅仅加长上下文窗口还不够,如何记住关键细节同样至关重要。”

这些升级也促成了许多用户呼吁已久的新功能,例如为付费Claude用户提供的“无限对话”模式。此功能允许模型在上下文窗口达到上限时自动压缩记忆,无需中断聊天流程或提示用户。

部分升级聚焦于智能代理(agentic use-case)场景,特别是Opus作为主模型指挥由Haiku驱动的子代理时的应用。此类任务依赖于强大的工作记忆,而Opus 4.5的记忆力优化在此类场景中价值尤为突出。Penn表示:“记忆力是基础,Claude不仅要能探索代码库、大型文档,还要知道何时回溯复查。”

Opus 4.5将在市场上面对其他前沿模型的激烈竞争,包括OpenAI于11月12日发布的GPT 5.1与Google在11月18日推出的Gemini 3。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 04:21:58

文字版  标准版  电脑端

© 2003-2025