返回上一页  首页 | cnbeta报时: 14:46:54
OpenAI 推出最强代码模型GPT‑5.1‑Codex‑Max 加量不加价
发布日期:2025-12-05 13:38:20  稿源:cnBeta.COM

OpenAI 近日正式通过 API 向开发者开放其目前最强大的编程模型 GPT‑5.1‑Codex‑Max,主打长时间运行和“代理式”编码任务,在多项权威基准测试中的成绩明显优于常规版 GPT‑5.1‑Codex。 更具吸引力的是,尽管性能提升明显,这一新模型在 API 中的定价却与 GPT‑5 保持一致,被外界视为一次“高性能不涨价”的策略性升级。

报道指出,GPT‑5.1‑Codex‑Max 通过名为“压缩(compaction)”的技术进行训练,可在超过一百万 tokens 的超长上下文窗口中持续工作,内部测试显示该模型能够稳定执行持续超过 24 小时的任务。 在 SWE‑Bench Verified、SWE‑Lancer IC SWE 和 TerminalBench 2.0 等面向真实软件工程场景的基准测试中,GPT‑5.1‑Codex‑Max 的得分分别提升至 77.9%、79.9% 和 58.1%,相较常规版 GPT‑5.1‑Codex 有明显进步,凸显其在复杂、多步骤开发任务中的优势。

在商用层面,OpenAI 已将 GPT‑5.1‑Codex‑Max 以与 GPT‑5 相同的价格接入 API,输入端约为每百万 tokens 1.25 美元、输出端每百万 tokens 10 美元,同时沿用 GPT‑5 的速率限制策略。 此前,这一模型仅面向使用 Codex CLI、IDE 扩展、云端服务和代码审查功能的高阶订阅用户开放,如 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 等,如今通过 API 普及后,OpenAI 也宣布将其设为 Codex 体系中的默认代码模型。

与以往偏向 Unix 环境优化的 Codex 系列不同,GPT‑5.1‑Codex‑Max 在训练阶段特别针对 Windows 环境进行了适配,这使其对大量使用 Windows 作为主要开发平台的程序员而言具有更直接的吸引力。 由于新模型在速度和 tokens 利用效率方面均优于常规版 GPT‑5.1‑Codex,报道认为,Windows 开发者如无特殊需求,转向这一模型几乎是“无需犹豫的选择”。

借助这次 API 放开,GPT‑5.1‑Codex‑Max 已迅速进入多款热门开发工具生态,包括 Cursor、GitHub Copilot、Linear 等在内的编码助手产品。 在 GitHub Copilot 体系中,该模型将向 Pro、Pro+、Business 和 Enterprise 订阅用户开放,并出现在多个使用场景的模型选择器中,例如 Visual Studio Code 的聊天、提问、编辑和 agent 模式,以及 GitHub 网页端和移动端的 Copilot Chat 与 Copilot CLI 等入口。

竞争层面上,OpenAI 此举显然是针对对手 Anthropic 的强势扩张做出的回应,后者近年来将精力集中在面向企业和开发者的代码模型上,其 Claude Code 工具已成为最快达到十亿美元里程碑的 SaaS 产品之一。 报道援引行业预期称,Anthropic 今年仅依靠面向开发与企业的代码模型业务,就有望实现 80 至 100 亿美元收入,而这也促使 OpenAI 在 8 月推出 GPT‑5‑Codex,并在短时间内带动 Codex 使用量增长超过 10 倍、每周服务的 tokens 规模达到万亿级。

在此背景下,GPT‑5.1‑Codex‑Max 被视为 OpenAI 在开发者市场上的又一重要“加码”,旨在强化其在企业级编码工具领域与 Anthropic 的正面竞争力。 不过目前尚难判断这一新模型的上线及其与 GitHub Copilot 的深度整合,是否足以显著减缓 Anthropic 在企业编码市场上的迅猛增势,未来一段时间内两家在高端开发者工具赛道的博弈仍将持续升温。

了解更多:

https://github.blog/changelog/2025-12-04-openais-gpt-5-1-codex-max-is-now-in-public-preview-for-github-copilot/

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 14:46:54

文字版  标准版  电脑端

© 2003-2025