OpenAI 推出最强代码模型GPT‑5.1‑Codex‑Max 加量不加价

OpenAI 近日正式通过 API 向开发者开放其目前最强大的编程模型 GPT‑5.1‑Codex‑Max，主打长时间运行和“代理式”编码任务，在多项权威基准测试中的成绩明显优于常规版 GPT‑5.1‑Codex。更具吸引力的是，尽管性能提升明显，这一新模型在 API 中的定价却与 GPT‑5 保持一致，被外界视为一次“高性能不涨价”的策略性升级。

报道指出，GPT‑5.1‑Codex‑Max 通过名为“压缩（compaction）”的技术进行训练，可在超过一百万 tokens 的超长上下文窗口中持续工作，内部测试显示该模型能够稳定执行持续超过 24 小时的任务。在 SWE‑Bench Verified、SWE‑Lancer IC SWE 和 TerminalBench 2.0 等面向真实软件工程场景的基准测试中，GPT‑5.1‑Codex‑Max 的得分分别提升至 77.9%、79.9% 和 58.1%，相较常规版 GPT‑5.1‑Codex 有明显进步，凸显其在复杂、多步骤开发任务中的优势。

在商用层面，OpenAI 已将 GPT‑5.1‑Codex‑Max 以与 GPT‑5 相同的价格接入 API，输入端约为每百万 tokens 1.25 美元、输出端每百万 tokens 10 美元，同时沿用 GPT‑5 的速率限制策略。此前，这一模型仅面向使用 Codex CLI、IDE 扩展、云端服务和代码审查功能的高阶订阅用户开放，如 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 等，如今通过 API 普及后，OpenAI 也宣布将其设为 Codex 体系中的默认代码模型。

与以往偏向 Unix 环境优化的 Codex 系列不同，GPT‑5.1‑Codex‑Max 在训练阶段特别针对 Windows 环境进行了适配，这使其对大量使用 Windows 作为主要开发平台的程序员而言具有更直接的吸引力。由于新模型在速度和 tokens 利用效率方面均优于常规版 GPT‑5.1‑Codex，报道认为，Windows 开发者如无特殊需求，转向这一模型几乎是“无需犹豫的选择”。

借助这次 API 放开，GPT‑5.1‑Codex‑Max 已迅速进入多款热门开发工具生态，包括 Cursor、GitHub Copilot、Linear 等在内的编码助手产品。在 GitHub Copilot 体系中，该模型将向 Pro、Pro+、Business 和 Enterprise 订阅用户开放，并出现在多个使用场景的模型选择器中，例如 Visual Studio Code 的聊天、提问、编辑和 agent 模式，以及 GitHub 网页端和移动端的 Copilot Chat 与 Copilot CLI 等入口。

竞争层面上，OpenAI 此举显然是针对对手 Anthropic 的强势扩张做出的回应，后者近年来将精力集中在面向企业和开发者的代码模型上，其 Claude Code 工具已成为最快达到十亿美元里程碑的 SaaS 产品之一。报道援引行业预期称，Anthropic 今年仅依靠面向开发与企业的代码模型业务，就有望实现 80 至 100 亿美元收入，而这也促使 OpenAI 在 8 月推出 GPT‑5‑Codex，并在短时间内带动 Codex 使用量增长超过 10 倍、每周服务的 tokens 规模达到万亿级。

在此背景下，GPT‑5.1‑Codex‑Max 被视为 OpenAI 在开发者市场上的又一重要“加码”，旨在强化其在企业级编码工具领域与 Anthropic 的正面竞争力。不过目前尚难判断这一新模型的上线及其与 GitHub Copilot 的深度整合，是否足以显著减缓 Anthropic 在企业编码市场上的迅猛增势，未来一段时间内两家在高端开发者工具赛道的博弈仍将持续升温。