OpenAI升级Mac版Codex 新增电脑操控、图像生成与记忆功能
OpenAI 宣布为其 AI 编程代理 Codex 推出多项重要更新,重点增强在 Mac 平台上的自动化操作、图像生成以及个性化记忆能力。Codex 现在可以通过自身的光标直接操控桌面级 Mac 应用,能够“看到”屏幕内容,并完成点击、输入等操作,以执行各类任务。

更新后,Codex 可以在同一台 Mac 上并行运行多个代理实例,而且不会干扰用户的日常使用。OpenAI 表示,这一能力将有助于开发者进行应用测试、前端界面迭代等工作。Codex 还加入了更强的记忆功能,能够记住每位用户的偏好、常用工作流、技术栈等信息,从而更贴合个人的日常开发流程。
在自动化方面,Codex 现在可以基于现有对话线程在中断后恢复工作,并能为自己安排未来的工作任务,在数天甚至数周的时间跨度内持续推进同一项目。它还会结合项目上下文、记忆内容以及连接的插件,主动提出可执行的工作建议。
此次更新还为 Codex 引入了一款内置浏览器,用户可以直接在网页上进行批注,以向代理提供更精确的指令。未来,Codex 还将获得对该浏览器的完整控制能力,包括打开网站、按用户流程操作页面、截取屏幕截图以及检查输出结果等。

在生成式能力方面,Codex 已升级为使用 gpt-image-1.5 模型,在应用内生成图像。OpenAI 称,这将有助于为产品概念和界面原型快速创建可视化素材。同时,Codex 现在支持多个终端标签页,能够处理 GitHub 代码审查评论,并可在侧边栏中直接打开文件,为 PDF、电子表格等文档提供丰富预览。
配合这些功能更新,Codex 还新增了 90 多个插件,用于组合多种技能、应用集成以及 MCP 服务器,以提升其对上下文信息的获取和实际操作能力。
OpenAI 表示,这些更新将从即日起向使用 ChatGPT 账号登录的 Codex 桌面版用户陆续推送。不过,个性化相关功能目前尚未向企业版、教育版以及欧盟和英国用户开放,预计将在稍后时间推出。同时,电脑操控功能在欧盟和英国地区暂时也无法使用。
下载地址:



