OpenAI推出可自主执行任务的人工智能代理Operator

0 cnBeta.COM 2025-01-24 02:09:33

摘要：

OpenAI 首席执行官 Sam Altman 在一篇博客文章中表示，2025 年将是人工智能代理的重要一年，这些代理可以自动执行任务并代表您采取行动。现在，我们看到了 OpenAI 的第一次真正尝试。

OpenAI 周四宣布，它将推出 Operator 的研究性预览，Operator 是一种通用人工智能代理，可以控制网络浏览器并独立执行某些操作。

Operator 将首先通过 ChatGPT 的 200 美元 Pro 订阅计划向美国用户推出。 OpenAI 表示，它计划最终将此功能推广给其 Plus、Team 和 Enterprise 级别的更多用户。

此初步研究预览可通过 operator.chatgpt.com 获得，但 OpenAI 表示很快将希望将 Operator 集成到 ChatGPT 中。

Operator 的主屏

据 OpenAI 称，新的 Operator 功能有望自动执行预订旅行住宿、预订餐厅或在线购物等任务。用户可以在 Operator 中选择多个任务类别，包括购物、送货、餐饮和旅行，所有这些类别都支持不同类型的自动化。

当 ChatGPT 用户激活 Operator 代理时，会弹出一个小窗口，显示代理使用的专用 Web 浏览器，以及用于解释代理正在执行的任务的文本。用户在 Operator 工作时仍然可以控制他们的屏幕。

OpenAI 表示，Operator 由计算机使用代理 (CUA) 提供支持，它将公司的 GPT-4o 模型的视觉功能与 OpenAI 更高级模型的推理能力相结合。CUA 经过训练可以与网站的前端进行交互，这意味着它不需要使用面向开发人员的 API 来利用不同的服务。

换句话说，CUA 可以使用按钮、浏览菜单并在网页上填写表格——就像人类一样。

“CUA 模型经过训练，可以在完成具有外部副作用的任务之前（例如在提交订单、发送电子邮件等之前）要求用户确认，以便用户可以在模型的工作永久生效之前对其进行仔细检查，”OpenAI 在介绍中写道。“[它] 已经在各种情况下证明是有用的，我们的目标是将这种可靠性扩展到更广泛的任务中。”

OpenAI 表示，它正在与 DoorDash、Instacart、Priceline、StubHub 和 Uber 等公司合作，以确保运营商尊重这些企业的规范。

但 OpenAI 警告说，CUA 并不完美。该公司表示，“不要期望 CUA 在所有情况下都能可靠地运行。”

出于谨慎考虑，OpenAI 还要求对某些任务进行监督，例如银行交易，CUA 和 Operator 可能能够完全独立执行。

“在特别敏感的网站上，例如电子邮件，Operator 需要主动的用户监督，确保用户能够直接发现并解决模型可能犯的任何潜在错误，”OpenAI 在其材料中表示。

Operator 似乎是 OpenAI 迄今为止在创建 AI 代理方面最大胆的尝试。上周，OpenAI 发布了 Tasks，为 ChatGPT 提供了简单的自动化功能，例如设置提醒和安排提示在每天的固定时间运行的能力。Tasks 为 ChatGPT 用户提供了一些熟悉但必要的功能，使 ChatGPT 像 Siri 或 Alexa 一样实用。然而，Operator 展示了上一代虚拟助手永远无法做到的功能。

AI 代理被认为是继 ChatGPT 之后 AI 领域的下一个重大事件：一项将改变我们使用互联网方式的新技术。代理不应该只是传递和处理信息，而应该真正采取行动并做事。随着 OpenAI 发布其第一个真实版本，我们也许开始看到这一愿景是否会实现。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道，更好阅读体验，更及时更新提醒，欢迎前来阅览和打赏。

查看评论

今日最热

加载中...

最新资讯

今日最热