亚马逊推出可控制网络浏览器的 AI 代理 Nova Act

摘要:

亚马逊周一发布了 Nova Act,这是一款通用 AI 代理,可以控制网络浏览器并独立执行一些简单的操作。除了新的代理 AI 模型外,亚马逊还发布了 Nova Act SDK,这是一个工具包,允许开发人员使用 Nova Act 构建代理原型。

image.png

Nova Act 由亚马逊新近在旧金山开设的 AGI 实验室开发,还将为该公司即将推出的 Alexa+ 升级版提供关键功能,Alexa+ 是亚马逊广受欢迎的语音助手的生成式 AI 增强版。不过,从今天开始提供的 Nova Act 版本略显逊色。亚马逊称其为研究预览版。

开发人员可以通过新网站nova.amazon.com访问 Nova Act 工具包,该网站也是亚马逊各种 Nova 基础模型的展示。

Nova Act 是亚马逊试图利用自己的通用人工智能代理技术与OpenAI 的 Operator和Anthropic 的 Computer Use竞争的尝试。几家领先的科技公司认为,能够为用户导航网络的人工智能代理将使当今的人工智能聊天机器人更加有用。

亚马逊可能不是第一个开发这种代理技术的公司,但通过 Alexa+,它的覆盖范围可能是最广泛的。

亚马逊表示,使用 Nova Act SDK 进行开发的开发人员应该能够代表用户自动执行基本操作,例如从 Sweetgreen 订购沙拉或预订晚餐。借助 Nova Act 工具包,开发人员可以整合工具,让 AI 代理浏览网页、填写表格或在日历上选择日期。

亚马逊声称,Nova Act 在公司内部的几项测试中表现优于 OpenAI 和 Anthropic 的代理。例如,在衡量 AI 代理如何与屏幕上的文本交互的 ScreenSpot Web Text 中,Nova Act 得分为 94%,优于 OpenAI 的 CUA(得分为 88%)和 Anthropic 的 Claude 3.7 Sonnet(90%)。

不过,亚马逊并没有使用更常见的代理评估(例如 WebVoyager)来对 Nova Act 进行基准测试。

Nova Act 是亚马逊上述 AGI 实验室推出的首款公开产品,该项目由前 OpenAI 研究员 David Luan 和 Pieter Abbeel 共同领导。两人之前都创立过自己的初创公司——Luan 创办了Adept,而 Abbeel 共同创办了Covariant——去年亚马逊聘请他们来领导其 AI 代理工作。

虽然 AGI 实验室开发能够订购 SweetGreen 的 AI 代理似乎有些奇怪,但 Luan 认为代理是创建超级智能 AI 系统的关键一步。Luan 将 AGI 定义为“一种能够帮助您完成人类在计算机上所做的一切的 AI 系统”。

Luan 表示,他的团队设计了 Nova Act SDK,以可靠地自动执行简短的任务,并为开发人员提供工具,让他们能够精确定义何时需要人工干预代理工作流程。他希望,这将使开发人员能够创建更可靠的代理应用程序,尽管不一定是完全自主的应用程序。

亚马逊在竞争激烈的市场中推出了首款通用人工智能代理,但这是该公司寄予厚望的一项关键技术。Nova Act 的早期测试可以让人们一窥拖延已久的 Alexa+ 的一些功能,这对亚马逊的人工智能努力来说是一个成败攸关的时刻。

OpenAI、Google和 Anthropic 的早期人工智能代理的主要问题是它们在不同领域的可靠性。在 TechCrunch 的测试中,这些系统速度很慢,难以长时间独立运行,而且容易犯人类不会犯的错误。我们很快就会看到亚马逊是否破解了密码——或者它的代理是否也存在困扰竞争对手的同样缺陷。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看评论
created by ceallan