亚马逊支持的人工智能初创公司Anthropic周二宣布实现了一个重要的AI里程碑:AI代理可以像人类一样,使用计算机完成复杂任务。Anthropic的Claude是与OpenAI的ChatGPT和谷歌的Gemini类似的聊天机器人之一。
周二的发布是对Claude 3.5 Sonnet的一次更新,这款最新AI模型中的“计算机使用能力”功能,使其能够解读计算机屏幕上的信息、选择按钮、输入文本、导航网站并通过任何软件和实时互联网浏览执行任务。
“它能够以基本上与我们相同的方式使用计算机,”Anthropic的首席科学官Jared Kaplan在接受CNBC采访时表示,并补充说它可以执行“几十甚至数百步的任务”。
Anthropic表示,亚马逊已率先试用该工具,早期客户和测试者包括Asana、Canva和Notion。根据Kaplan的说法,该公司自今年初以来一直在开发这一工具。Anthropic周二为开发者发布了该功能的公测版,团队希望在未来几个月或明年初向消费者和企业客户开放使用。
Anthropic表示,未来的消费者应用包括预订航班、安排预约、填写表格、进行在线研究和提交报销报告。Kaplan表示:
“我们希望Claude能够真正帮助人们处理各种工作,而不仅仅是通过聊天机器人提出问题并获得上下文答案后就结束了。”
此外,Anthropic还发布了下一代模型Claude 3.5 Haiku。该公司表示,Haiku现在在变成任务上超越了许多最先进的模型,包括最初的Claude 3.5 Sonnet和GPT-4o,并且成本保持不变。
AI代理方兴未艾
自从OpenAI的ChatGPT风靡全球以来,生成式AI行业迅速从文本回答转向生成AI照片、视频和语音。现在,初创公司和大科技公司都全力投入AI代理的开发。
分析认为,AI代理不仅仅提供答案,而更是为了生产力而设计,应该能够代表用户完成多步骤、复杂的任务。虽然这个术语在整个技术领域中没有明确的定义,但AI代理被视为比聊天机器人更进一步,通常设计用于特定的业务功能,并可以在大型AI模型上进行定制。
风投公司Lux Capital的合伙人Grace Isford在6月曾向媒体表示,科技投资者对构建AI代理的初创公司的兴趣“急剧增加”。这些橱窗公司总共募资数亿美元,并且随着生成式AI市场的扩展,它们的估值也在攀升。
微软首席执行官Satya Nadella在今年早些时候的财报电话会议上表示,他希望提供一种能够代表用户完成更多任务的AI代理,尽管还有“很多执行工作需要完成”。Meta和Google的高管也曾表示,他们正在推动AI代理变得越来越高效。
多个方面与OpenAI展开竞争
自从Anthropic在2023年3月发布Claude的首个版本以来,该公司迅速成为最热门的AI初创公司之一,虽然宣传热度比如ChatGPT,其产品在企业和消费市场上直接与ChatGPT竞争。其支持者包括Google、Salesforce和亚马逊。自今年1月以来,Anthropic推出了iOS和Android应用程序、针对企业的Team计划,并扩展到欧洲市场。
“我们正在向一个世界迈进,在这个世界中,这些模型将更像虚拟合作者而不是虚拟助手,”Anthropic的产品经理Scott White在9月表示。
上个月,Anthropic推出了Claude Enterprise,这是其Claude发布以来最大的新品,专为希望整合Anthropic AI的企业而设计。据该公司称,Claude Enterprise的早期测试者和客户包括GitLab、Midjourney和Menlo Ventures。
Claude Enterprise允许客户上传相关文档,其上下文窗口比以前大得多,相当于100次30分钟的销售对话、100,000行代码或15份完整的财务报告。该计划还为公司内的超级用户提供“活动摘要”,以便向新接触AI的员工展示他人如何使用这项技术。
6月,Anthropic还宣布推出“Artifacts”,它允许用户让Claude聊天机器人生成文本文档或代码,并在专用窗口中打开结果。
“Artifacts”或“工作空间”让用户能够“实时查看、编辑和构建Claude的创作。这使Anthropic的企业级客户能够创建营销日历、导入销售数据、制作仪表板或预测、为功能编写代码、撰写法律文书、总结复杂合同、自动化法律任务等。
在Anthropic5月推出Teams后不久,Meta旗下Instagram的联合创始人兼前首席技术官Mike Krieger加入Anthropic,担任首席产品官。此外,OpenAI的前安全负责人Jan Leike也在同月加入了该公司。
网友反应
有网友对Anthropic此次更新表示惊叹,称正在见证人工智能技术的显著演变,自主代理正在成为现实。
还有网友认为,Anthropic的命名有问题,如此大的更新,为何不叫做Sonnet 3.6?
但也有网友不买账,认为新模型在创意性工作方面没什么优势。