Meta Platforms 基础人工智能研究团队的研究人员今天表示,他们将发布更高级版本的人工智能模拟环境 Habitat,该环境用于教授机器人如何与物理世界进行交互。
在推出 Habitat 3.0 的同时,该公司还宣布发布 Habitat 合成场景数据集(Habitat Synthetic Scenes Dataset),这是一个由艺术家撰写的三维数据集,可用于训练人工智能导航代理;同时还发布了 HomeRobot,这是一个经济实惠的机器人助手软硬件平台,可在模拟和真实环境中使用。
FAIR的研究人员在一篇博文中解释说,新发布的产品代表了他们在"具身人工智能"方面的不断进步。他们所说的"具身人工智能"是指人工智能代理能够感知环境并与其互动,与人类伙伴安全地共享环境,并在数字和物理世界中与人类伙伴交流并为其提供帮助。
Habitat 是一个虚拟环境目录,如办公空间、住宅和仓库等,可用于训练和改进人工智能机器人在现实世界中的导航能力。其中的虚拟环境是利用红外捕捉系统精心构建的,该系统可以精确测量桌椅甚至书籍等物体的形状和大小。在这些环境中,研究人员可以训练机器人完成复杂的、多步骤的任务,这些任务需要机器人具备观察和理解周围环境的能力。
Habitat 3.0 在这些现有功能的基础上,同时支持机器人和人形化身,使人类和机器人能够在许多不同的任务中进行协作。例如,人类和机器人可以共同清理客厅或在厨房准备食谱。FAIR表示,这为研究人类与机器人在各种现实任务中的协作开辟了新途径。FAIR 表示,"Habitat 3.0"中的人类化身非常逼真,步态和动作自然,可以实现最逼真的低级和高级互动。
研究人员写道:"人类和机器人在仿真环境中的这种共处,使我们首次能够在类似家庭环境的人形化身面前学习机器人人工智能策略,并在日常任务中与真人一起评估这些策略。"
FAIR表示,"Habitat 3.0"将把机器人人工智能代理的学习时间从几个月甚至几年缩短到几天。它还能在安全的模拟环境中更快速地测试新模型,而不会有任何风险。
栖息地合成场景数据集(Habitat Synthetic Scenes Dataset)被称为 HSSD-200,它也将有助于加速人工智能的研究,因为真实世界场景的三维模拟对于训练至关重要。FAIR 解释说,HSSD-200 优于其以前提供的数据集,因为三维场景比以前更准确地反映了物理世界的场景。它由 211 个高质量的三维场景组成,这些场景复制了现实世界中的房屋和其他环境,并包含 466 个语义类别中的 18,656 个物理世界物体模型。
据 FAIR 称,HSSD-200 提供了与 WordNet 本体相对应的细粒度语义分类,同时其资产压缩功能可实现更高性能的体现式人工智能模拟。单个对象均由专业 3D 艺术家制作,在外观和尺寸上与真实世界品牌的家具和电器精确匹配。
最后,FAIR 引入了一个新的 HomeRobot 库,这是一个硬件和软件规范,供希望创建实体机器人的研究人员使用,以便将他们在 Habitat 中训练的模型应用于物理世界。
HomeRobot 基于用户友好的软件堆栈和经济实惠的硬件组件,这意味着可以快速、轻松地进行设置,并为实际测试做好准备。它是专为开放词汇移动操纵研究而设计的,移动操纵是指机器人能够在任何看不见的环境中拾取物体并将其放置到指定位置。要做到这一点,机器人必须能够感知和理解它们遇到的新场景。
Constellation Research Inc.的霍尔格-穆勒(Holger Mueller)说,Meta公司的声明表明,该公司取得了超越生成式人工智能炒作的真正进展,其强大的软件可用于在虚拟世界中训练和测试智能机器人。他说:"Habitat 3.0 现在的重点是人机交互,因为这是一个关键的里程碑,如果我们要制造能够在日常生活中发挥作用的机器人,就必须完善人机交互。HSSD-200数据集非常有用,因为在这些环境中生成物理对象的成本很高,而且需要大量时间。"
FAIR表示,这些开发成果还有很多。它正在进行的体现式人工智能研究下一步将重点关注机器人如何在动态、不断变化的环境中与人类协作,以反映我们生活的真实世界。
研究人员解释说:"在下一阶段的研究中,我们将使用 Habitat 3.0 模拟器来训练我们的人工智能模型,以便这些机器人能够协助人类伙伴并适应他们的喜好。我们将结合 Habitat 3.0 使用 HSSD-200,收集有关大规模人机互动和协作的数据,从而训练出更强大的模型。我们将重点把在模拟中学习到的模型部署到物理世界中,以便更好地衡量它们的性能。"