DeepMind 的 RoboCat 开始学习执行一系列机器人任务

DeepMind 表示，它开发了一种名为 RoboCat 的人工智能模型，可以通过不同模型的机械臂执行一系列任务。仅此一点并不是特别新颖。但 DeepMind 声称，该模型是第一个能够解决和适应多个任务的模型，并且使用不同的现实世界机器人来实现这一点。

DeepMind 的研究科学家、RoboCat 团队的共同贡献者 Alex Lee 表示：“我们证明，单个大型模型可以在多个真实的机器人实施例上解决多种任务，并且可以快速适应新的任务和实施例。”

RoboCat 受到 Gato 的启发，Gato 是一种可以分析文本、图像和事件并对其采取行动的 DeepMind 人工智能模型，它接受了从模拟和现实生活中的机器人收集的图像和动作数据的训练。 Lee 表示，这些数据来自虚拟环境中其他机器人控制模型、人类控制机器人以及 RoboCat 本身的先前迭代的组合。

为了训练 RoboCat，DeepMind 的研究人员首先收集了 100 到 1000 个使用人类控制的机械臂执行任务或机器人的演示。（例如让机器人手臂拾取齿轮或堆砌方块）然后，他们对 RoboCat 的任务进行了微调，创建了一个专门的“衍生”模型，该模型平均针对该任务进行了 10,000 次练习。

利用衍生模型生成的数据和演示数据，研究人员不断扩大 RoboCat 的训练数据集，并训练 RoboCat 的后续新版本。

RoboCat 模型的最终版本接受了总共 253 项任务的训练，并在模拟和现实世界中对这些任务的 141 种变体进行了基准测试。 DeepMind 声称，在观察了几个小时内收集的 1000 个人类控制的演示后，RoboCat 学会了操作不同的机械臂。

虽然 RoboCat 已经接受了四种带有双叉手臂的机器人的训练，但该模型能够适应更复杂的带有三指抓手和两倍可控输入的手臂。

为了避免 RoboCat 被誉为机器人控制 AI 模型的最终王者，在 DeepMind 的测试中，其跨任务的成功率差异很大——从低端的 13% 到高端的 99%。这是训练数据中的 1000 个演示，不出所料，示威活动的成功率只有一半。

尽管如此，在某些情况下，DeepMind 声称 RoboCat 只需 100 次演示就能学习新任务。

Lee 相信 RoboCat 可能预示着解决机器人技术新任务的障碍将会降低。“为新任务提供有限数量的演示，RoboCat 可以针对新任务进行微调，进而自行生成更多数据以进一步改进，”他补充道。展望未来，研究团队的目标是将教 RoboCat 完成新任务所需的演示次数减少到 10 次以下。