Google DeepMind(AlphaGo的幕后团队)发布了 Genie 2,这是一款开创性的工具,可根据单个图像提示生成交互式 3D 世界。 这个新模型旨在帮助训练和测试人工智能代理,允许他们使用键盘和鼠标输入与这些动态环境进行交互。 根据 DeepMind 的说法,它可以在各种交互环境中训练和测试人工智能代理,以下是其主要功能的细分:
动作可控: Genie 2 可对键盘和鼠标输入等动作做出响应,让人或人工智能与环境互动。 例如,当你按下方向键时,它就会明白必须移动角色,从而不会错误地移动树木或云朵等物体。
Genie 2 可以记忆不再出现在视图中的世界部分,并在它们回到场景中时进行渲染,从而使模拟感觉更加连续逼真。
即时创建新内容:它可以创建新的、一致的内容,同时随着时间的推移保持世界的完整性,确保环境始终以可信的方式不断发展。
Genie 2 可以对物理、重力和光照等复杂的交互进行建模,甚至可以制作角色动画和模拟非游戏角色 (NPC) 的行为。 它可以处理从水流效果到角色移动和烟雾等一切效果。
反事实模拟:系统可以从同一起点生成不同的路径。 这一功能允许研究人员测试不同的结果,为培训目的提供了一种模拟各种体验的方法。
真实世界图像提示:不仅限于计算机生成的图像,精灵 2 还可以使用真实世界的照片作为提示,模拟风吹草动或水流等自然元素。
快速原型: 研究人员可以使用 Genie 2 快速创建交互式体验,以便在不同环境中进行快速测试和培训。 它可以将概念艺术或图纸转化为完整的互动世界。
像Genie 2这样的生成式人工智能并非没有争议。 版权和知识产权问题是这一领域的主要症结所在。 此类模型通常是在从互联网上获取的数据集上进行训练的,其中有时包括受版权保护的资料。
艺术家、游戏开发者甚至科技公司都对未经授权使用他们的内容来训练这些模型表示担忧。 在生成式人工智能的其他领域, 已经出现了针对 OpenAI 和 Stability AI 等公司的诉讼,原告认为他们的作品未经许可被使用。 不难想象这里也会出现类似的案件,尤其是当这些人工智能生成的世界与人类创造的设计越来越难以区分时。
对数据采集行为的广泛批评又增加了一层复杂性。 许多人对 Meta 和 X 等公司感到失望,因为这些公司使用其平台上的用户数据来训练模型,而这些数据往往未经用户明确同意。