Google研究人员在自生成人工智能模型上运行Doom

摘要:

《毁灭战士》(Doom)已经在几乎所有能想象到的硬件上运行过。现在,Google的一个新项目利用这款标志性游戏以及围绕它的无处不在的流行语,展示了一种利用人工智能运行游戏引擎的替代方法。开发人员认为,这可能是根据提示"生成"互动游戏的第一步。

那些声称生成式人工智能将使人们能够完全通过提示来创作电影、电视节目或互动游戏的人往往被视为骗子。然而,Google的一个新引擎最近利用标志性的第一人称射击游戏《毁灭战士》(Doom)展示了在交互场景生成方面取得的重大进展。

修改者曾将 Doom 移植到割草机、记事本、毫瓦神经芯片、图文电视甚至是嵌套到其他游戏中。但在Google和特拉维夫大学 GameNGen 团队的最新实验中,他们利用基于Stable Diffusion的自定义扩散模型,实时渲染游戏,成功生成了《毁灭战士》关卡。


其结果远比以往使用人工智能从头开始生成游戏的尝试复杂得多。GameNGen 复制的《毁灭战士》在单个张量处理单元上以每秒约 20 帧的速度运行,图像质量与 1993 年的原版相似。人类观察者在比较《毁灭战士》的短片和人工智能生成的克隆片时,只能以比随机猜测稍高的准确度区分两者。

此外,GameNGen 的模型是完全互动的。从片段中可以看出,它了解《毁灭战士》中关于物品、弹药、敌人、健康状况和钥匙卡门的基本规则。不过,在人工智能生成的图像中也会出现轻微的视觉故障和典型的模糊效果。更严重的是,逻辑故障也时有发生。

例如,敌人可能会突然出现在玩家面前,物体可能会在被摧毁后重新出现。研究论文指出,出现这些不一致的情况是因为人工智能只能记住游戏的最后三秒钟。尽管存在这种限制,但它仍能从地图和 HUD 上的玩家状态推断出游戏状态的某些细节。GameNGen 的短暂记忆是其目前的主要缺点。


研究人员将两个分别训练的程序结合起来,开发出了这款引擎。首先,他们训练了一个强化学习代理来玩《毁灭战士》。然后,他们根据 RL 代理生成的动作和帧来训练定制版的 Stable Diffusion 1.4。

游戏开发人员最近开始使用生成式人工智能来完成资产创建和概念开发等任务。不过,研究人员认为,像 GameNGen 这样的技术有可能允许使用文本和视觉提示来编码和编辑游戏。

查看评论
created by ceallan