Google DeepMind 正在向部分用户开放一款名为 Project Genie 的全新 AI 模型,用户只需通过文本提示或上传图片,就能即时生成任意风格的虚拟世界,并像玩电子游戏一样操控角色或载具在其中自由探索。 这一功能目前通过一款网页应用提供,持有美国地区 Google Ultra 账户且年满 18 岁的用户已经可以尝试使用。
Project Genie 基于Google此前在 2025 年 8 月向小范围测试者展示的 Genie 3 模型,同时结合了公司自家的 Nano Banana Pro 图像生成模型以及 Gemini 多模态模型,用于将自然语言提示转化为沉浸式互动场景。 用户可以构建的世界类型极为多样,例如操控飞船掠过外星行星、驾驶飞艇飞越上世纪 50 年代风格的欧洲城市,或者让貘在亚马逊雨林深处奔跑等,均可通过简单描述或参考照片快速生成。
在具体体验上,Project Genie 会根据玩家如何移动角色、转动视角,实时生成虚拟世界中的画面帧,并支持与场景内物体的交互以及对环境变化的响应。 例如,在官方演示视频中,一个蓝色小球在白色草地中滚动时,会将它经过的一切都“涂”上蓝色,形成持续变化的轨迹效果;同时,应用还内置了可供用户二次创作和改造的世界模板库,以便快速上手。

用户不仅可以在这些环境中导航,还能上传自己绘制的角色、现实世界物体照片等作为素材,并设定不同元素之间的交互逻辑,从而构建更具个性化的虚拟体验。 在某些场景中,甚至可以看到类似 GPS 导航界面那样的动态反馈:当玩家转向或移动时,界面上的地图也随之更新,增强沉浸感和可玩性。
YouTuber Bilawal Sidhu 在采访 Project Genie 团队成员 Jack Parker-Holder 和 Diego Rivas 时指出,目前这一系统在实际演示中仍会出现偶发性 Bug,而且每次体验被限制在 60 秒以内,这是当下最大的功能约束之一。 不过,开发团队表示,未来会重点探索如何在用户输入中赋予更多对环境和角色行为的控制权,并研究延长虚拟世界持续时间、打破 60 秒上限的可行方案。
至于应用场景,DeepMind 团队尚未给出单一明确方向,而是看好它在多个领域的潜力。 报道指出,Project Genie 有望用于快速原型化电子游戏构思、帮助电影创作者可视化场景与分镜,以及在课堂上帮助学生以更具互动感的方式理解复杂概念或职业场景,例如模拟参与灾后救援工作等,且无需用户具备专业开发技能。

作者也关注到,该技术的开放必然伴随内容安全和合规挑战,包括如何设置“护栏”防止生成有害或不当内容,以及如何在创作过程中规避潜在的版权侵权问题。 Google方面尚未在细节层面全面披露治理机制,但预计会在未来的产品迭代中不断调整相关策略。
目前,居住在美国且订阅了 Google AI Ultra 的用户已经可以直接通过Google实验性项目页面体验 Project Genie。 随着后续进一步向更多地区和用户开放,这一“用一句话生成并亲自走进虚拟世界”的新型 AI 交互方式,或将成为游戏开发、创意设计和教育培训等领域的重要工具之一。