微软开放NVIDIA GPU运行原本仅限Copilot+ PC的本地AI功能
微软正在放宽此前围绕 Copilot+ PC 画下的一条“硬线”,允许更多 Windows 11 设备在具备合适 GPU 的情况下运行本地 AI 工作负载。 最新更新显示,只要系统配备了至少 6GB 显存的 NVIDIA GeForce RTX 30 系列或更新型号显卡,就可以支持 Windows 的本地语言模型 API。 从表面上看,这只是针对开发者的一项小改动,但它暗示微软正在重新思考:是否还要把本地 AI 能力紧紧绑定在 Copilot+ 品牌之下。

在 2024 年 6 月 18 日 Copilot+ PC 正式发布时,微软向外传达的信息非常明确:专用 AI 硬件是必需条件。 这类设备的部分定义特征,就是内置神经处理单元(NPU),以及 16GB 内存和固态硬盘等基础配置。 其中,NPU 被刻意塑造为解锁 Windows 本地 AI 功能的关键所在。
然而,能够承担 AI 负载的并不只有 NPU。 尤其是现代 GPU,本来就是为大规模并行计算而生,长期以来一直被用于运行机器学习模型。 在实际应用中,对于许多 AI 工作负载,GPU 往往可以提供比当前 NPU 更高的吞吐能力,只是通常会付出更高的功耗代价。
在此次调整之前,微软一直把大部分内置 AI 功能限制在配有 NPU 的设备上。 这让不少算力充足、仅依赖 GPU 的 PC 无法使用本地文本与图像生成,以及 Windows Recall 等一系列 AI 工具。 如今,这道鸿沟开始被填平。 微软在更新的技术文档和 GitHub 帖子中确认,开发者现在可以在非 Copilot+ PC 上,利用受支持的 GPU 来运行语言模型 API。
微软在介绍中称,此项能力为“语言模型 API 在 GPU 上运行(试验性)”,并指出这些 API 现已能在配备受支持 GPU 的非 Copilot+ PC 上运行,为更广泛的 Windows 11 设备带来本地语言模型能力。 官方同时明确,目前受支持的硬件包括配备 6GB 以上显存的 NVIDIA GeForce RTX 30 系列及更新产品。
就当前阶段而言,这一能力仍然主要停留在开发者层面,而非直接面向普通终端用户开放。 要调用这些 API,需要开发或使用集成 Windows AI 框架的应用程序。 不过,这已经为本地 AI 功能大规模拓展到更多 Windows 设备奠定了基础。
在这一框架的核心,是一个名为 Phi Silica 的小型本地语言模型。 与预装在所有系统中的方案不同,Phi Silica 通过 Windows Update 按需分发:当某个应用提出需求时,系统才会下载该模型。 模型安装完成后,即可在本地硬件上运行,当检测到可用 GPU 时,便会优先利用 GPU 加速推理。
目前公开的功能主要聚焦文本相关任务。 通过 Windows.AI.Text API,应用可以执行内容摘要、文本重写、将文本转换为结构化格式,以及生成提示语等操作。 从用户视角看,这些能力与云端 AI 工具提供的体验类似,只是计算完全在本地完成。
本地运行带来了一些实际优势。 由于减少了对云端算力的依赖,系统响应速度有望提升,同时数据不必上传外部服务器,有助于数据留在本机之内。 对开发者和企业用户而言,这种模式在延迟、带宽成本与隐私合规方面都有潜在吸引力,可能影响其对 AI 功能的采用方式。
需要指出的是,此次开放并不意味着 Copilot+ 体系全面“解锁”。 一些更具可见性的 Copilot+ 功能,例如 Windows Recall 和 Click to Do,目前仍然绑定于搭载 NPU 的系统。 就现状来看,GPU 支持主要局限在语言模型 API 层,而不是整个 AI 体验的完整集成。
尽管限制尚存,趋势已经十分明显:微软不再把 NPU 视作 Windows 本地 AI 的唯一入口。 允许 GPU 承担这部分工作负载,显著扩大了可兼容硬件的范围,也削弱了 Copilot+ PC 在发布之初那种“独占本地 AI”的形象。
