Copilot+ PC 是首款在设备上运行小语言模型 (SLM) 的计算机。 这种方法的优势在于,它比基于云的 Copilot 应用程序更快地生成图像或文本生成等任务的结果。 现在,微软推出了 AI Dev Gallery,这是一种将设备上的人工智能功能集成到任何应用程序中的简便方法。
AI Dev Gallery 应用程序适用于希望尝试多种模型将人工智能功能集成到其应用程序中的开发人员。 该应用提供超过 25 个样本,用户可以下载并在设备上运行。 此外还可以将项目或源代码直接导出到应用程序中,并立即运行。 它适用于 Windows 10 和 11,同时支持 x64 和 ARM64 架构。
目前,访问它的唯一方法是在 Visual Studio 中构建项目,然后运行它。 此外,还需要至少 20GB 的空间和多核 CPU。 它还建议配备 8GB VRAM 的 GPU。
该应用有两种模式: 样本和模型,程序将它们分为文本、图像、代码、音频和视频以及智能控件。
测试模型
图像生成和视频生成的模型相当大,接近 5GB。 我们从一个与升频有关的小模型开始,它不到 100 MB。 我们截取了一张屏幕截图,并尝试使用 CPU 对其进行缩放,工作时可以在 CPU 和 GPU 之间切换处理请求。
在这个配置较低的虚拟机中,缩放过程不到 30 秒,内存消耗瞬间攀升至 1GB。 应用程序展示的是分辨率为 9272*4900 的升频版图像。 图像元素,尤其是文字受到严重影响,难以辨认。
没有在更大窗口或全屏预览生成图像的选项。 甚至连将其保存到磁盘的下载选项也没有
我们尝试了另一种名为 Detect Human Pose 的模型。 它可以识别图像中某人的位置。 虽然它能准确识别一个基本行走的人,但它甚至开始为我们打开了几个应用程序的桌面截图显示位置标记。
我们不知道这些模型如何集成到应用程序中,但其中一些功能可以在本地运行。 当然,这些机型的 PC 需要更大的存储空间,以及配备 16GB 或更大内存的强大 CPU。
是否值得下载一个 5GB 的模型来将文本提示转换成图片,或者等待 30 秒来在网络应用程序上实现这一功能?显然,这些功能大多有非常小众的用例和实施环境,而不是吸引整个 Windows 11 用户群。