富士通为AI服务器和HPC推出动态资源分配技术
富士通的业务传统上侧重于销售计算产品、大型机服务器和高性能计算设备。 现在,该公司正致力于利用其"计算优化专长",提供基于软件的创新解决方案,以满足尖端人工智能应用对 GPU 日益增长的需求。
在 2023 年推出"计算代理"解决方案之后,富士通现在已经确认,该产品最终可以在日本和全球其他市场购买。 这家总部位于川崎的公司旨在通过软件实现传统上由硬件处理的功能,从而显著提高资源优化和 GPU 利用率。
这项新技术以中间件的形式呈现,旨在按 GPU 动态分配资源,优化多个平台和人工智能应用的利用率和高级内存管理。 计算代理可实时分配 CPU 和 GPU 计算资源,优先处理执行效率更高的进程。 即使进程已经在 GPU 上运行,它也能重新分配。
据报道,在发布前的测试中,富士通的 GPU 处理性能最多提高了 2.25 倍。 该技术还提供了令人印象深刻的内存管理能力,因为它可处理 150GB 的人工智能工作负载,约为测试 GPU 物理内存容量的五倍。
富士通最初表示,开发人员需要使用其专有框架才能充分利用新计算代理技术的功能。 然而,最新发布的公告并未提及这一要求。 该公司目前正在努力进一步增强该技术,旨在支持数据中心环境中安装在多台服务器上的多个 GPU。
富士通表示,自2024年5月以来,已有多家公司对计算代理中间件进行了测试。 据报道,日本金融科技企业 Tradom 已在生产中采用了该技术,而云服务提供商 Sakura 正在评估该技术在优化数据中心运营方面的潜力。
富士通强调了资源优化在降低基于 GPU 的人工智能应用能耗方面的价值。 随着生成式人工智能服务继续主导技术领域,企业级 GPU 仍然是最炙手可热的硬件组件之一。 该公司认为,提高这些系统的运行效率对于满足日益增长的需求至关重要。