日本超级计算机"富岳"现已成为 AWS 上虚拟高性能计算实例的软件栈

摘要:

就在几年前,富岳超级计算机还处于高性能计算发展的前沿。现在,这项日本技术已被转化为一种软件堆栈,可使全球的超级计算应用"平民化"。

理研计算科学中心(R-CCS)最近发布了其"虚拟富岳"项目的第一个版本,该项目旨在将富岳转变为解决复杂社会问题的"社会基础设施"。2020 年,"富岳"曾是世界上速度最快的超级计算机,这一称号保持了两年之久,后来被美国使用 Arm 处理器的"Frontier"超级计算机超越。

2024-08-08-image-12-j.webp

虚拟富岳是一个软件栈,它包括富岳硬件平台上使用的基本软件包及其主要依赖项。该工具以 6GB 奇点容器的形式提供,预置在亚马逊 Graviton 3E 芯片上运行,可从 Sylab 云库免费下载

Virtual 富岳软件包的初始版本支持亚马逊网络服务(AWS)云计算服务。这是因为 AWS Graviton CPU 与 富岳 的 A64FX 加速器使用相同的 Arm 芯片架构,因此可以快速调整软件栈,以便在基于 Graviton 的云计算环境中无缝运行。

理研表示,AWS 客户现在可以建立自己的富岳超级计算机私有实例。以前部署在富岳硬件上的研究和开发应用程序也可以在AWS上使用,而这仅仅是虚拟富岳项目的开始。Riken 的研究人员正在努力扩展与其他硬件平台的兼容性,旨在将软件栈确立为基于云的虚拟 HPC 应用程序的"行业标准"。

2024-08-08-image-13-j_1100.webp

据 Riken 总监 Satoshi Matsuoka 介绍,最初的富岳系统在传染病控制、天气预报、药物发现和新材料开发等领域取得了重大成就。虚拟富岳的目标是推进这些高性能计算的发展,并为下一代高性能计算复制富岳在软件维护和操作方面的成就。

几个月前,亚马逊推出了虚拟富岳项目,强调其硬件是一个拥有 16 万个节点和 800 万个 CPU 的庞大系统。借助富岳,研究人员对 SARS-CoV-2 冠状病毒进行了复杂的模拟,该病毒在 COVID-19 大流行期间对世界造成了重大影响。亚马逊表示,虚拟富岳有可能扩大此类科学突破,其影响可能比单台 HPC 机器"大得多"。

热门评论

>>共有0条评论,显示0
更多评论
created by ceallan