Aurora超级计算机安装完毕:2个ExaFLOPS 数万个CPU和GPU 锁定Top 500榜首
阿贡国家实验室和英特尔周四表示,他们已经为Aurora超级计算机安装了所有10624个刀片,这台机器早在2015年就宣布搭建,但其过程特别坎坷。该系统可提供超过2 FP64 ExaFLOPS的峰值理论计算性能,使用其数以万计的Xeon Max 'Sapphire Rapids'CPU阵列,以及数据中心GPU Max 'Ponte Vecchio' 计算GPU。该系统将在今年晚些时候上线。
"Aurora是英特尔Max系列GPU的首次部署,是最大的基于Xeon Max CPU的系统,也是世界上最大的GPU集群,"英特尔公司副总裁兼超级计算组总经理Jeff McVeigh说。
Aurora超级计算机看起来相当令人印象深刻,即使从数字上看也是如此。该机器由21248个通用处理器提供动力,包含超过110万个内核,用于需要传统CPU马力的工作负载,还有63744个计算GPU,将用于人工智能和HPC工作负载。在内存方面,Aurora提供了1.36PB的封装HBM2E内存和19.9PB的DDR5内存,这些内存被CPU使用,以及Ponte Vecchi计算GPU携带的8.16PB的HBM2E。
Aurora机器占用166个机架,每个机架容纳66个刀片。它横跨八列,占据的空间相当于两个篮球场,这还不算Aurora的存储子系统,后者采用了1024个全闪存存储节点,提供220TB的存储容量,总带宽为31TB/s。目前,阿贡国家实验室没有公布Aurora或其存储子系统的官方耗电数字。
这台超级计算机将用于各种工作负载,从核聚变模拟到是否预测,从空气动力学到医学研究,它采用HPE的Shasta超级计算机架构和Slingshot互连。同时,在该系统通过ANL的验收测试之前,它将被用于大规模科学生成性AI模型。
阿贡国家实验室副主任里克-史蒂文斯说:"在我们努力实现验收测试的同时,我们将使用Aurora来训练一些大规模的开源科学生成性人工智能模型。Aurora拥有超过6万个英特尔Max GPU,一个非常快的I/O系统和一个全固态大容量存储系统,是训练这些模型的完美环境。"
尽管Aurora刀片已经安装完毕,这台超级计算机仍需进行并通过一系列验收测试,这是超级计算机的一个常见程序。一旦它成功通过这些测试并在今年晚些时候上线,预计它的理论性能将超过2 ExaFLOPS(每秒20亿次浮点运算)。凭借巨大的性能,它有望确保在Top500榜单中占据榜首位置。
Aurora超级计算机的安装标志着几个里程碑:它是业界第一台性能超过2 ExaFLOPS的超级计算机和第一台基于英特尔的ExaFLOPS级机器。
Aurora最初于2015年亮相,最初打算由英特尔的Xeon Phi协处理器提供动力,预计在2018年提供约180 PetaFLOPS。然而,英特尔决定放弃Xeon Phi,改用计算型GPU,导致需要与阿贡国家实验室重新谈判协议,在2021年之前提供一个EaaFLOPS系统。
由于英特尔7纳米(现在称为英特尔4)生产节点的延迟,以及必须为台积电的N5(5纳米级)工艺技术重新设计计算模组,该系统的交付被进一步推迟,因为Ponte Vecchio的复杂情况。英特尔终于在去年年底推出了数据中心GPU Max产品,现在已经向ANL运送了超过6万个这种计算GPU。