位于芬兰卡亚尼欧洲高性能计算中心(Euro HPC / CSC)的 LUMI 系统以 379.70 PFlop / s 的 HPL 分数获得第五名的成绩。该系统也是欧洲最大的超算系统,已经历过多次升级,因此仍可保持在榜单前列,这一次相比上次榜单公布时的 309.10 PFlop / s HPL 分数有所提升。
值得一提的是,欧洲高性能计算联合组织(EuroHPC JU)正在汇集欧洲资源,开发用于处理大数据的顶级百亿亿次超级计算机。LUMI 是位于芬兰卡亚尼 CSC 数据中心的一个泛欧前百亿亿次超级计算机之一。
总的来说,中国和美国在整个 TOP500 榜单上占据了大部分席位,其中美国的领先优势从上一届榜单的 150 个系统增加到本次榜单的 161 个,而中国则从 134 个下降到 104 个(IT之家注:我国已长时间没有为更强系统提交测试基准)。
此外,GREEN500 排名第一的位置仍然是美国纽约熨斗研究所的 Henri。该系统的能效等级为 65.40 GFlops / Watt,同时 HPL 得分为 2.88 PFlops / s。Henri 是一台联想 ThinkSystem SR670,配备 Intel Xeon Platinum 和 NVIDIA H100,共有 8,288 个核心,在 TOP500 排行榜上排名第 293 位。
以下是 TOP500 前 10 名摘要:
- Frontier 排名第一,该系统是美国第一个性能超过 1 Exaflop/s的系统,位于美国田纳西州橡树岭国家实验室(ORNL),它使用了 8,699,904 个核心,目前实现了 1.194 Exaflop/s的性能。它基于 HPE Cray EX 架构,结合了第三代 AMD EPYC CPU(针对 HPC 和 AI 优化)、AMD Instinct 250X 加速器以及 Slingshot-11 互连。
- Aurora 以 585 Pflop/s的 HPL 分数位列第二。它安装在美国伊利诺伊州阿贡领导计算中心,基于 HPE Cray EX,使用 Intel Xeon CPU Max 系列处理器、Intel 数据中心 GPU Max 系列加速器以及 Slingshot-11 互连。
- 排名第三的 Eagle 安装于微软 Azure 云中,这个 Microsoft NDv5 系统基于 Xeon Platinum 8480C 处理器和 NVIDIA H100 加速器,实现了 561 Pflop/s的 HPL 分数。
- Fugaku 排名第四,安装在日本神户的 RIKEN 计算科学中心(R-CCS)。它具有 7,630,848 个核心,能够实现 442 Pflop/s的 HPL 基准分数。
- LUMI 系统是升级后的 HPE Cray EX 系统,安装在芬兰 CSC EuroHPC 中心的 EuroHPC 中心,现在排名第五,性能为 380 Pflop/s。
- 排名第六的 Leonardo 系统安装在意大利 CINECA 的一个 EuroHPC 站点上。它是一个 Atos BullSequana XH2000 系统,主处理器为 Xeon Platinum 8358 32C 2.6GHz,加速器为 NVIDIA A100 SXM4 40 GB,采用四轨 NVIDIA HDR100 Infiniband 作为互连,Linpack 性能达 238.7 Pflop/s。
- Summit 由 IBM 打造,位于田纳西州橡树岭国家实验室(ORNL),目前在 HPL 基准测试中排名全球第七,性能为 148.8 Pflop/s,拥有 4,356 个节点,每个节点配备两个 POWER9 CPU(每个具有 22 个核心)和六个 NVIDIA Tesla V100 GPU(每个含有 80 个 SM),通过 Mellanox 双轨 EDR InfiniBand 网络保持连接。
- 第八名的 MareNostrum 5 ACC 是新安装的超算系统,位于西班牙 EuroHPC / 巴塞罗那超级计算中心。这个 BullSequana XH3000 系统使用 Xeon Platinum 8460Y 处理器以及 NVIDIA H100 和 Infiniband NDR200,实现了 183.2 Pflop/s的 HPL 性能。
- 排名第九的新 Eos 系统是 NVIDIA 打造的基于 NVIDIA DGX SuperPOD 的系统,基于配备 Xeon Platinum 8480C 处理器、NVIDIA H100 加速器和 Infiniband NDR400 的 NVIDIA DGX H100,实现了 121.4 Pflop/s的性能。
- 位于加利福尼亚州劳伦斯利弗莫尔国家实验室的 Sierra 系统排名第十。它的架构与排名第七的系统 Summit 非常相似。它由 4,320 个节点组成,每个节点配备两个 POWER9 CPU 和四个 NVIDIA Tesla V100 GPU,可实现 94.6 Pflop/s的性能。
(IT之家)