Aurora 超级计算机向全球科学界开放,模拟计算能力超 1 FP64 ExaFLOPS

Aurora早在2015年就已公布,但因多次延迟才终于完成。现在,它能够提供超过1 FP64 ExaFLOPS的模拟计算能力,并能为人工智能和机器学习提供11.6混合精度ExaFLOPS的性能。

据 Tom's Hardware 今日报道,美国阿贡国家实验室宣布,其 Aurora 超级计算机现已全面投入使用,并正式向全球科学界开放。Aurora 早在 2015 年就已公布,但因多次延迟才终于完成。它能够提供超过 1 FP64 ExaFLOPS 的模拟计算能力,并能为人工智能和机器学习提供 11.6 混合精度 ExaFLOPS 的性能。

Aurora 超级计算机向全球科学界开放,模拟计算能力超 1 FP64 ExaFLOPS

据AI在线了解,Aurora 原定于 2018 年完成,但由于英特尔停产了 Xeon Phi 处理器,项目进展受阻。随后,因英特尔 7nm 工艺的延迟,Aurora 的开发经历了多次推迟,最终推迟至 2023 年才完成。

尽管硬件在 2023 年 6 月安装完成,但系统直到 2024 年 5 月才真正达到了 Exascale 性能,且在此之前,系统仅对少数选定研究人员开放。据 HPL-MxP 基准测试,Aurora 能够实现 11.6 混合精度 ExaFLOPS。

它由 166 个机架组成,每个机架包含 64 个计算节点,总计 10624 个计算节点。每个节点配备两个 Xeon Max 处理器和 64GB HBM2E 内存,并搭载六个英特尔数据中心 Max“Ponte Vecchio” GPU,所有设备通过液冷系统进行高效散热。

Aurora 超级计算机向全球科学界开放,模拟计算能力超 1 FP64 ExaFLOPS

Aurora 拥有 21248 个 CPU,110 万个 x86 核心,配备 19.9PB 的 DDR5 内存和 1.36PB HBM2E 内存。它还配备了 63744 个 AI 和 HPC 优化的 GPU,总共配备 8.16PB 的 HBM2E 内存。系统使用 1024 个节点,配有 220PB 的存储容量和 31TB/s 的带宽,并采用 HPE 的 Shasta 架构与 Slingshot 互连技术。

相关资讯

全球首台百亿亿级超算用AMD的GPU:性能增7倍,能效提升3倍

E 级超算,每秒钟百亿亿次运算,1 后面跟 18 个零。

ASC22世界超算大赛启动会举行,中国科学技术大学成为大赛东道主

ASC22总决赛将于今年5月7日-11日在位于合肥的中国科学技术大学举行。

在富岳超算上训练大模型,日本联合研究团队发布 Fugaku-LLM

由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。该模型的最大特色就是其是在 Arm 架构超算“富岳”上训练的。Fugaku-LLM 模型的开发于 2023 年 5 月启动,初期参与方包括富岳超算所有者富士通、东京工业大学、日本东北大学和日本理化学研究所(理研)。而在 2023 年 8 月,另外三家合作方 —— 名古屋大学、CyberAgent(也是游戏企业 Cygames 的母公司)和 HPC-AI 领域创企 Kotoba Technologies 也加入了该模型研发计划。▲ 富岳超