Supercomputer NERSC-9: Perlmutter erhält AMD Milan und Nvidia Ampere
Gegen Ende des Jahres soll die erste Ausbaustufe des am National Energy Research Scientific Computing Center im US-Bundesstaat Kalifornien entstehenden Supercomputers „Perlmutter“ (NERSC-9) fertig sein. Sie umfasst Milan-Prozessoren (Zen 3) von AMD sowie Ampere-GPUs von Nvidia. In Phase 2 kommen weitere Milan-CPUs hinzu.
Im Oktober 2018 wurden die Pläne zum Bau des Systems bekannt, das nach dem Astrophysiker und Nobelpreisträger Dr. Saul Perlmutter benannt ist. Doch erst Mitte April 2020 wurde der Bauauftrag an den Supercomputer-Hersteller Cray, der seit September 2019 zu HPE gehört, vertraglich festgehalten. Welche Komponenten das System erhalten wird, konkretisiert die jüngste Ankündigung des NERSC.
Perlmutter entsteht in zwei Phasen
Sofern alles nach Zeitplan verläuft, soll Ende 2020 Phase 1 der Arbeiten abgeschlossen sein. Dann soll das System pro Rechenknoten (Node) je vier GPUs aus Nvidias neuer Generation Ampere sowie eine CPU aus AMDs kommender CPU-Generation Milan in der Epyc-Serie erhalten. Die Rede ist von über 6.000 GPUs, was für mehr als 1.500 Nodes und somit über 1.500 Milan-CPUs spricht.
Namentlich wird Nvidia Ampere zwar nicht genannt, stattdessen ist von „Volta-Next“ die Rede, doch ist es nur noch ein offenes Geheimnis, dass die neue GPU-Generation bei Nvidia diesen Namen trägt. Noch im Mai könnte die neue GPU-Architektur Ampere in der nachgeholten GTC 2020 Keynote vom Nvidia-CEO angekündigt werden. AMD Milan steht wiederum schon lange in öffentlichen Roadmaps und basiert auf der inzwischen dritten Generation der erfolgreichen Zen-Architektur.
Während in Phase 1 die GPU-basierten Rechenbeschleuniger von Nvidia im Fokus stehen, folgen in Phase 2 zusätzlich reine CPU-Nodes. Voraussichtlich Mitte 2021 soll Perlmutter mehr als 3.000 weitere Nodes mit je zwei Milan-CPUs sowie je 512 GB RAM erhalten. Mit diesen mehr als 6.000 CPUs käme das System dann auf insgesamt über 7.500 AMD-Prozessoren. Die angepeilte Rechenleistung dürfte aber vor allem durch die Nvidia-GPUs ermöglicht werden. Perlmutter soll laut den Betreibern 3 bis 4 Mal so schnell wie das ältere System Cori (NERSC-8) werden, das in der letzten Ausgabe der Top500 mit rund 14 PetaFLOPS (Rmax) den 13. Platz unter den weltweit schnellsten Supercomputern erreichte. NERSC dürfte aber mit dem Rpeak-Wert von knapp 28 PetaFLOPS für Cori rechnen, denn früher waren bereits mindestens 100 PetaFLOPS im Gespräch.
35 PB NVMe-Flash-Speicher und Flüssigkühlung
Auch an schnellem Massenspeicher wird es nicht mangeln, denn geplant ist eine All-Flash-Plattform (ClusterStor E1000) mit insgesamt 35 PetaByte Speichervolumen und einer Datenrate von über 5 Terabyte pro Sekunde. Beim Kühlsystem von Perlmutter ist von einer direkten Flüssigkeitskühlung die Rede. Das fertige System soll sich auf 24 Rechenschränke (Cabinets) verteilen, jede Phase umfasst 12 Cabinets.
Wissenschaftler sollen Perlmutter vorwiegend für GPU-beschleunigtes Rechnen wie Simulationen und Datenanalysen nutzen. Nähere Informationen zu den eingesetzten CPUs und GPUs sollen in den kommenden Wochen bekannt gegeben werden.
Das Titelbild der Meldung zeigt die Shyh Wang Hall des Berkeley Lab, die in den unteren Etagen die NERSC-Supercomputer beherbergt.