AMD CDNA: Profi-GPU mit angeblich viel Takt zum Jahresende
AMD wird mit RDNA 2 zum Ende des Jahres neue Spieler-Grafikkarten im High-End-Segment vorstellen. Ebenso wird es mit CDNA auch neue professionelle Lösungen geben, wie AMDs CEO Lisa Su vor wenigen Tagen erneut bestätigt hat. Nun sind zwei angebliche Folien zu CDNA beziehungsweise der Radeon Instinct MI100 „Arcturus“ aufgetaucht.
Die Folien sind bei der Gerüchteküche AdoredTV aufgetaucht, die zwar schon einige Treffer landen konnte, aber genauso einige heftige Bruchlandungen bei Spekulationen hinnehmen musste. Entsprechend ist, wie gewohnt, große Vorsicht bei den Hinweis-Häppchen geboten. Vier Folien werden gezeigt, von denen zwei realitätsnah wirken, die zwei anderen jedoch äußerst zusammengebaut aussehen. Die zwei fragwürdigen Folien werden von der Redaktion daher gänzlich ignoriert.
Mehr als 2 GHz Takt müsste es geben
Die zwei Folien zeigen einige Eckdaten zu einer 2-CPU-Lösung mit insgesamt 4 Radeon Instinct MI100 für den HPC-Sektor sowie einer 2-CPU-Lösung mit insgesamt 8 Radeon Instinct MI100 für ML Training. Zu beiden Lösungen werden sowohl die theoretische FP32-Rechenleistung als auch Speicherbandbreite und Speichermenge angegeben, sodass sich daraus die mögliche Konfiguration für eine einzelne Radeon Instinct MI100 beziehungsweise der ersten CDNA-GPU Arcturus ableiten lässt.
Das System mit vier Beschleunigern ist mit 136 TFLOPS angegeben, das mit 8 Beschleunigern mit 272 TFLOPS. Die Radeon Instinct MI100 arbeitet auf beiden Systemen daher gleich, entsprechend liefert ein einzelner Beschleuniger 34 FP32-TFLOPS. Wenn man davon ausgeht, dass die Folien echt sind, müsste die Radeon Instinct MI100 daher wie von den bisherigen Spekulationen vermutet mit mindestens 8.192 ALUs daher kommt, anders wäre die Rechenleistung nicht zu erreichen. Und selbst dann müsste der Takt immer noch bei sehr hohen 2,1 GHz liegen. Das erscheint auf den ersten Blick für die Vega-Architektur bei so vielen ALUs als extrem hoch, doch soll auch die Gaming-GPU Navi 21 auf Basis von RDNA 2 deutlich höher takten als bis jetzt. Die PlayStation 5 Pro mit eben RDNA 2 macht dies vor, die mit bis zu 2,23 GHz arbeitet.
Eine Speicherbandbreite von 4,9 TB/s bei einem Speicherausbau von 128 GB bietet das 4-GPU-System, das mit 8 GPUs entsprechend 9,8 TB/s bei 256 GB. Eine einzelne Radeon Instinct MI100 würde damit über 32 GB HBM2-Speicher verfügen, der mit 1,2 GHz Takt arbeitet. So ergeben sich die benötigten 1,2 TB/s Bandbreite pro Beschleuniger.
Vorteile bei FP32, Nachteile beim KI-Training
Die klassische FP32-Performance der Radeon Instinct MI100 soll bei einer TDP von 300 Watt höher als bei Nvidias A100 auf Basis von Ampere ausfallen, was aufgrund der angeblichen Spezifikationen auch nicht verwundert. Zugleich soll die AMD-Lösung günstiger sein. Kommen dagegen Matrizen-Berechnungen zum Einsatz, wie sie bei einem neuronalen Netzwerk genutzt werden, wäre Nvidias A100 dagegen unabhängig von der Präzision deutlich schneller als das Radeon-Gegenstück.
Es gibt auch ein Erscheinungsdatum. So soll das System mit 4 Radeon Instinct MI100 und einem Epyc-Prozessor auf Basis von Rome oder Milan ab Dezember und damit wie versprochen noch in diesem Jahr verfügbar sein. Dieselbe Variante mit einer Xeon-CPU von Intel soll dagegen erst im Februar 2021 aufschlagen, die Lösung mit 8 GPUs und Rome oder Milan im März 2021.