Intel Data Center GPU Max: Ponte Vecchio startet für Supercomputer in 3 Varianten
Intel bringt auf Basis der Xe-HPC-GPU Ponte Vecchio drei Varianten für Supercomputer auf den Markt, eine davon als klassische 300-Watt-PCIe-Karte. Das Hauptaugenmerk liegt aber auf den OAM-Modulen, die mit 450 oder gar 600 Watt wesentlich leistungsstärker ausfallen. Auch an den Nachfolger Rialto Bridge wurde bereits gedacht.
Offiziell geredet wird über Ponte Vecchio seit über zwei Jahren, nun geht die für Supercomputer aufgelegte Xe-HPC-GPU an den Start. Mit dabei ist nicht nur der große Vorzeigechip mit seinen 47 Tiles und dadurch laut einer früheren Angabe mehr als 100 Milliarden Transistoren, sondern überraschenderweise auch eine kleinere, quasi halbe Variante.
Drei Modellvarianten zum Start
Drei Varianten wird Intel zum Auftakt auflegen:
- Max Series 1100 GPU: 300-Watt-PCIe-Karte mit 56 Xe-Kernen und 48 GB HBM2e
- Max Series 1350 GPU: 450-Watt-OAM-Modul mit 112 Xe-Kernen und 96 GB HBM.
- Max Series 1550 GPU: 600-Watt-OAM-Modul mit 128 Xe-Kernen und 128 GB HBM.
Auf Nachfrage erklärte Intel, dass bei der PCIe-Karte quasi ein halber Chip genutzt wird. In der Fachsprache heißt das, dass die GPU 1 Stack nutzt, der volle Ausbau hingegen nutzt 2 Stacks.
Alle nachfolgend von Intel dargebotenen Zahlen beziehen sich stets auf das 2-Stack-Design im Vollausbau, die PCIe-Karte bietet hingegen physisch exakt die Hälfte: Maximal 64 Kerne und 204 MByte L2-Cache, auch der HBM-Speicher wird halbiert. Auf der Beschleuniger-Karte wird letztlich aber nicht der Vollausbau dieses halben Chips umgesetzt, sondern eine leicht abgespeckte Variante mit 56 Kernen und 48 GByte HBM.
Imposanter Vollausbau mit hoher Leistung
In nackten Zahlen ausgedrückt bleibt der Vollausbau extrem beeindruckend, nicht nur bei der Anzahl an Transistoren & Co. Besonders gerne führt Intel die verschiedenen Caches an, nicht nur den 64 MByte großen L1-Cache, sondern vor allem auch den L2-Cache, der insgesamt bis zu 408 MByte groß sein kann. Dass dieser Cache Leistungsvorteile bringen, untermautert Intel mit einem ausgewählten Test.
Das Ziel, das die ausgewogene Hierarchie aus Register-Files, Cache und HBM verfolgt, ist dasselbe wie auch bei den Prozessoren der neuen Xeon-Max-Serie mit HBM: Daten sollen näher an den Kernen gehalten werden, sodass sie schneller zur Verfügung stehen und bearbeitet werden können. In diesen Fällen schafft es diese GPU-Lösung problemlos mit einer Nvidia A100 fertig zu werden, will Intel vermitteln. In den gezeigten Benchmarks hilft dabei allerdings auch, dass Nvidias Ampere-Alternative zum Teil nur mit 40 GByte ausgestattet ist, was einmal mehr deutlich macht, dass Herstellerbenchmarks stets mit Vorsicht zu genießen sind.
Das betrifft auch einen weiteren Aspekt: Der wahre Gegner für Ponte Vecchio heißt vermutlich Nvidia Hopper in Form der H100-GPU. Das Aufeinandertreffen beider Lösungen findet am freien Markt aber erst im Jahr 2023 statt, denn alle Max-Beschleunigerlösungen sollen für jedermann erst ab Januar 2023 verfügbar werden. Die ersten ausgelieferten GPUs wandern auch in diesem Fall in die Nodes für den Aurora-Supercomputer, die Arbeiten daran laufen bereits.
Der Nachfolger Rialto Bridge kommt erst 2024
Auch zum Nachfolger hatte Intel heute einige Informationen im Gepäck, wenngleich diese zum Großteil bereits im Rahmen des letzten Supercomputer-Events Ende Mai in Hamburg genannt wurden. Neu ist, dass die nächste Generation als OAM-Modul bis zu 800 Watt TDP aufweisen wird.
Und auch zum Termin gab es eine Neuigkeit: Statt Mitte 2023, wie es noch im Mai dieses Jahres hieß, kommt der Chip deutlich später im Jahr 2024. Das dürfte einerseits an der langen Verzögerung von Ponte Vecchio liegen, die nun de facto ja auch erst 2023 erscheinen, aber auch am Optimierungspotenzial der Lösungen.
ComputerBase hat Informationen zu diesem Artikel von Intel unter NDA erhalten. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.