Server-CPUs: AMD Bergamo bietet 128 Kerne auch ohne SMT
Es ist soweit: AMD macht heute die ersten 128-Kern-x86-Prozessoren für Server offiziell und legt damit die Messlatte sowie den Vorsprung in puncto Kerndichte pro Sockel noch ein gutes Stück höher. Doppelt so viele Kerne pro Chiplet bedeuten aber nur halb so viel L3-Cache pro Kern. Für Überraschung sorgt ein Modell ohne SMT.
AMD hatte die Server-CPU-Familie Bergamo als einen neuen, auf möglichst viele Kerne ausgelegten Ableger der Zen-4-Architektur bereits vor einem Jahr für das erste Halbjahr 2023 angekündigt. Der Zeitplan wird mit der Vorstellung heute im Rahmen der „AMD Data Center and AI Technology Premiere“ also geradeso eingehalten.
Dreimal Bergamo, einmal ohne SMT
Bergamo kommt in drei Varianten auf den Markt: Das Flaggschiff mit 128 Kernen und 256 Threads ist der AMD Epyc 9754, der mit 2,25 GHz bis 3,10 GHz arbeitet und eine TDP von 360 Watt besitzt. Der Epyc 9754S bietet die gleichen Eckdaten mit einem wesentlichen Unterschied: Nur 128 Threads bedeuten, dass bei ihm kein Simultaneous Multithreading (SMT) genutzt wird. Beim Epyc 9734 stehen noch 112 Kerne und 224 Threads zur Verfügung. Da der L3-Cache unverändert 256 MB beträgt, ist der Einsatz von Chiplets mit teils defekten respektive deaktivierten Kernen denkbar. Der All-Core-Boost und der maximale Boost sind bei jedem Modell identisch, hier zeigt sich die gestiegene Effizienz gegenüber Genoa, bei denen der All-Core-Boost stets geringer ist. Dafür taktet Genoa einzelne Kerne deutlich höher.
CPU | Architektur | Codename | CCDs | Kerne/ Threads |
L3-Cache | Basistakt | All-Core Boost | Max. Boost | TDP |
---|---|---|---|---|---|---|---|---|---|
Epyc 9754 | Zen 4c | Bergamo | 8 | 128/256 | 256 MB | 2,25 GHz | 3,10 GHz | 3,10 GHz | 360 Watt |
Epyc 9754S | Zen 4c | Bergamo | 8 | 128/128 | 256 MB | 2,25 GHz | 3,10 GHz | 3,10 GHz | 360 Watt |
Epyc 9734 | Zen 4c | Bergamo | 8 | 112/224 | 256 MB | 2,20 GHz | 3,00 GHz | 3,00 GHz | 340 Watt |
16 Kerne pro CCD, I/O wie Genoa
Unverändert ist der Multi-Chip-Ansatz, bei dem die CPU-Kerne in sogenannten Chiplets um den großen I/O-Chip, der gleiche wie bei Genoa, in der Mitte auf dem Package platziert sind. Gegenüber Genoa wird die Zahl der Kerne pro Chiplet aber verdoppelt: Statt 8 stecken nun 16 Kerne in einem CCD. Der L3-Cache wird aber nicht verdoppelt, sodass pro CCD weiterhin 16 MByte zur Verfügung stehen. Das bedeutet im Umkehrschluss einen halbierten L3-Cache pro Kern. Bergamo hat mit doppelt so vielen Kernen genauso viel L3-Cache wie Genoa. Die Zahl der Transistoren beziffert AMD auf 82 Milliarden bei Bergamo.
Zen 4c statt Zen 4
Bei Bergamo spricht AMD nicht mehr von Zen 4, sondern von Zen 4c (C wie Cloud). Dabei soll es sich um eine verbesserte Version der Zen-4-Kerne handeln, die trotz gleicher 5-nm-Fertigung kleiner ausfallen. So sinkt die nötige Chipfläche von 3,84 mm² für einen Kern samt L2-Cache bei Genoa auf nur noch 2,48 mm² bei Bergamo. Die Fläche ist somit um rund 35 Prozent kleiner. Eine im Vorfeld veröffentlichte Analyse zu Bergamo trifft hier ins Schwarze.
Während Zen 4 auf maximale Leistung pro Kern ausgelegt sei, soll Zen 4c die beste Balance aus Leistung und Leistungsaufnahme bieten; AMD-CEO Lisa Su sprach vom Sweet Spot aus Performance und Power. Die Dichte wie auch die Energieeffizienz seien besser als bei Genoa. Zudem sei der L3-Cache auf größeren Durchsatz optimiert worden. In puncto Software und Sockel wird die volle Kompatibilität zur Genoa-Plattform beibehalten.
Benchmarks
In eigens ausgewählten Disziplinen ließ AMD den neuen Epyc 9754 mit 128 Kernen gegen Intels Xeon Platinum 8490H antreten, der lediglich 60 Kerne bietet; mehr hat Intels aktuelle Generation Sapphire Rapids nicht vorzuweisen. Von einem Leistungsvorsprung von 60 Prozent in der In-Memory-Datenbank Redis bis zu 160 Prozent mehr Leistung beim NGINX Web-Front-End reicht die Palette der Benchmarks. Wie immer sind diese Marketing-Folien mit gesunder Skepsis zu betrachten, denn Hersteller picken gerne die Rosinen heraus. Bei Container-Dichte und Java-Operationen pro Watt soll die Intel-CPU um den Faktor 2 übertroffen werden.
AMD vergleicht den Epyc 9754 auch mit dem Ampere Altra Max mit ebenfalls 128 Kernen und will diesen Chip bei der Energieeffizienz weit schlagen, wie die nachfolgenden Videos zeigen sollen.
AMD hat außerdem die erwarteten Genoa-X mit zusätzlichen 3D-V-Cache vorgestellt und Details zum GPU-Beschleuniger MI300X mit 192 GB HBM3 für den HPC-Sektor verraten. Über diese Neuheiten wird ComputerBase gesondert berichten.