News HPC-Beschleuniger: Intel Data Center GPU Max startet mit PCIe 5.0

MichaG · 11. Januar 2023

Parallel zur neuen Server-CPU-Generation Sapphire Rapids hat Intel neue GPU-basierte Rechenbeschleuniger für den Bereich High Performance Computing (HPC) eingeführt. Die Intel Data Center GPU Max genannten Karten mit PCIe 5.0 nutzen die Xe-HPC-Architektur und schnellen HBM-Speicher.

Zur News: HPC-Beschleuniger: Intel Data Center GPU Max startet mit PCIe 5.0

incurable · 11. Januar 2023

"Max" kommt in den Ausführungen "Max", "Mäxchen" und "Maxens kleine Schwester Lilly."

Chismon · 11. Januar 2023

Die Max 1550 bietet mit 128 Xe-Cores und 128 GB HBM2e

Nicht schlecht Herr Specht, der HBM2e Speicherausbau mutet irgendwie schon gigantisch an und das wird noch sehr lange dauern bis die Gaming-Grafikkarten bei 128 GB (vermutlich dann immer noch GDDR und nicht HBM Speicher) ankommen werden.

kiffmet · 11. Januar 2023

Dass es Ponte Vecchio doch noch bis zum Marktstart geschafft hat… Angeblich erhielten die Karten mindestens 3 Steppings mit jeweils etlichen Revisionen.

Phoenixxl · 11. Januar 2023

6 Mal 600W und dann 13 Mal so schnell wie ein Xeon 8380 mit 270W?
3600/270=13,3.

Sorry, aber das ist doch ein Haufen 💩

LEDs · 11. Januar 2023

@Phoenixxl nicht zu vergessen das die Grafikkarten auch noch eine CPU brauchen aber wer weiß ob die wirklich auf vollem Stromverbrauch gelaufen sind

andi_sco · 11. Januar 2023

100 Milliarden Transistoren 😵‍💫 - das sind 1.000 Grafikchips der Generation R300 von ATi von Ende 2002 - wow

Novasun · 11. Januar 2023

Sorry aber AMD klatscht auf die MI300 (eine Karte) 24 Cen4 Kerne CDNA3 und 128 GB HBM a900 Watt...

Känguru · 11. Januar 2023

"...Leistung gegenüber einem Xeon Platinum 8380 der vorherigen Generation...". Da ist es auch nicht allzu schwer größere Steigerungsraten zu erzielen. Erst der Vergleich mit der Konkurrenz wird zeigen, was der neue Chip Wert ist und wie es mit der Perf/Watt aussieht.
Wie @Phoenixxl schon ausgerechnet hat scheint die Effizienz gegenüber den alten Xeons praktisch gleich zu bleiben, wenn man für den Faktor 13 mehr als 6*600Watt verbraten muss.

Tzk · 11. Januar 2023

Phoenixxl schrieb:
Sorry, aber das ist doch ein Haufen 💩

Sieht erstmal nicht so gut aus, aber die Frage ist ob die TDP voll ausgeschöpft wurde. Und wenn man gegen den Xeon und seine TDP vergleicht, dann fehlt dort der RAM und die Spawa Verluste in der Rechnung. Bei den Beschleunigerkarten sollte das hoffentlich inkludiert sein.

Trotzdem hatte ich mehr erwartet.

andi_sco · 11. Januar 2023

MichaG schrieb:
Die Intel Data Center GPU Max

Hier kann die Leistung gegenüber einem Xeon Platinum 8380 der vorherigen Generation bereits mit einem neuen Xeon Max mit HBM um etwa 30 Prozent gesteigert werden. Wird ein Xeon Max mit HBM mit den Data Center GPUs der Max Series kombiniert, steigt die Leistung fast um den Faktor 13. Allerdings werden dafür gleich sechs GPUs benötigt.

Nennt mich Blind, aber wo steht es, das es unbedingt die 600W Variante sein muss?

Yesman9277 · 11. Januar 2023

nicht einmal ein Bild ausgegeben wird, denn die Grafikchips werden hier ausschließlich für kommerzielle oder wissenschaftliche Rechenaufgaben im Data Center genutzt

Wieso spricht man hier dann eigentlich immernoch von GPU?

TenDance · 11. Januar 2023

vermutlich aus historischen Gründen damit man weiß dass es keine x86 oder ARM-Konstruktion ist (also CISC/RISC) sondern ein SoC der für massives paralleles Arbeiten (also kurze pipelines) und Matrizen ausgelegt ist.

P.S.: wo wir bei der Auslegung sind: wofür kann man im HPC-Segment die Raytracing-Einheiten verwenden? Ja, man kann KI-Kerne und shader teilweise für Raytracing zweckentfremden, aber umgekehrt?
Oder sind Intels Raytracingkerne quasi deren KI-Einheiten?

süchtla · 11. Januar 2023

Ja, manche professionelle Software kann RT Cores verwenden. Ansys kann es zur Antennen-Simulation oder Optik-Simation.

cb-leser · 11. Januar 2023

Phoenixxl schrieb:
Sorry, aber das ist doch ein Haufen 💩

LEDs schrieb:
aber wer weiß ob die wirklich auf vollem Stromverbrauch gelaufen sind

Känguru schrieb:
Wie @Phoenixxl schon ausgerechnet hat scheint die Effizienz gegenüber den alten Xeons praktisch gleich zu bleiben, wenn man für den Faktor 13 mehr als 6*600Watt verbraten muss.

Tzk schrieb:
Sieht erstmal nicht so gut aus

Vorwarnung: Ich bin an der Stelle sicher kein Experte.

Wenn ich Text, Bild und die unterhalb des Bildes verlinkte Quelle nicht falsch verstehe, sollte im Zuge des genutzten Benchmarks insbesondere die Speichergeschwindigkeit limitieren. Der Geschwindigkeitszuwachs müsste dementsprechend hauptsächlich auf den Speicher bzw. die Kommunikationsgeschwindigkeit zurückzuführen sein. Rohe Rechenleistung an sich wäre dann ein weiteres Paar Schuhe. Die Systeme besitzen neben den sechs GPUs wohl zwei (mit Sapphire Rapids) bestückte CPU-Sockel, da werden (in einer Molekulardynamiksimulation zumindest für mich gut vorstellbar) einige Komponenten erhöhten "Redebedarf" haben.

Ansonsten sind in der Quelle noch ein paar andere Benchmarks für Sapphire Rapids / Ice Lake (also CPU-Bezug!) genannt, wo dann höhere Faktoren zwischen den Ergebnissen anliegen, als dem Bild (also Speicherbezug) zu entnehmen sind.

Ergänzung (11. Januar 2023)

P.S.:

MichaG schrieb:
Wird ein Xeon Max mit HBM mit den Data Center GPUs der Max Series kombiniert, steigt die Leistung fast um den Faktor 13. Allerdings werden dafür gleich sechs GPUs benötigt.

Es sind zwei CPUs.

Es würde mich auch wundern (siehe restlicher Text), wenn man CPU-Anzahlen mischt, auch wenn das aus der Quelle (für mich) nicht hervorgeht.

(Es geht (zugegebenermaßen) ein bisschen durcheinander mit "Combining [...] with the Max series CPU platform" und 'konkreten' "CPUs"...

Für alles "mit GPUs" steht's jedenfalls im Text, sonst wird's mit einer CPU auch bzgl. der PCIe-Lanes (80 pro CPU lt. hier:

Eine CPU liefert gleich 80 PCIe-5.0-Lanes, die abwärtskompatibel auch mit PCIe 4.0 funktionieren.

) auf sechs GPUs (mit je x16) unnötig eng. Aufbau der CPU(s)-only-Systeme sind aber hoffentlich der Vergleichbarkeit halber auch immer zwei CPUs...)

Combining the Max series GPU with the Max series CPU platform (in a three to one GPU:CPU ratio) offers a 12.9x performance boost for LAMMPS molecular dynamics workloads, compared with an Ice Lake platform without GPUs, according to benchmarking conducted by Intel. The addition of Max GPUs (six GPUs added to a 2-CPU server) translated into a 9.9x boost versus a Max series CPU-only platform for the same workload. The high bandwidth memory on the host CPUs enabled a 1.55x performance improvement compared to using DDR5 only. (Photo of demonstration given in Hillsboro, Oregon, last month.)

(Quelle wie im Artikel verlinkt; Hervorhebungen durch mich.)

Oberst08 · 11. Januar 2023

Chismon schrieb:
Nicht schlecht Herr Specht, der HBM2e Speicherausbau mutet irgendwie schon gigantisch an und das wird noch sehr lange dauern bis die Gaming-Grafikkarten bei 128 GB (vermutlich dann immer noch GDDR und nicht HBM Speicher) ankommen werden.

Naja, ist aber nichts besonderes. AMDs Instinct MI250X hat auch 128GB und ist seit gut einem Jahr auf dem Markt. Die HPC Beschleuniger haben immer mehr VRAM als die Gamer Dinger.

BAR86 · 12. Januar 2023

Chismon schrieb:
Nicht schlecht Herr Specht, der HBM2e Speicherausbau mutet irgendwie schon gigantisch an und das wird noch sehr lange dauern bis die Gaming-Grafikkarten bei 128 GB (vermutlich dann immer noch GDDR und nicht HBM Speicher) ankommen werden.

ok, aber hat leider nix mit Server zu tun

madmax2010 · 12. Januar 2023

incurable schrieb:
"Max" kommt in den Ausführungen "Max", "Mäxchen" und "Maxens kleine Schwester Lilly."

Hanlo I Bims

Ergänzung (12. Januar 2023)

andi_sco schrieb:
100 Milliarden Transistoren 😵‍💫 - das sind 1.000 Grafikchips der Generation R300 von ATi von Ende 2002 - wow

ich erinnere mich noch, wie ich als sehr junger Teenager in einer c't gelesen habe. Ein langer Artikel ueber die erste CPU mit mehr als einer Miliarde Transistoren. Ein Itanium mit 2 Kerben.
Oh Wow. die R300 war die 1. mit 100 Mio und noch in 150nm
Heute stecken Milliarden in Smartphone SOCs. Immer wieder faszinierend.
und alles haengt nis heute am takt von, fies gesagt, geschliffenen Quartzkristallen dieals tsktgeber dienen.

_vicious_ · 12. Januar 2023

Glued together "a la Intel"

Sieht für mich wie Pfusch am Bau aus 🤣

Seriousjonny007 · 12. Januar 2023

Also der Xeon Max mit HBM ist ~30% schneller als der Xeon Platinum 8380.
Blöd nur das der nur halb so teure EPYC 7763 (€4200) ~38% schneller ist als ein Xeon Platinum 8380 (€9100).
Wenn man den gleich teuren Epyc 9654 (€8600,-) vergleicht dann sind wir schon bei 60-100% Vorsprung für den Epyc.
Molecular Dynamics and Parallel Compute Benchmarks

Also bin ich mit einem Server mit 8 Epyc 9654 schon schneller unterwegs als mit einem Xeon Max mit HBM + 6x Max 1550 GPU´s.

News HPC-Beschleuniger: Intel Data Center GPU Max startet mit PCIe 5.0

Redakteur

Captain

Admiral

Lt. Commander

Lieutenant

Cadet 4th Year

Legends of Tomorrow

Commander

Ensign Pro

Commodore

Legends of Tomorrow

Lt. Commander

Commodore

Lieutenant

Lt. Commander

Lieutenant

Commander

Fleet Admiral

Lt. Commander

Lieutenant

Ähnliche Themen