News HoreKa mit Nvidia Ampere: Neuer Supercomputer für das KIT mit 17 PetaFLOPS

SV3N schrieb:
Es wird sich mit an Sicherheit grenzender Wahrscheinlichkeit um Ice Lake SP handeln.
Könnte auch ISX-H (Ice Lake H / Knights Cove) werden. Darum ist es in letzter Zeit ziemlich still geworden. Aber als MCM mit 2 x 20 Kernen im Dual-Sockel-Betrieb würde man bei 740 Knoten mit je einer Ampere GPU-Karte etwa auf 59.200 Kerne (also quasi 60.000) kommen.
 
Ach, ich würde auch gerne mal bei so einem Supercomputeraufbau mitmachen. Arbeite aber leider im falschen Fachgebiet. Erst in der Planung und dann auch so richtig Hands on die Schränke bestücken. Packst Einschub um Einschub in die Racks und wenn du meinst du bist fertig, kommt ein Gabelstapler mit ner Eunropalette neuer Einschübe durch die Tür gefahren 😂
 
  • Gefällt mir
Reaktionen: PS828
wieviel leistung wird verschenkt dadurch das intel kein PCIe 4.0 kann? :D
 
Ich mag die HPC Nachrichten und finde es gut dass CB nicht nur 'Gamernews' bringt.
Aber @SV3N warum das hier? ^^'
[...] „HoreKa“ besitzt mit 17 Billiarden Rechenoperationen in der Sekunde die Rechenleistung von rund 150.000 Notebooks, die sich aus insgesamt 60.000 Prozessorkernen einer noch unbekannten HPC-CPU vom Typ Intel Xeon und 740 Nvidia A100 Tensor Core GPUs [...]

Hat ein Notebook auch rund 0 (0,4) CPUs? ^^
Wenn eine CPU als Vergleich angegeben wird ist das ok, aber eine Geräteklasse mit einer großen Bandbreite an Ausstattungsmöglichkeiten?

Just4fun, rechenbeispiel. GFLOPS jeweils Peak wie auch für HoreKa
Ryzen 3 2200U: 2 Kerne, 2x 256 Bit AVX, 2,5 GHz -> 40 GFLOPS+ 422 GFLOPS IGP = 462 GFLOPS
17*10^15 / 462*10^9 = 36796,5
oops, schon ein kleiner ryzen ist etwa 4 mal so schnell wie das referenznotebook das im Artikel genommen wurde. Was habt ihr da für eins genommen? O.o

Core2Duo P8400 mit einer ATI Mobility Radeon 3650: 2 Kerne, SSE4 (also 128 Bit SIMD), 2,266 GHz -> 9 GFLOPS + 60 GFLOPS Graka (theoretisch, denn die ca. 120 GFLOPS sind FP32 (120 Kerne bei ca. 500 MHz - mein Modell war noch langsamer als die referenz von ATI :()) = 69 GFLOPS
nein, das war nicht beabsichtigt O.o
17*10^15 / 69*10^9 = 246376,8
Ok, also das Referenznotebook ist immerhin schneller als mein etwa 11 jahre alter Laptop ^^

Aber wie siehts mit einem highend notebook aus?
Ryzen 7 4800H: 8 Kerne, 2x 256 Bit AVX, 2,9 GHz -> 185,6 GFLOPS + 1792 GFLOPS IGP = 1977,6 GFLOPS
17*10^15 / 1977,6*10^9 = 8596,3
Na gucke mal einer schau, nur knapp 8600 Ryzen Notebooks anstelle von 60.000 vermutlich Highend Intel CPUs + 740 Highend Nvidia GPUs.
Wenn das keine Milchmädchenrechnung ist die AMD Fans glücklich macht weiß ich auch nicht XD
Nein, man kann nicht einfach einen HPC Cluster nehmen und die reine Peakleistung mit einer losen Ansammlung an CPUs Vergleichen.
Wobei ... wenn man sowieso schon parallel rechnet, warum dann nicht CPUs mit IGP nehmen und auf jedem Node GPU Tasks laufen lassen können? Ketzerische Gedanken XD


Damit ist hoffentlich deutlich dass Vergleiche auch Sinn ergeben sollten. Allerdings fand ich es durchaus interessant was so rausgekommen ist.

Edith: falls es interessiert, die Daten habe ich Wikipedia entnommen. Faulheit und so.
 
Bigeagle schrieb:
Hat ein Notebook auch rund 0 (0,4) CPUs? ^^

Das ist der offizielle Vergleich, den das Institut selbst genutzt hat, deshalb ist er auch im Artikel gelandet.

Er bezieht sich auch weniger auf die CPUs sondern auf die Gesamtrechenleistung des Supercomputers, verglichen mit einem durchschnittlichen Notebook.
 
Mithos schrieb:
die haben ihre Bitcoin Wallet verschlüsselt und wissen das nicht mehr

Das ist natürlich schon schwer, ich glaube aber du meinst, sie kennen das PW nicht mehr.

Das ist natürlich die "beste" Form von "Sicherheit", leider für eigene Zugriffe ungeeignet. :D

Dinge zu tun oder getan zu haben (besessen zu haben) von denen man nichts mehr weis ist natürlich möglich, bringt aber immer nur anderen etwas.

btt:

17 PFlop sind echt schon viel und man muss abwarten, was sie damit wirklich berechnen wollen. Am Ende ist es aber auch nur eine von vielen neuen Maschinen, die gebaut werden.

mfg
 
@SV3N dann ist das durchschnittnotebook offenbar etwas sehr alt bei denen.
Hätte man nicht in der Form übernehmen müssen, auch wenn das vielleicht wie krümelkackerei wirkt. CB ist sonst eher für handfeste Zahlen gut anstelle von Vergleichen im Fußballfeldstil.

Ich würde auch mal vermuten dass der Vergleich schon an der Quelle falsch war weil jemand einen Cluster samt GPUs mit der reinen CPU-Leistung irgendeines Notebooks verglichen hat.
Wenn da niemand was sagt wird irgendwann die eine Graka mit Crysis gebencht, die andere mit UT2004 und dann die FPS gegenübergestellt ^^'

zumal reine peakleistung sowieso nur schwach aussagekräftig ist. Wichtig ist die doch vor allem um zusammen mit rmax zu sehen wie effizient das ganze auch ist. Trinity kommt nicht mal auf 50%.
Da hätte man z.b. noch die Bedeutung von Speicherperformance mit einflechten können.

Übrigens ist mir da glatt noch ein Fehler im Artikel selbst aufgefallen. Da ist Rmax als theoretische Spitzenleistung bezeichnet, ganz am anfang. Dort muss Rpeak hin :)
 
Zurück
Oben