News Supercomputer: KIT nimmt drei Nvidia DGX A100 in Betrieb

nlr

Redakteur
Teammitglied
Registriert
Sep. 2005
Beiträge
10.352
  • Gefällt mir
Reaktionen: yummycandy, konkretor und Gizzmow
Wieso nutzen die jetzt ein System mit Rome-CPUs als Grundlage (was ich ja super finde) um u.a. Anwendungen zu optimieren, die später auf einem Xeon-basierten System (was ich unverständlich finde, aber ja auch keinen Einblick in die Entscheidung habe) laufen?
 
  • Gefällt mir
Reaktionen: Schorsch92
@janer77
Weil das gekaufte System von NV nun mal auf Epyc und PCIE 4.0 und dessen Lanes aufbaut.
Bei Intel ist das aktuell noch nicht möglich.
 
  • Gefällt mir
Reaktionen: noxcivi und rockfake
@janer77 Ganz einfach: Der DGX A100 Server ist ein Fertiges System von nvidia, welcher mit Rome ausgerüstet ist. Für dieses Szenario, man schaue sich auch die internen und externen Bandbreiten an, wird PCIe 4.0 benötigt. Dies steht erst bei der nächsten Xeon SP Generation (voraussichtlich Q4 2020) bereit. In diesen Servern werden die nvidia´s den Bärenanteil der Rechenleistung ausmachen, dass heißt es wird auf die nvidia GPUs optimiert. Ob Xeon oder Epyc dürfte da nicht so wichtig sein. Wichtig ist aber: Jetzt mit den Software Optimierungen zu beginnen und das wird natürlich nur mit Testhardware möglich sein.
 
  • Gefällt mir
Reaktionen: bensen
janer77 schrieb:
Wieso nutzen die jetzt ein System mit Rome-CPUs als Grundlage (was ich ja super finde) um u.a. Anwendungen zu optimieren, die später auf einem Xeon-basierten System (was ich unverständlich finde, aber ja auch keinen Einblick in die Entscheidung habe) laufen?

Da geht es wohl mehr um die Optimierungen für A100.
 
  • Gefällt mir
Reaktionen: BrollyLSSJ
Ich suche einen Fluchtwagenfahrer in Karlsruhe, Bezahlung ist eins der Systeme :)
 
  • Gefällt mir
Reaktionen: cryoman, daRocket, Firezeed und 20 andere
Muss ich doch glatt mal nachschauen, ob mein ehemaliger Mittarbeiteraccount mir Zugang zum Server ermöglicht. Die sind bestimmt schön .. ähm .. anzuschauen.
Schließe mich der Suche von @john.smiles an.
 
  • Gefällt mir
Reaktionen: Lahire690 und s0UL1
Ohh, neues Spielzeug aufm Schulhof:D

Dass es Zeit wird, Stuttgart auszustechen, muss ich wohl nicht erwähnen^^
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: [moses] und ZuseZ3
Wurde ja auch langsam Zeit. Kann wohl kaum sein, dass nur ich den schnellsten Rechner in Deutschland besitze :daumen: :lol:.
 
john.smiles schrieb:
Ich suche einen Fluchtwagenfahrer in Karlsruhe, Bezahlung ist eins der Systeme :)

Aber man braucht doch mindestens 2 für SLI :D
 
janer77 schrieb:
Wieso nutzen die jetzt ein System mit Rome-CPUs als Grundlage um u.a. Anwendungen zu optimieren, die später auf einem Xeon-basierten System

Die DGX A100, auch die noch anzuschaffenden, kommen alle mit Epyc. Wie schon angesprochen sind fertige Systeme von Nvidia die eben Epyc verbaut haben (u.a. wegen PCIe4). Die 60.000 Xeons sind ein anderer Rechner, auf dem wohl nicht mit GPUs gerechnet wird sondern dessen CPUs die Hauptrechenlast tragen (ähnlich wie bei Hawk). Wenn das Ding hauptsächlich für ML und KI gebaut wird, und danach klingt es ja, dann haben die Xeons da aktuell noch diverse Vorteile bei den SIMD Extensions, die, je nach Anwendung eine Rolle spielen können oder eben auch nicht.
 
  • Gefällt mir
Reaktionen: s0UL1
Jetzt erobert der "Gold-and-Diamonds Bling-Bling" nach irgendwelchen Billig-Klapphandys mit Putin-Relieff, 23 Zoll-SUV-Felgen und Goldfolie beklebten Escobar-I-Phones schließlich und endlich auch die Serverschränke in Universitäten und Industriehallen und das ganz ohne seinen kleinen Bruder namens RGB? :mussweg:
 
john.smiles schrieb:
Ich suche einen Fluchtwagenfahrer in Karlsruhe, Bezahlung ist eins der Systeme :)

Reicht ein Astra mit 90 PS? 😁 Anfahrt wird extra berechnet 👌🤪
 
pipip schrieb:
@janer77
Weil das gekaufte System von NV nun mal auf Epyc und PCIE 4.0 und dessen Lanes aufbaut.
Bei Intel ist das aktuell noch nicht möglich.

Dieser Satz geht runter wie Öl... 😁
Ergänzung ()

john.smiles schrieb:
Ich suche einen Fluchtwagenfahrer in Karlsruhe, Bezahlung ist eins der Systeme :)
Du weißt aber schon wie das Enden wird... Wie mit den Bankräubern die Richtung Verfassungsgericht geflohen sind.... (ich nur die waren nicht von hier...)
Niedergestreckt durch MP Feuer.... :utbiorifle::o
Fast egal in welche Richtung du flüchtest... Du kommst irgendwo an starker Polizei Präsenz vorbei...
 
Zuletzt bearbeitet:
Hammer, but can it run Crysis?
 
  • Gefällt mir
Reaktionen: Schorsch92, Coenzym und IgorGlock
Also wegen drei Systemen mit gerade mal 24 GPUs so nen Aufriss...

NVIDIA versteht echt was von Marketing
 
  • Gefällt mir
Reaktionen: TheGreatMM
dalaidrama schrieb:
Jetzt erobert der "Gold-and-Diamonds Bling-Bling" [...] endlich auch die Serverschränke in Universitäten und Industriehallen [...][.]:mussweg:
sc0repi0 schrieb:
Uff, am KIT. [...]

Es scheint sich um eine Art Vorbereitungsplattform für das nachfolgende A100 System zu handeln. Gegen 740 A100 sind die drei DGX-A100-Systeme kostentechnisch vermutlich eher ein Tropfen auf dem heißen Stein.
Wenn man dafür dann aber das große System direkt vernünftig nutzen kann, ist dessen Nutzwert von Anfang an wesentlich höher. Das Konzept gefällt mir besser als GPU-Cluster, die lange Zeit ungenutzt herumstehen, weil keine Software darauf angepasst werden konnte.
Außerdem gibt es Anwendungen die einfacher auf ein solches System mit niedrigen Latenzen und hohen Bandbreiten zu optimieren sind als auf ein großes System mit kompliziertem Interconnect. Ist natürlich nur Spekulation, da ich keine Ahnung habe wie die finale Konfiguration aussehen wird.

Am Ende gilt hier sicherlich nicht "The more you buy, the more you save", aber eine offensichtliche Verschwendung von Geldern kann ich hier nicht erkennen. Austauschbare Frontblenden wären auch wieder ein Kostenfaktor. ;)
 
john.smiles schrieb:
Ich suche einen Fluchtwagenfahrer in Karlsruhe, Bezahlung ist eins der Systeme :)

Die Polizei braucht nur nach dem Ursprung des Blackouts in der Stadt zu suchen wenn du den das erste einschaltest. :)

Also wozu die Mühe mit dem Fluchtwagen? Schubkarre reicht. Vorzugsweise den der genutzt wurde, um die Goldmünze rauszukarren. :)

Ich kann kaum erwarten, dass wir diese Leistung in einer der zukünftigen Spielekonsole verpackt unter dem TV stellen können.
 
  • Gefällt mir
Reaktionen: Langsuan
Zurück
Oben