Bericht Nvidia Ampere: A100 ist für KI eine 20 Mal schnellere GPU

nlr · 14. Mai 2020

tl;dr: Nvidia hat erste Details zur neuen GPU-Architektur Ampere verraten. Als Nachfolger von Volta richtet sich Ampere mit GA100 zu Anfang an den Einsatz im Datacenter für das KI-Training und Inferencing. Die erste Ampere-GPU A100 soll in diesem Szenario 20 Mal so schnell sein wie Volta. Das erste Produkt ist das DGX A100.

Zum Bericht: Nvidia Ampere: A100 ist für KI eine 20 Mal schnellere GPU

Stuntmp02 · 14. Mai 2020

Ich hoffe auf einen baldigen Turing Nachfolger mit HDMI 2.1 Unterstützung für 4K 120Hz Oled Fernsehr mit G-Sync. Dann können diese ganzen lächerlichen Gaming Monitore vergessen werden. Ich gehe davon aus, dass es H2 2020 einen Gaming Ableger von Ampere geben wird.

Sithys · 14. Mai 2020

Der Artikel ist extrem detail- und umfangreich, vielen Dank für diese klasse Arbeit! Aber der Großteil der Community wartet doch fieberhaft auf Infos der Consumer-Variante, oder?

wüstenigel · 14. Mai 2020

Mein persönliches Highlight: es geht weg von Intel und hin zu AMDs Server-CPUs

Shoryuken94 · 14. Mai 2020

Der Chip ist echt ein ziemliches Monster!

Sephiroth51 · 14. Mai 2020

Shoryuken94 schrieb:
Der Chip ist echt ein ziemliches Monster!

Das werden wir beim Nachfolger auch sagen.😂😁👍🏻

usb2_2 · 14. Mai 2020

@nlr
"für FP32 und INT8. Für FP32 wird eine Rechenleistung von in der Spitze 312 TFLOPS angegeben"
Das ist doch wohl FP16 oder?

So groß auf 7nm hätte ich nicht erwartet. Ob CDNA3 das dann aufholt?

Smartin · 14. Mai 2020

ich dachte, heute gibt es erste Infos zum Turing Nachfolger. Das dauert dann wohl noch

Randalmaker · 14. Mai 2020

Im Artikel ist ein Fehler! (Wenn ich nicht völlig zu blöd bin)
Die Leistungs-Werte in der Tabelle auf der 1. Seite stimmen nicht. Im Text darunter ist bspw. von einer Rechenleistung von 312 TFLOPS bei FP32 die Rede, in der Tabelle steht aber 19,5. Auch die anderen Werte stimmen nicht, direkt darunter stehen andere.

Es sieht aus, als wären die Werte in der Tabelle alle um eine Zeile nach unten gerutscht.

johnieboy · 14. Mai 2020

An den Leaks von KittyKitties zu den Gaming Karten scheint was dran zu sein
https://twitter.com/VideoCardz/status/1260903348158554112

Dazu kommt dieses Video von vor 2 Tagen, hört sich zumindest plausibel an.

TRIPLE.M · 14. Mai 2020

echt guter Artikel.
am beeindruckensten ist das was man sieht , erst das Bild mit 25 Racks und dann dazu nur noch 1 Rack für die gleiche Leistung

Denniss · 14. Mai 2020

Das ist kein Leak, das ist geklaut von einem anderen Twitterer aus 5/2019, Kopedimi oder so heißt der

Santa Clause · 14. Mai 2020

Das wird kein HBM dummy stack sein, sondern einfach ein 8GB Stapel der für ECC draufgeht. Schließlich sind dies Produkte für den Server- und nicht den Gamingsektor.

Mustis · 14. Mai 2020

Na sowas, wie unerwartet ist Ampere kein Gaming Kärtchen und somit immer noch kein Turing Nachfogler in Sicht.

Stunrise schrieb:
Ich gehe davon aus, dass es H2 2020 einen Gaming Ableger von Ampere geben wird.

Mit Sicherheit nicht. Das wird doch immer deutlicher! Nvidia hat den kurzfristigen Fokus ganz klar auf den Volta Nachfolger Ampere gerichtet und dieser ist ohne deutliche Anpassungen nicht als Desktop-Grafikkarte nutzbar. Und selbst wenn, die dort nötige ALUs aka CUDA Leistung steigt bei Ampere kaum an, 24% wie man hier sieht. Man muss also sogar offen, dass die Gaming Ampere sich deutlich unterscheidet von der Datacenter Ampere, sonst wird der Leistungssprung sehr übersichtlich. Auch fehlen wohl RTX Kerne und ich bezweifele, dass Nvidia die bereits wieder aufgibt nach einer Generation.

Für mich wird immer unwahrscheinlicher, dass ein 2080 TI Nachfolger noch dieses Jahr kommt.

pipip · 14. Mai 2020

Heißt also, dank NV könnte AMD ein Durchbruch (deutlich größerer Anstieg) im Data-Center gelingen. Lustig die Welt.

usb2_2 schrieb:
So groß auf 7nm hätte ich nicht erwartet. Ob CDNA3 das dann aufholt?

9,7 TFLOP	7.8 TFLOPS
FP32-Performance (Peak)	19,5 TFLOP

https://www.computerbase.de/news/grafikkarten/amd-radeon-vii-pro.72082/

AMD spricht von 13,1 TFOPS FP32-Performance... FP64-Performance bei 6,5 TFLOPS

Mit Vega 20 scheint AMD zu mindestens was FP64 Performance angeht nicht so abgehängt und das ist noch kein CDNA.

Wie aber im Artikel beschrieben, liegen die Stärken ja wo anders!

syfsyn · 14. Mai 2020

hauptsächlich Marketing und Funktionserklärung
keine details zur Architektur
Notiert der chip heißt a100 (108sm=6912shader) ist was kleiner als gedacht und kann als mig kombiniert werden.
vieles ist software/firmware optimiert und lassen sich getrennte vm gpu zuordnen.
bzw aufgaben exklusiv berechnen auf nutzer gewählten arbeitsschritten.

Für Software Entwickler sehr interessant in den bereichen AI autonomen fahren und datacenter

Den quadro Nutzer ist das völlig egal somit ist das reine Werbung für HPC
keine 2d 3d modelling oder auch rendern nur zahlen für HPC
Würde mich nicht wundern das damit besser gemint werden kann.(kryptozahlen Berechnung)

namenloser22 · 14. Mai 2020

Die FP16 Perfomance ist einfach nur faszinierend!
Die 3. Generation der Tensor-Cores gibt ihr bestes die gerade aufkommenden AI ASICs obsolet zu machen (auch wenn die Tensor Cores streng genommen genau das sind)

Ich vermute, dass durch die stark gesteigerte Leistung, die Entwicklung von neuen AI Modellen sich deutlich beschleunigt, da sich jetzt auch Universitäten und mittel-große Unternehmen die Rechenleistung leisten können einen Bert selbst zu trainieren

eXe777 · 14. Mai 2020

wüstenigel schrieb:
Mein persönliches Highlight: es geht weg von Intel und hin zu AMDs Server-CPUs

Ob es auch so gekommen wäre, wenn Intel PCIe 4.0 geboten hätte? Wahrscheinlich hätte man AMD dann mal wieder den Rücken gekehrt wie es viele Andere weiterhin tun.

sloven · 14. Mai 2020

Kleiner Schnitzer in einem interessanten Artikel:

"dass Datacenter-Betreiber mehr Geld sparen könnten, umso (mehr?) Systeme sie erwerben. "

wüstenigel · 14. Mai 2020

eXe777 schrieb:
Ob es auch so gekommen wäre, wenn Intel PCIe 4.0 geboten hätte? Wahrscheinlich hätte man AMD dann mal wieder den Rücken gekehrt wie es viele Andere weiterhin tun.

Was-wäre-wenn-Fragen sind schwierig. Für mich ist es ein Highlight, weil AMD und Nvidia schon einmal vor ein paar Jahren so ein bisschen miteinander kokettiert haben:
https://twitter.com/NVIDIAGeForce/status/895746289589039104

Bericht Nvidia Ampere: A100 ist für KI eine 20 Mal schnellere GPU

Redakteur

Stuntmp02

Gast

Captain Pro

Lieutenant

Admiral

Lt. Commander

Captain

Rear Admiral

Cadet 3rd Year

Commodore

Lt. Junior Grade

Admiral

Cadet 4th Year

Mustis

Gast

Fleet Admiral

Admiral

Cadet 2nd Year

Lieutenant

Commander

Lieutenant

Ähnliche Themen