News High-End-Speicher: SK Hynix liefert HBM3 für Hopper an Nvidia aus

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
18.735
Nvidia hat die Nutzung von HBM3 für die Profi-Grafiklösung „Hopper“ bereits vor Monaten angekündigt, jetzt zieht dessen Hersteller nach: Es ist SK Hynix. Dabei werden die ersten Chargen laut Pressemitteilung wohl fast ausschließlich an Nvidia gehen, wenn die Fertigung ab dem dritten Quartal hochgefahren wird.

Zur News: High-End-Speicher: SK Hynix liefert HBM3 für Hopper an Nvidia aus
 
  • Gefällt mir
Reaktionen: flo.murr, aid0nex, PietVanOwl und 3 andere
Es ist schon beeindruckend wie viele Transistoren der Neue GH100 auf dem kleinen Raum unterbringt , gerade im Vergleich zu den beiden andern in der Tabelle. Dazu noch 80 GB HBM3 Speicher, Bandbreite > 3 TB/s 😳, ein wahres Monster.

Jedoch hat das ganze dann auch seine Schattenseiten, wie die angegebenen 700 Watt unten in der Tabelle…
 
Zuletzt bearbeitet:
5 Chips mit 16GB sind 80GB , okay soweit.
Aber 6144bit Interface sind nur mit 6 Chips möglich.
 
  • Gefällt mir
Reaktionen: Piak und TD1334
wrglsgrft schrieb:
Müssten es dann nicht 640 GByte sein?
Hab's eben auch gesehen und korrigiert. Sonst sähe es für HBM3 wirklich nicht gut aus :D
Ergänzung ()

Ghostshield schrieb:
5 Chips mit 16GB sind 80GB , okay soweit.
Aber 6144bit Interface sind nur mit 6 Chips möglich.
Das wird die Bandbreite des gesamten Dies sein. Der ist aber unterbestückt und kriegt deswegen nur 5 HBM-Chips.
 
Hydrogenium schrieb:
Es ist schon beeindruckend wie viele Transistoren der Neue GH100 auf dem kleinen Raum unterbringt

Hier sieht man wieder schön, was N12 zu N7 zu N4 bringt.

Hydrogenium schrieb:
wie die angegebenen 700 Watt unten in der Tabelle…

Die maximal mögliche Anzahl von Transistoren pro Fläche bringt nun einmal mehr Transistoren pro Fläche, die mit Strom versorgt werden sollen.

Doppelte Anzahl von Transistoren aber nur 30% weniger Stromverbrauch pro Transistor von Step zu Step. Da wird es schwer, den gleichen Stromverbrauch zu erzielen. :evillol:

Mit 4facher Anzahl der Transistoren aber nur 2.3 mal soviel Strom verbrauchen (bei gleichem Takt) ist aber eine gute Leistung. (N12 mit N4 verglichen)

mfg
 
  • Gefällt mir
Reaktionen: Hydrogenium und ph0b0s101
Ghostshield schrieb:
Aber 6144bit Interface sind nur mit 6 Chips möglich.

Es dürfte wieder ein Stack für die Ausbeute deaktiviert sein. Ggf. kommt später eine Variante mit 96 GB und vollem Interface.

Hydrogenium schrieb:
Jedoch hat das ganze dann auch seine Schattenseiten, wie die angegebenen 700 Watt unten in der Tabelle…

Ist das Nebenprodukt von dem massiven Anstieg bei der Transistorenanzahl. TSMC schafft eine höhere Packdichte, der Verbrauch pro Transistor sinkt aber nicht im gleichen Maße.
 
[wege]mini schrieb:
Hier sieht man wieder schön, was N12 zu N7 zu N4 bringt.
Weniger, als die Namen vermuten lassen. N12 zu N4 sollte von der Benennung her eine Verneufachung der Packdichte mit sich bringen. Zu beobachten ist eine Vervierfachung. N4 sollte also eigentlich (nach der Logik, dass Nodes nicht nach realen Größen, sondern dem Scaling benannt werden) N6 heißen.
 
  • Gefällt mir
Reaktionen: piccolo85 und Colindo
CDLABSRadonP... schrieb:
Zu beobachten ist eine Vervierfachung. N4 sollte also eigentlich (nach der Logik, dass Nodes nicht nach realen Größen, sondern dem Scaling benannt werden) N6 heißen.

Das Problem ist, dass SRAM, interconnects und Bussysteme bei Kurzkanaltransistoren deutlich schlechter skallieren.
Vergleich mal im Datenblatt die Größe der Logik STCs. Da kommt das schon einigermaßen hin.
 
@Atent12345 Das Problem an der Stelle ist die Methode von TSMC, den vollen Node-Shrink von N14 auf N7 durchzuführen, anstatt von N14 auf N10. Seitdem können die Shrink-Zahlen nicht mehr passen.

Nach N7 stimmt es wieder ungefähr, aber auch da wird eher ein Faktor von 1,8 anstatt 2 für Logik angegeben. Also je mehr Nodes man zusammenfassend vergleicht, desto weniger stimmt der Faktor, mit dem die Transistordichte sich verbessert.
 
Colindo schrieb:
Nach N7 stimmt es wieder ungefähr, aber auch da wird eher ein Faktor von 1,8 anstatt 2 für Logik angegeben. Also je mehr Nodes man zusammenfassend vergleicht, desto weniger stimmt der Faktor, mit dem die Transistordichte sich verbessert.

Aber auch da haben laut Datenblatt die einzelnen Zellen nur etwa die halbe Fläche.
Problem ist dabei eher der Abstand in den design rules.
 
@Colindo
Die bekommt man zusammen mit den Capacitance files für Questa Sim und Design Vision. Da muss man bei der Foundry anfragen.

Wobei es am Ende auch völlig egal ist, ob die Zellen nun größer sind als sie sein sollten oder ob die Abstände groß gehalten werden müssen.

Dynamische Leistungsaufnahme und Eigenkapazität spielen da mittlerweile eine untergeordnete Rolle gegenüber statischer Leistungsaufnahme und der parasitären Kapazität.
 
Zurück
Oben