News Samsung GDDR6W: Doppelte Bandbreite und Kapazität für GPUs dank Stacking

Nagilum99 · 29. November 2022

ghecko schrieb:
Wenn sich die Bandbreite verdoppeln soll, muss das halt trotzdem entweder über die Frequenz vom Bus oder dessen Busbreite passieren. Und wie es aussieht wollen sie die Frequenz verdoppeln, damit man sich die teure Verbreiterung des Bussystems spart (breiteres Speicherinterface, mehr Pins, mehr Traces).
Anhang anzeigen 1289844

Nein?
Les doch mal was da steht. 512 IO, 22 Gbps. Das ist knapp über den aktuellen ~16 - 18 die inzwischen üblich sind und normalerweise sind die Chips, AFAIK, nur mit 256 IO Pins angebunden.

Was hier damit ganz locker verschwiegen wird: Das Platinenlayout wird erheblich komplizierter und ist ein Spagat zwischen GDDR6 und HBM, sowohl was den Aufwand der Layer betrifft, als auch was die Leitungslängen betrifft um nicht zu asynchron zu werden.

Es ist also nicht die kompromisslose Wundertüte, die hier angepriesen wird.

feris · 29. November 2022

Aus was für einem Material ist die Schicht zwischen den beiden RAM Bausteinen? Zusammen mit ordentlich Wärme muss man da auch die Z-Achsen Ausdehnung im Auge behalten bzw deren Langlebigkeit.

ghecko · 29. November 2022

Nagilum99 schrieb:
Nein?
Les doch mal was da steht.

Hab ich. Im Artikel ist von einer Verdoppelung die Rede. Worauf sich das bezieht ist nirgends spezifiziert:

"Dank Stacking können die Chips eine verdoppelte Speicherbandbreite bieten, gleichzeitig kann dabei auch noch die Kapazität verdoppelt werden."

Und wenn ein GDDR6W Chip im Vergleich zu seinem Vorgänger die doppelte Bandbreite bietet, aber die Busbreite dieselbe bleibt, dann muss sich wohl die Übertragungsrate verdoppeln. So liest sich das aus dem Artikel.

Wenn es hier um die Verdoppelung der Chipanzahl geht oder eine Mischung aus beidem, dann weiß ich nicht was jetzt der große Vorteil sein soll der hier hervorgebracht wird. Außerdem ist dann die Aussage im Artikel faktisch falsch.

bad_sign · 29. November 2022

GDDR6W bietet doppelte SpeicherKAPAZITÄT

Zer0Strat · 29. November 2022

Mit Blick auf HBM3 kann man nicht wirklich von "Lücke zu HBM schließen" reden. HBM3 erreicht 2.66-3.99 TBps je nach Aufbau.

nighteeeeey · 29. November 2022

Scheisse jetzt hab ich schon ne 4090 gekauft

feris · 29. November 2022

@NighteeeeeY: Nicht so schlimm. Die Bandbreite muss auch zum ganzen Design der GraKa passen. In ein oder zwei Jahren legst du als dann wieder zwei oder dann drei Tausend hin. Aber das ist ja an sich der Weg, den der Grafikkartenmarkt mittlerweile beschreitet und du hast dich ohnehin dafür entschieden, diesen zu beschreiten.

modena.ch · 29. November 2022

ghecko schrieb:
Hab ich. Im Artikel ist von einer Verdoppelung die Rede. Worauf sich das bezieht ist nirgends spezifiziert:

"Dank Stacking können die Chips eine verdoppelte Speicherbandbreite bieten, gleichzeitig kann dabei auch noch die Kapazität verdoppelt werden."

Und wenn ein GDDR6W Chip im Vergleich zu seinem Vorgänger die doppelte Bandbreite bietet, aber die Busbreite dieselbe bleibt, dann muss sich wohl die Übertragungsrate verdoppeln. So liest sich das aus dem Artikel.

Gegeben ist in dem Fall die Bandbreite pro Pin und die Grösse des SI und damit Anzahl der Modulsteckplätze.
Also Takt und Interfacegrösse ist gegeben.
Mit der doppelten Anzahl der Module im Package könnte man evtl die Anzahl der Pins vergrössern?

Ansonsten sehe ich zwar die Kapazität die sich verdoppelt, aber nicht die Bandbreite sich verdoppeln...
GDDR6 mit 24 Gbit gibt es als Sample nämlich auch schon und 512 Bit SI hatten wir in der
Vergangenheit auch schon.
https://semiconductor.samsung.com/dram/gddr/gddr6/

Oberst08 · 29. November 2022

ghecko schrieb:
Wenn es hier um die Verdoppelung der Chipanzahl geht oder eine Mischung aus beidem, dann weiß ich nicht was jetzt der große Vorteil sein soll der hier hervorgebracht wird. Außerdem ist dann die Aussage im Artikel faktisch falsch.

Also für mich liest es sich auch eher so, als wären das quasi 2 GDDR6 Chips in einem Gehäuse. Damit müsste man den Bus zum Chip auf doppelte Breite ausbauen, der Takt würde gleich bleiben. Ist aber wirklich nicht so eindeutig geschrieben, kann ich daher auch falsch verstanden haben.

ghecko · 29. November 2022

modena.ch schrieb:
Mit der doppelten Anzahl der Module im Package könnte man evtl die Anzahl der Pins vergrössern?

Damit würde sich aber auch die Breite vom Bus pro Chip vergrößern. Was wiederum das PCB, die GPU und die Grafikkarte an sich teurer macht.
Wenn man mit der verdoppelten Speicherkapazität weniger Chips verwendet, würde alles beim alten bleiben und die Bandbreite wäre dieselbe, wenn man nicht an der Taktschraube dreht.
Insgesamt hinterlässt der Artikel bei mir nur Fragezeichen, da keine Gegenüberstellung von GDDR6 zu GDDR6W stattfindet und nicht darauf eingegangen wird, in welcher Konstellation nun eine Verdoppelung der Bandbreite zu erwarten ist.

bensen · 29. November 2022

ghecko schrieb:
Und wenn ein GDDR6W Chip im Vergleich zu seinem Vorgänger die doppelte Bandbreite bietet, aber die Busbreite dieselbe bleibt, dann muss sich wohl die Übertragungsrate verdoppeln. So liest sich das aus dem Artikel.

Takt und Busbreite steht doch in der Tabelle.

ghecko schrieb:
Wenn es hier um die Verdoppelung der Chipanzahl geht oder eine Mischung aus beidem, dann weiß ich nicht was jetzt der große Vorteil sein soll der hier hervorgebracht wird. Außerdem ist dann die Aussage im Artikel faktisch falsch.

Es geht um das Stapeln von Dies. Die Anzahl ist die gleiche, aber eben weniger packages.

Die News ist aber irreführend geschrieben. Es geht rein um mehr Kapazität. Man erhält ja nicht mehr Bandbreite als wenn man ein 512 Bit Bus ohne stacking implementiert. Die Nachteile eines breiten Speicherinterface bleiben bestehen. Für Gamingkarten sehe ich kaum einen Vorteil. Hohe Speicherkapazitäten für Workstationkarten lassen sich einfacher realisieren.

modena.ch · 29. November 2022

@ghecko
Die Busbreite bestimmt die Anzahl der Steckplätze für die Module auf dem PCB und die Anzahl
der Pins die ein Steckplatz hat.
Wenn man natürlich die Bandbreite pro Steckplatz vergrössert, wenn man die Anzahl der Pins vergrössert und damit die Menge an Steckplätzen wieder verringert. Sind wir wieder gleich weit.

Es wäre wohl besser gewesen man hätte geschrieben die Bandbreite pro Speichermodul steigt, womit man weniger Speichermodule für den gleichen Durchsatz braucht und auch weniger Steckplätze für die gleiche Speichermenge, aber die Bandbreite als Ganzes steigt nicht.
Und auch die Gesamtspeichermenge mit weniger Steckplätzen wird kaum relevant steigen.

Auf dem GDDR6 Bild 4x Kontakte unter dem aufgeschnittenen Chip, GDDR6W hat 6x Kontakte.
Bisher sind es ja 180-Ball FBGA pro Modul.

BAR86 · 29. November 2022

Chilisidian schrieb:
Der technische Fortschritt ist natürlich immer zu begrüßen. Speicherbandbreite ist jedoch bei der aktuellen Generation nichts, was die Leistung dieser Karten begrenzt.

Da wäre ich mir jetzt nicht sicher. Aus irgendeinem Grund haben die 4090 Karten 70% mehr theoretische Leistung als eine 4080, davon kommt nur ca 30 in der Praxis an. Irgendwo hakt es.

Und: der weitere Vorteil von HBM, nämlich, dass die Speichercontroller wenig Strom fressen sollte weiterhin bestehen bleiben. Eventuell ist das relevant.

mae · 29. November 2022

ghecko schrieb:
Wenn es hier um die Verdoppelung der Chipanzahl geht oder eine Mischung aus beidem, dann weiß ich nicht was jetzt der große Vorteil sein soll der hier hervorgebracht wird.

Der Vorteil ist wohl, dass man mit dem selben Platz mehr Speicher und mehr Bandbreite haben kann (und ich denke, der Platz, in dem man kosteneffektiv Transfers mit 22Gbps hinkriegt, ist relativ klein). Allerdings braeuchte die andere Seite auch doppelt soviele Speicherpins (aber immerhin weniger als bei HBM, das sollte also gehen). Ob das fuer Consumer-Grafikkarten relevant wird? Ich glaube nicht. Interessant fuer HPC-Beschleuniger und fuer CAD-Grafikkarten, wobei die Frage ist, woher sie die zusaetzlichen Pins nehmen, wenn sie weiterhin gemeinsame dies mit den Consumer-Grafikkarten haben. Einfach ein Haufen PHYs auf dem die, die nur fuer die HPC und CAD-Karten aufgedreht werden?

Dass man die Haelfte von GDDR6W statt die normale Menge vom normalen GDDR6(X) nimmt, wenn man die Wahl hat, ist unwahrscheinlich, weil die normale Menge von normalem GDDR6(X) billiger ist.

ric84 · 29. November 2022

Bunhy schrieb:
Für dann 4500 Euro, ich freue mich. Eine Niere kann ich noch verkaufen

Du hast noch welche übrig? 😂

Chilisidian · 29. November 2022

BAR86 schrieb:
Da wäre ich mir jetzt nicht sicher. Aus irgendeinem Grund haben die 4090 Karten 70% mehr theoretische Leistung als eine 4080, davon kommt nur ca 30 in der Praxis an. Irgendwo hakt es.

Also laut Igor liegt es daran, dass die Engines die vielen CUDA-Einheiten nicht gleichzeitig auslasten können.

modena.ch · 29. November 2022

Schon Ampere hatte ja Auslastungsprobleme in FHD. Erst mir RT konnte man den Chip besser auslasten.
In ADA sieht es ja selbst in WQHD nicht rosig aus. Zu viele Einheiten.....
Man hat ja versucht was dagegen zu tun, aber naja.

CDLABSRadonP... · 29. November 2022

modena.ch schrieb:
Es wäre wohl besser gewesen man hätte geschrieben die Bandbreite pro Speichermodul steigt, womit man weniger Speichermodule für den gleichen Durchsatz braucht, aber die Bandbreite als Ganzes steigt nicht.
Und auch die Gesamtspeichermenge mit weniger Steckplätzen wird kaum steigen.

Es gibt einfach noch Lücken in dem Material, das Samsung zur Verfügung gestellt hat.
https://semiconductor.samsung.com/u...g-immersive-vr-with-powerful-graphics-memory/
Darin wird nicht klar, ob der gesparte Platz dafür genutzt werden kann, die PCBs zu vereinfachen. Ganz simpel gefragt: Kann durch die Technik in Zukunft auf dem Platz, das ein 256bit-GDDR6-Interface benötigt, ein 512bit-GDDR6W-Interface untergebracht werden? Ein 384bit-GDDR6W-Interface? Oder auch bloß ein 256bit-GDDR6W-Interface, nur halt mit weniger Packages?

Meine Vermutung: Wahrscheinlich wird das Routing einfacher, aber nicht so extrem wie von 256bit GDDR6 → 512bit GDDR6W. Mein Tipp wäre → 384bit GDDR6W.
Edit: Noch eine knappe Ergänzung: Wenn man sich anschaut, wie das PCB einer 4090 aussieht, fällt auf, dass dort allein auf Grund der Größe der Module und deren geringen Abstand zum GPU-DIE-Package, gar kein 512bit-Interface draufpassen würde.

Vitec · 29. November 2022

Naja mit 21gbs ist aktueller vram ja schon wieder nahe am maximum, da muss früher oder später was kommen. Si erhöhen ist teuer und nicht rentable im consumerberreich und cache kann auch nicht unendlich erhöht werden da eben auch teuer.
Die Verdopplung ist sicher auch interessant, da man so im Consumerberreich keine Chips auf der Rückseite verbauen muss.

syfsyn · 29. November 2022

welche gpu hat noch 512bit?
Und was ist mit gddr6x
Das neue ist hier die doppelte Kapazität
An der Bandbreite ändert sich nix.
Gddr7 ist aufn Weg

News Samsung GDDR6W: Doppelte Bandbreite und Kapazität für GPUs dank Stacking

Lt. Commander

Captain

Digital Caveman

Rear Admiral

Banned

Commodore

Captain

Admiral

Lieutenant

Digital Caveman

Fleet Admiral

Admiral

Commander

Lt. Commander

Lieutenant

Lt. Commander

Admiral

Commodore

Commodore

Admiral

Ähnliche Themen