News Samsung GDDR6W: Doppelte Bandbreite und Kapazität für GPUs dank Stacking

ghecko schrieb:
Wenn sich die Bandbreite verdoppeln soll, muss das halt trotzdem entweder über die Frequenz vom Bus oder dessen Busbreite passieren. Und wie es aussieht wollen sie die Frequenz verdoppeln, damit man sich die teure Verbreiterung des Bussystems spart (breiteres Speicherinterface, mehr Pins, mehr Traces).
Anhang anzeigen 1289844
Nein?
Les doch mal was da steht. 512 IO, 22 Gbps. Das ist knapp über den aktuellen ~16 - 18 die inzwischen üblich sind und normalerweise sind die Chips, AFAIK, nur mit 256 IO Pins angebunden.

Was hier damit ganz locker verschwiegen wird: Das Platinenlayout wird erheblich komplizierter und ist ein Spagat zwischen GDDR6 und HBM, sowohl was den Aufwand der Layer betrifft, als auch was die Leitungslängen betrifft um nicht zu asynchron zu werden.

Es ist also nicht die kompromisslose Wundertüte, die hier angepriesen wird.
 
  • Gefällt mir
Reaktionen: ETI1120, Lübke82 und Tanzmusikus
Aus was für einem Material ist die Schicht zwischen den beiden RAM Bausteinen? Zusammen mit ordentlich Wärme muss man da auch die Z-Achsen Ausdehnung im Auge behalten bzw deren Langlebigkeit.
 
  • Gefällt mir
Reaktionen: Tanzmusikus
Nagilum99 schrieb:
Nein?
Les doch mal was da steht.
Hab ich. Im Artikel ist von einer Verdoppelung die Rede. Worauf sich das bezieht ist nirgends spezifiziert:

"Dank Stacking können die Chips eine verdoppelte Speicherbandbreite bieten, gleichzeitig kann dabei auch noch die Kapazität verdoppelt werden."

Und wenn ein GDDR6W Chip im Vergleich zu seinem Vorgänger die doppelte Bandbreite bietet, aber die Busbreite dieselbe bleibt, dann muss sich wohl die Übertragungsrate verdoppeln. So liest sich das aus dem Artikel.

Wenn es hier um die Verdoppelung der Chipanzahl geht oder eine Mischung aus beidem, dann weiß ich nicht was jetzt der große Vorteil sein soll der hier hervorgebracht wird. Außerdem ist dann die Aussage im Artikel faktisch falsch.
 
Zuletzt bearbeitet:
GDDR6W bietet doppelte SpeicherKAPAZITÄT
 
Mit Blick auf HBM3 kann man nicht wirklich von "Lücke zu HBM schließen" reden. HBM3 erreicht 2.66-3.99 TBps je nach Aufbau.
 
Scheisse jetzt hab ich schon ne 4090 gekauft :(
 
@NighteeeeeY: Nicht so schlimm. Die Bandbreite muss auch zum ganzen Design der GraKa passen. In ein oder zwei Jahren legst du als dann wieder zwei oder dann drei Tausend hin. Aber das ist ja an sich der Weg, den der Grafikkartenmarkt mittlerweile beschreitet und du hast dich ohnehin dafür entschieden, diesen zu beschreiten. :daumen:
 
  • Gefällt mir
Reaktionen: baizer, CyrionX, Smartbomb und 3 andere
ghecko schrieb:
Hab ich. Im Artikel ist von einer Verdoppelung die Rede. Worauf sich das bezieht ist nirgends spezifiziert:

"Dank Stacking können die Chips eine verdoppelte Speicherbandbreite bieten, gleichzeitig kann dabei auch noch die Kapazität verdoppelt werden."

Und wenn ein GDDR6W Chip im Vergleich zu seinem Vorgänger die doppelte Bandbreite bietet, aber die Busbreite dieselbe bleibt, dann muss sich wohl die Übertragungsrate verdoppeln. So liest sich das aus dem Artikel.
Gegeben ist in dem Fall die Bandbreite pro Pin und die Grösse des SI und damit Anzahl der Modulsteckplätze.
Also Takt und Interfacegrösse ist gegeben.
Mit der doppelten Anzahl der Module im Package könnte man evtl die Anzahl der Pins vergrössern?

Ansonsten sehe ich zwar die Kapazität die sich verdoppelt, aber nicht die Bandbreite sich verdoppeln...
GDDR6 mit 24 Gbit gibt es als Sample nämlich auch schon und 512 Bit SI hatten wir in der
Vergangenheit auch schon.
https://semiconductor.samsung.com/dram/gddr/gddr6/
 
ghecko schrieb:
Wenn es hier um die Verdoppelung der Chipanzahl geht oder eine Mischung aus beidem, dann weiß ich nicht was jetzt der große Vorteil sein soll der hier hervorgebracht wird. Außerdem ist dann die Aussage im Artikel faktisch falsch.
Also für mich liest es sich auch eher so, als wären das quasi 2 GDDR6 Chips in einem Gehäuse. Damit müsste man den Bus zum Chip auf doppelte Breite ausbauen, der Takt würde gleich bleiben. Ist aber wirklich nicht so eindeutig geschrieben, kann ich daher auch falsch verstanden haben.
 
modena.ch schrieb:
Mit der doppelten Anzahl der Module im Package könnte man evtl die Anzahl der Pins vergrössern?
Damit würde sich aber auch die Breite vom Bus pro Chip vergrößern. Was wiederum das PCB, die GPU und die Grafikkarte an sich teurer macht.
Wenn man mit der verdoppelten Speicherkapazität weniger Chips verwendet, würde alles beim alten bleiben und die Bandbreite wäre dieselbe, wenn man nicht an der Taktschraube dreht.
Insgesamt hinterlässt der Artikel bei mir nur Fragezeichen, da keine Gegenüberstellung von GDDR6 zu GDDR6W stattfindet und nicht darauf eingegangen wird, in welcher Konstellation nun eine Verdoppelung der Bandbreite zu erwarten ist.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Tanzmusikus
ghecko schrieb:
Und wenn ein GDDR6W Chip im Vergleich zu seinem Vorgänger die doppelte Bandbreite bietet, aber die Busbreite dieselbe bleibt, dann muss sich wohl die Übertragungsrate verdoppeln. So liest sich das aus dem Artikel.
Takt und Busbreite steht doch in der Tabelle.


ghecko schrieb:
Wenn es hier um die Verdoppelung der Chipanzahl geht oder eine Mischung aus beidem, dann weiß ich nicht was jetzt der große Vorteil sein soll der hier hervorgebracht wird. Außerdem ist dann die Aussage im Artikel faktisch falsch.
Es geht um das Stapeln von Dies. Die Anzahl ist die gleiche, aber eben weniger packages.

Die News ist aber irreführend geschrieben. Es geht rein um mehr Kapazität. Man erhält ja nicht mehr Bandbreite als wenn man ein 512 Bit Bus ohne stacking implementiert. Die Nachteile eines breiten Speicherinterface bleiben bestehen. Für Gamingkarten sehe ich kaum einen Vorteil. Hohe Speicherkapazitäten für Workstationkarten lassen sich einfacher realisieren.
 
  • Gefällt mir
Reaktionen: ETI1120, Beitrag und Tanzmusikus
@ghecko
Die Busbreite bestimmt die Anzahl der Steckplätze für die Module auf dem PCB und die Anzahl
der Pins die ein Steckplatz hat.
Wenn man natürlich die Bandbreite pro Steckplatz vergrössert, wenn man die Anzahl der Pins vergrössert und damit die Menge an Steckplätzen wieder verringert. Sind wir wieder gleich weit.

Es wäre wohl besser gewesen man hätte geschrieben die Bandbreite pro Speichermodul steigt, womit man weniger Speichermodule für den gleichen Durchsatz braucht und auch weniger Steckplätze für die gleiche Speichermenge, aber die Bandbreite als Ganzes steigt nicht.
Und auch die Gesamtspeichermenge mit weniger Steckplätzen wird kaum relevant steigen.

Auf dem GDDR6 Bild 4x Kontakte unter dem aufgeschnittenen Chip, GDDR6W hat 6x Kontakte.
Bisher sind es ja 180-Ball FBGA pro Modul.
1669715279046.png
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Tanzmusikus, .Sentinel. und lnnz
Chilisidian schrieb:
Der technische Fortschritt ist natürlich immer zu begrüßen. Speicherbandbreite ist jedoch bei der aktuellen Generation nichts, was die Leistung dieser Karten begrenzt.
Da wäre ich mir jetzt nicht sicher. Aus irgendeinem Grund haben die 4090 Karten 70% mehr theoretische Leistung als eine 4080, davon kommt nur ca 30 in der Praxis an. Irgendwo hakt es.

Und: der weitere Vorteil von HBM, nämlich, dass die Speichercontroller wenig Strom fressen sollte weiterhin bestehen bleiben. Eventuell ist das relevant.
 
ghecko schrieb:
Wenn es hier um die Verdoppelung der Chipanzahl geht oder eine Mischung aus beidem, dann weiß ich nicht was jetzt der große Vorteil sein soll der hier hervorgebracht wird.

Der Vorteil ist wohl, dass man mit dem selben Platz mehr Speicher und mehr Bandbreite haben kann (und ich denke, der Platz, in dem man kosteneffektiv Transfers mit 22Gbps hinkriegt, ist relativ klein). Allerdings braeuchte die andere Seite auch doppelt soviele Speicherpins (aber immerhin weniger als bei HBM, das sollte also gehen). Ob das fuer Consumer-Grafikkarten relevant wird? Ich glaube nicht. Interessant fuer HPC-Beschleuniger und fuer CAD-Grafikkarten, wobei die Frage ist, woher sie die zusaetzlichen Pins nehmen, wenn sie weiterhin gemeinsame dies mit den Consumer-Grafikkarten haben. Einfach ein Haufen PHYs auf dem die, die nur fuer die HPC und CAD-Karten aufgedreht werden?

Dass man die Haelfte von GDDR6W statt die normale Menge vom normalen GDDR6(X) nimmt, wenn man die Wahl hat, ist unwahrscheinlich, weil die normale Menge von normalem GDDR6(X) billiger ist.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Tanzmusikus
Bunhy schrieb:
Für dann 4500 Euro, ich freue mich. Eine Niere kann ich noch verkaufen :D
Du hast noch welche übrig? 😂
 
BAR86 schrieb:
Da wäre ich mir jetzt nicht sicher. Aus irgendeinem Grund haben die 4090 Karten 70% mehr theoretische Leistung als eine 4080, davon kommt nur ca 30 in der Praxis an. Irgendwo hakt es.
Also laut Igor liegt es daran, dass die Engines die vielen CUDA-Einheiten nicht gleichzeitig auslasten können.
 
  • Gefällt mir
Reaktionen: Tanzmusikus
Schon Ampere hatte ja Auslastungsprobleme in FHD. Erst mir RT konnte man den Chip besser auslasten.
In ADA sieht es ja selbst in WQHD nicht rosig aus. Zu viele Einheiten.....
Man hat ja versucht was dagegen zu tun, aber naja.
 
  • Gefällt mir
Reaktionen: Tanzmusikus
modena.ch schrieb:
Es wäre wohl besser gewesen man hätte geschrieben die Bandbreite pro Speichermodul steigt, womit man weniger Speichermodule für den gleichen Durchsatz braucht, aber die Bandbreite als Ganzes steigt nicht.
Und auch die Gesamtspeichermenge mit weniger Steckplätzen wird kaum steigen.
Es gibt einfach noch Lücken in dem Material, das Samsung zur Verfügung gestellt hat.
https://semiconductor.samsung.com/u...g-immersive-vr-with-powerful-graphics-memory/
Darin wird nicht klar, ob der gesparte Platz dafür genutzt werden kann, die PCBs zu vereinfachen. Ganz simpel gefragt: Kann durch die Technik in Zukunft auf dem Platz, das ein 256bit-GDDR6-Interface benötigt, ein 512bit-GDDR6W-Interface untergebracht werden? Ein 384bit-GDDR6W-Interface? Oder auch bloß ein 256bit-GDDR6W-Interface, nur halt mit weniger Packages?

Meine Vermutung: Wahrscheinlich wird das Routing einfacher, aber nicht so extrem wie von 256bit GDDR6 → 512bit GDDR6W. Mein Tipp wäre → 384bit GDDR6W.
Edit: Noch eine knappe Ergänzung: Wenn man sich anschaut, wie das PCB einer 4090 aussieht, fällt auf, dass dort allein auf Grund der Größe der Module und deren geringen Abstand zum GPU-DIE-Package, gar kein 512bit-Interface draufpassen würde.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: bensen und Tanzmusikus
Naja mit 21gbs ist aktueller vram ja schon wieder nahe am maximum, da muss früher oder später was kommen. Si erhöhen ist teuer und nicht rentable im consumerberreich und cache kann auch nicht unendlich erhöht werden da eben auch teuer.
Die Verdopplung ist sicher auch interessant, da man so im Consumerberreich keine Chips auf der Rückseite verbauen muss.
 
  • Gefällt mir
Reaktionen: Tanzmusikus
welche gpu hat noch 512bit?
Und was ist mit gddr6x
Das neue ist hier die doppelte Kapazität
An der Bandbreite ändert sich nix.
Gddr7 ist aufn Weg
 

Ähnliche Themen

Zurück
Oben