News Stacking wie Ryzen X3D: Apple M5 könnte auch gestapelt erscheinen

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
18.787
  • Gefällt mir
Reaktionen: cosmo45, Otorva, Kazuja und 7 andere
AMD als Trendsetter?
Hätte Apple nicht so unglaublich viel Kohle würde es sie nicht mehr geben. Apple läuft bis auf dem M3 Chip eigentlich nur noch hinterher... geschrieben von meinem IPhone14
 
  • Gefällt mir
Reaktionen: flo.murr, SSD960, Bernd/das\Brot und 2 andere
Sehr interessant.

Ich finde das ganze Stacking Thema unglaublich spannend. Damit kann man in Zukunft so viel bessere Chips schaffen.

Ich hoffe auch sehr das der 3D-Vache der Ryzen 9000X3D schon weiter verbessert wurde. Vielleicht diesesmal 128 MB als einzel DIE im günstigen 6nm oder sogar 128 MB als 2 x 64 MB übereinander gestappelt. Theortisch sind auch 8 Stapel aus 64 MB möglich oder 8 Stappel 128 MB in TSMC N4.

Da könnte man so unglaublich viel Leistung herausholen. Bin sehr gespannt. Auch sehr schlüssig das Apple diesen weg geht. Die sind ja oft auch schon fast am Limit mit ihren großen DIEs.
 
  • Gefällt mir
Reaktionen: Protogonos, cosmo45 und floTTes
War ja nur eine Frage der Zeit bis andere Hersteller sich vom Erfolg der X3D CPUs eine Scheibe abschneiden wollen. Das ist aus Perspektive TSMC eine sehr überzeugende Tech-Demo.

Thukydides schrieb:
Vielleicht diesesmal 128 MB als einzel DIE im günstigen 6nm oder sogar 128 MB als 2 x 64 MB übereinander gestappelt. Theortisch sind auch 8 Stapel aus 64 MB möglich oder 8 Stappel 128 MB in TSMC N4.
Ich würde da nicht zu viel erwarten. Cache (SRAM) skaliert bei den kleinen Prozessen eher schlecht als recht.

Von Wikipedia:
Compared with the "N5" process, the "N3" process should offer a 10–15% (1.10–1.15×) increase in performance, or a 25–35% (1.25–1.35×) decrease in power consumption, with a 1.7× increase in logic density (a scaling factor of 0.58), a 20% increase (0.8 scaling factor) in SRAM cell density, and a 10% increase in analog circuitry density.
 
@Thukydides Je höher man stapelt, umso größer wird die Gefahr für thermische Probleme etc. Und dann ist zu bedenken, dass der Nutzen von Caches immer geringer wird je größer sie werden (klassischer Fall von abnehmendem Grenznutzen).

Wenn man aber das in den Griff bekommt, kann man auch einfach mit einem aufgestapelten Chiplet höher takten. Das wäre günstiger und in jeder Anwendung effektiver.

Und ja, dass Apple einen ähnlichen Weg geht ist angesichts der eh schon großen Caches der M-Prozessoren eine naheliegende Vermutung.
 
Auf jeden Fall interessant! Mal schauen wie es Apple umsetzt.
 
  • Gefällt mir
Reaktionen: Kazuja und w33werner
Oh nice! Ist das nicht lizensiert von AMD dieses "X3D" stapeln? Apple von AMD abgeschaut :daumen:
 
Das ist eine Entwicklung von TSMC, nicht von AMD. Dementsprechend kann TSMC diesen Prozess auch jedem interessiertem anbieten.
 
  • Gefällt mir
Reaktionen: H6-Mobs, Protogonos, Bademeister69 und 8 andere
Rickmer schrieb:
Compared with the "N5" process, the "N3" process should offer a 10–15% (1.10–1.15×) increase in performance, or a 25–35% (1.25–1.35×) decrease in power consumption, with a 1.7× increase in logic density (a scaling factor of 0.58), a 20% increase (0.8 scaling factor) in SRAM cell density, and a 10% increase in analog circuitry density.
Das sind alte Daten. TSMCs neuere Daten für N3E sehen nur noch 1.6 bei Logik und rein gar nichts bei SRAM und analogen Schaltungen.
 
  • Gefällt mir
Reaktionen: nyster, Doomshroom und Rickmer
stefan92x schrieb:
Das ist eine Entwicklung von TSMC, nicht von AMD. Dementsprechend kann TSMC diesen Prozess auch jedem interessiertem anbieten.
Eher gemeinsam mit TSMC so stand es jedenfalls bei CB. Die werden aber vertraglich vereinbart haben wer das nutzen kann und ich bin mir sicher: Von TSMC bekommt Intel keinen stacked cache:

"Zen 3 war bereits von Vornherein für diese Möglichkeit vorbereitet, die Entwicklung und Umsetzung mit Partner TSMC nahm mehrere Jahre in Anspruch, erklärte AMD."

https://www.computerbase.de/2021-06...amd-stapelt-l3-cache-bei-ryzen-auf-192-mbyte/

Natürlich umfasst das nicht allgemeines Stacking, aber so wie es AMD umgesetzt hat werden die wohl eine Hand drauf halten.
 
  • Gefällt mir
Reaktionen: Hellyeah, Cruentatus, Bernd/das\Brot und 3 andere
Wenn Apple hier Logik auf Logik stapelt, hat das nicht mehr viel mit AMDs Ansatz zu run, außer das auch SoiC genutzt wird.
Da müssten ungleich mehr Verbindungen für Daten und Power her.

Aber vielleicht ist Apple auch an einen großen System Level Cache interessiert. Sie verbauen jetzt schon extrem viel Caches. Der SLC ist schon groß, könnte aber noch viel größer sein. DRAM Zugriffe minimieren spart Strom und sowohl GPU als auch NPU würden erheblich profitieren. 256 MB oben drauf, würde schon ordentlich was bringen.
Ergänzung ()

Dai6oro schrieb:
Natürlich umfasst das nicht allgemeines Stacking, aber so wie es AMD umgesetzt hat werden die wohl eine Hand drauf halten.
Das Chip Design ist natürlich AMDs Sache. Aber die Herstellung ist rein bei TSMC. Natürlich wird bei der Implementierung eng zusammen gearbeitet, aber die IP für die Fertigung wird allein bei TSMC liegen.
Für andere Chips, wird auch ein andere Implementierung sinnvoller sein. Ein SoC ist ein wenig was anderes als eine reine CPU.
 
  • Gefällt mir
Reaktionen: xeroftw, BlueBringer und pjo
Dass Apple irgendwann in diese Technologie einschwenkt, überrascht letztlich nicht.
Definitiv. Es spart Platz, spart Kosten. Bringt Performance, bringt Effizienz, wie auch immer man es wenden möchte.
Schon mit dem M5 wäre ein gutes Zeichen insgesamt, denn dann stünde diese Technologie-Iteration etwas später ja auch bereits "jedem" zur Verfügung.
 
stefan92x schrieb:
Nur ist so ein Ryzen halt auch ein SoC ;)
Nur geht's hier nicht um Ryzen als ganzes, sondern um ein L3 Cache stacking auf einem reinen CPU Chiplet.
Apple wird, so es denn Cache wird der gestapelt wird, nicht allein für die CPU nutzen.
 
  • Gefällt mir
Reaktionen: BlueBringer
bensen schrieb:
Wenn Apple hier Logik auf Logik stapelt, hat das nicht mehr viel mit AMDs Ansatz zu run, außer das auch SoiC genutzt wird.
Da müssten ungleich mehr Verbindungen für Daten und Power her.

Aber vielleicht ist Apple auch an einen großen System Level Cache interessiert. Sie verbauen jetzt schon extrem viel Caches. Der SLC ist schon groß, könnte aber noch viel größer sein. DRAM Zugriffe minimieren spart Strom und sowohl GPU als auch NPU würden erheblich profitieren. 256 MB oben drauf, würde schon ordentlich was bringen.
Ergänzung ()


Das Chip Design ist natürlich AMDs Sache. Aber die Herstellung ist rein bei TSMC. Natürlich wird bei der Implementierung eng zusammen gearbeitet, aber die IP für die Fertigung wird allein bei TSMC liegen.
Für andere Chips, wird auch ein andere Implementierung sinnvoller sein. Ein SoC ist ein wenig was anderes als eine reine CPU.

Selbst wenn was davon bei AMD liegen sollte, werden die entsprechenden Experten dann halt abgeworben

Apple ist ja jetzt nicht gerade als unattraktiver Arbeitgeber bekannt
 
bensen schrieb:
Wenn Apple hier Logik auf Logik stapelt, hat das nicht mehr viel mit AMDs Ansatz zu run, außer das auch SoiC genutzt wird.
Schau dir mal an was AMD hier stapelt und klebt: https://drive.google.com/file/d/1J9tLeVbFRtarzIzkVrULiEBsRsEMNmEO/edit
bensen schrieb:
Da müssten ungleich mehr Verbindungen für Daten und Power her.
Der 3D-Cache von AMD hat abartig viele Verbindungen weil das draufgeklebte Teil ein reines SRAM-Array ist.
 
Wenn man CPUs stapelt, dann könnte das ein indikator dafür sein, dass man stärker auf Wattarme cpus zusteuert. Also könnte die Entwicklung Richtung Effizienz getrieben werden.
Das würde dem Wärmeproblem doch entgegen Steuern. Oder was denkt ihr?
 
foofoobar schrieb:
Nicht Logik auf Logik. Das liegt alles nebeneinander.
foofoobar schrieb:
Der 3D-Cache von AMD hat abartig viele Verbindungen weil das draufgeklebte Teil ein reines SRAM-Array ist.
Schau dir die Die Shots an. Das ist recht übersichtlich. Mit ner GPU auf ner CPU sähe das ganz anders aus und wäre erheblich problematischer.
 
bensen schrieb:
Nicht Logik auf Logik. Das liegt alles nebeneinander.
Dann schau dir das ruhig noch mal genauer an. (S. 6 oben)
bensen schrieb:
Schau dir die Die Shots an. Das ist recht übersichtlich. Mit ner GPU auf ner CPU sähe das ganz anders aus und wäre erheblich problematischer.
Die Verbindungen liegen ja recht eng beieinander, da sieht aus großer Höhe immer "übersichtlich" aus.
Was sollte ich also auf den Die-Shots erkennen?
 
foofoobar schrieb:
Dann schau dir das ruhig noch mal genauer an. (S. 6 oben)
Was soll ich da sehen, außer das GPU und CPU nebeneinander liegen? Vielleicht selber nochmal anschauen?
foofoobar schrieb:
Die Verbindungen liegen ja recht eng beieinander, da sieht aus großer Höhe immer "übersichtlich" aus.
Was sollte ich also auf den Die-Shots erkennen?
Vielleicht mal die Metal layer einer CPU im Vergleich anschauen?
 
Zurück
Oben