mae schrieb:
AMD baut auch z.B. Ryzen 3100, 3600, und 5600 aus mehreren dies und verkauft sie billig, so teuer kann das advanced packaging nicht sein.
Als Advanced Packaging werden Techniken wie zum Beispiel Fanout, Silizium Brücken, Silizium Interposer oder Hybrid Bonding bezeichnet.
AMD verwendet Hybrid Bonding für den 3D V-Cache*). Ansonsten verwendet AMD bisher bei den Ryzen, Threadripper und EPYC CPUs kein Advanced Packaging. AMD plaziert die Chiplets immer noch auf dieselben Substrate, wie sie für alle monolithischen CPUs eingesetzt werden.
Bei der Navi 31 und 32 setzt AMD Fanout ein. Mit dieser Technik kann man deutlich feinere Leiterbahnen und Kontaktflächen realisieren. Damit konnte AMD über viele Verbindungen die hohe Bandbreite bereitstellen, die GPUs benötigen.
Für eine Multi GCD GPU ist Fanout alleine nicht ausreichend. Entweder
- wird Silizium Brücke in das Substrat bzw. in das Fanout eingebunden
- Intel bindet bei EMIB die Silizium Brücke in das Substrat ein
- AMD bindet bei der MI200 die Silizium Brücke ins Fanout ein
- oder
- wird ein Silizium Interposer verwendet
Silizium Brücken als Bauteile sich sind viel billiger als Silizium Interposer. Aber bei der Montage eines Packages mit Silizium Brücken gibt es Herausforderungen. Und diese steigen mit der Anzahl der verwendeten Silizium Brücken.
Jeder Die der platziert wird muss sowohl auf dem Fanout als auch auf den Silizium Brücken korrekt plaziert werden. Die Anordnung der Kontaktflächen von Silizium Brücken & Fanout müssen exakt zu den Kontaktflächen auf dem zu plazierenden Die passen. Beim ganzen Vorgang dürfen sich Silizium Brücken und Fanout nicht relativ zueinander bewegen. Die herausfordernde Montage dürfte der Grund sein warum AMD bei der MI300 einen Silizium Interposer verwendet.
Silizium Interposer sind teurer. Ein Kostentreiber sind die TSV. Die Montage der Dies ist einfacher und hier ist auch von Vorteil dass Interposer und Chipets denselben Wärmeausdehnungskoeefizienten habenA aber je größer der Interposer wird, desto problematischer sind die unterschiedlichen Wärmeausdehnungskoeefizienten von Silizium Interposer und Substrat.
*) Das AMD Client Segment hat ziemlich bescheidene Margen. Das beruht IMO auch auf dem hohen Anteil an X3D CPUs.
mae schrieb:
Auf der anderen Seite kostet jedes die Maskenkosten, die nach dem, was ich gelesen habe, bei $10M liegen. Wenn man davon dann wenige (z.B. nur 100000) verkauft, weil fast alle Spieler und AI-Kunden Nvidia kaufen, dann kosten allein die Masken fuer das Extra-die $100 pro Stueck; ob advanced packaging teurer ist?
Die Masken sind nur ein Teil der Entwicklungskosten, die für einen einzelnen Dies anfallen. Diese Kosten liegen deutlich höher und sind IMO der Grund dafür warum AMD je Generation deutlich weniger Dies auflegt als Nvidia.
Wegen der hohen Entwicklungskosten der einzelnen Dies bin ich skeptisch, dass AMD tatsächlich vor hatte 3 verschiedene Dies für 3 verschieden Multi GCD GPUs zu entwickeln. Es ist natürlich nicht auszuschließen, weil zwei GCD zu verbinden einfacher ist als 4 GCDs zu verbinden. Aber aus einem Die mehrere GPUs zu machen, passt IMO besser zum bisherigen Vorgehen AMD.
Auch das Entwickeln jedes Packages (GPU) erfordert einiges an Entwicklungsaufwand. Bei einer GPU reden wir von mehreren 10 000 Verbindungen zwischen den GCDs. So etwas zu entwerfen ist nicht trivial und hier muss das komplette Package simuliert und validiert werden. Dabei fällt für eine Multi GCD GPU ein erheblich höherer Aufwand an als für eine Chiplet CPU.
Zusätzlich zu diesen Entwicklungs-Kosten, die vor ab anfallen, kommen die Kosten für die zusätzlichen Prozessschritte, zusätzlichen Teile (Silizium Brücken bzw. Interposer) und des Ausschusses bei den zusätzlichen Prozessschritten. Diese Kosten fallen für jede einzelne GPU an. Auch hier sind die Kosten erheblich höher als sie momentan für CPUs anfallen. Mit der Reife der Prozesse fallen die Kosten durch Prozessoptimierung, d. h., zum Beispiel durch mehr Durchsatz oder weniger Ausschuss.
AMD ist bei RDNA3 den Schritt gegangen ist mit dem MCD Cache und Memory Controller aus der GPU zu lösen. Dadurch wurde der GCD erheblich kleiner als die monolitische GPU. Aber dies kann nur ein erster Schritt sein. Auf längere Sicht führt auch bei Gaming GPUs nichts an Multi GCD GPUs vorbei.
Wahrscheinlich ist der Punkt für Multi GCD GPUs bei AMD schon erreicht, bevor das GCD das Reticle Limit überschreitet. Durch das Ausgliedern der MCD hat AMD jedoch einiges ab Spielraum für den GCD gewonnen. Deshalb bin ich sehr skeptisch, ob AMD bereits bei RDNA4 Multi GCD GPU benötigt.
mae schrieb:
Anderswo schreibst Du, dass Navi 41-43 gecancelt wurden. Das waere ein Grund, auch eine Mittelklasse-GPU (wo wohl hoehere Stueckzahlen zum Tragen kommen) aus mehreren dies aufzubauen.
Bei der Mittelklasse hat man höhere Stückzahlen aber auch viel weniger Spielraum für zusätzliche Kosten.
Gerade bei der Mittelklasse kommt es darauf an ausgereifte Prozesse einzusetzen. Deshalb ich bin skeptisch, dass AMD gerade für die Produktion von der Mittelklasse GPUs neue komplexe Prozesse einführt.
mae schrieb:
Aber naja, alles Spekulation, wir sehen in ein paar Monaten, wie die GPUs wirklich ausschauen.
Dass wir bloß spekulieren ist doch klar. Wenn wir es wirklich wüssten, würden wir uns nicht in einem Forum über die zukünftigen GPUs austauschen
.