LamaMitHut schrieb:
Es ist ein anderer Aspekt der GPU der in diesem in diesem Patentantrag beschrieben wird.
Im Patentantrag US20230376318A1 wird die Aufteilung der Geometrie Engine auf mehrere Chiplets beschrieben, im Patentantrag US20230376318A1 geht es um das Aufteilen der Shader (Binning) auf mehrere Ciplets.
AMD hat einige Patentanträge und Patente in diesem Umfeld. Beide Patentanträge sind Neueinreichungen bereits erteilter Patente.
MLID hat ja im Sommer behauptet dass die angeblich gecancelte Navi 41 auf dem Patentantrag US 2022/0320042 A1 beruhen sollte.
Dass US 2022/0320042 A1 im Jahr 2024 für eine Gaming GPU gepant war, halte ich für Unsinn. Das was US 2022/0320042 A1 zeigt, ist für Gaming GPUs viel zu aufwändig. Aber das Video hat bei den üblichen Verdächtigen große Welle geschlagen.
IIRC hatte es besonders diese Grafik MLID angetan:
Ich kann hier einige Gemeinsamkeiten mit der MI300 erkennen.
- MID (508) weglassen,
- SED (412) => XCD,
- 4 statt 2 AID verwenden
- anstatt dem Bridge Chip (504) einen Interposer verwenden auf dem auch die Memory Module (506) sitzen ...
Und bei der Geschichte dass AMD Navi 41 gecancelt haben soll bin ich auch sehr gespannt was da letztendlich raus kommt. Die Logik eine komplett neue Architektur nur bei den kleinsten SKUs einzuführen und als TOP-SKU die vorherige Generation beizubehalten erschließt sich mir nicht. Da muss AMD ja höllisch aufpassen keine also großen Verbesserungen einzuführen ...
LamaMitHut schrieb:
So habe ich das nicht gemeint. Wenn das ganze in der Praxis funktioniert, wäre es in der Form eine Revolution.
Es gibt zwei Herausforderungen um die Rechenwerke einer GPU in Chiplets aufzuteilen. Um als eine GPU agieren zu können
- müssen sehr viele Verbindungen zwischen den Chiplets geknüpft werden. Wir reden hier von mehr als 10 000 Verbindungen zwischen zwei Chiplets.
- muss die Verbindung zu den anderen Chiplets mindestens dieselbe Bandbreite haben mit der der lokale Speicher an das Chiplet angeschlossen ist. Nur dann sind alle Speichermodule für das Chiplet gleichwertig.
Um das erfüllen zu können benötigt man einen Silizium Interposer oder zumindest Silizium-Brücken.
Bei der MI250 hat AMD nur zwischen den HBM-Stacks und den GCDs Siliziumbrücken verwendet. Die beiden GCDs wurden über das Fanout gekoppelt. Damit besteht die MI250X aus 2 logischen GPUs.
Apple hat AFAIK mit dem M1 und M2 Ultra eine Multi Chiplet GPUallerdings umgesetzt. Hier ist es eine logische GPU auf 2 Dies. Bei Apple wird der Speicher (LPDDR5) per Fanout mit den APU-Dies verbunden. Bei den M1 bzw. M2 Ultra werden beide APU-Dies über eine Silizium-Brücke gekoppelt. Es stehen also ausreichend Verbindungen und ausreichend Bandbreite zwischen den beiden Dies bereit.
Das Navi 31 GCD ist nur 300 mm² groß. Navi 21 war 520 mm² groß. Hier hat AMD noch deutlich Potential zum Steigern der Die-Fläche. Aus diesem Grund denke ich dass das Aufteilen der eigentlichen GPU auf mehrere Chiplets für Gaming GPUs bei AMD so schnell nicht erforderlich ist.
Multi Die GPUs erwarte ich bei AMD zuerst bei CDNA. Es ist noch unklar aus wie vielen logischen GPUs eine MI300A oder eine MI300X besteht. Ich habe dazu von ein und derselben Person unterschiedliche Statements gelesen.