Bei Kontakten gibt man gewöhnlich den Pitch (Abstand) an, oft ist der Abstand 2 x Bump-Durchmesser. Bei Leitungen gibt es verschiedene Angaben, manchmal als Breite/Zwischenraum und manchmal als Abstand.
Die Angaben auf den Folien und damit auch im Artikel sind verwirrend. Der Artikel datiert aus 2019, also müsste es um Zen 2 gehen.
Ich habe mich erinnert und einen Foliensatz zu einem ISSCC Vortrag von Sam Naffziger aus dem Jahr 2020 hervorgekramt. Einen ähnlichen Vortrag hat er auch 2021 auf der 48. ISCA gehalten. Hier habe ich die Zusammenfassung als Artikel vorliegen. Bei den Vorträgen ging es hauptsächlich um EPYC.
Der Pitch bei Zen 2 ist 150 µm (IOD) und 130 µm (CCD). Für Zen 4 werden die Werte tiefer liegen. Angstronomics gibt für RDNA 3 einen Pich von 35 µm an.
Sam Naffiziger begründet warum AMD bei Zen 2 kein Silizium Interposer gewählt hat:
- Der Infinity Fabric bei Zen 2 hat eine Bandbreite von 55 GB/s. Dies ist erheblich weniger als HBM (mehrere hindert GB/s) benötigt. Für HBM ist ein Interposer notwendig, für das Infinity Fabric nicht.
- Anmerkung: bei der MI200 werden HBM und GCDs durch Silizium-Brücken gekoppelt. Die beiden GCD werden durch 4 Kanäle Infinity Fabrik gekoppelt. Diese Verbindung geht über das Fanout.
- Anmerkung:
- Wenn wir alle 8 CCDs zusammennehmen kommen bei Zen 2/3 insgesamt 440 GB/s zusammen. Zen 4 hat (DDR 5) mehr.
- Bei der RX7900XT sind es 4,3 TB/s, die tatsächlich von den verfügbaren 5,3 TB/s genutzt werden.
- Außerdem sind die Anforderungen bei der RX7900 an die Latzenz erheblich höher, da hier der L3-Cache verbunden wird und bei Zen nur DRAM-Anbindung und Inter-CCD-Kommunikation.
- Ich gehe davon aus, dass, solange es nur IOD und CCD gibt, AMD auf organischen Substraten bleibt.
- Schauen wir mal was Zen 5 so alles an Chiplets hat.
- Interposer ermöglichen eine hohe Bandbreite, aber die mögliche Signalstrecke ist eingeschränkt. D.h- Silizium Interposer sind ideal um zwei Chiplets Kante an Kante mit einer hohen Bandbreite zu verbinden, aber sie wären nicht geeignet die zweite Reihe der Chiplets bei Epic effektiv anzubinden. damit wären nur 4 CCDs möglich.
Anmerkung:
Bei ein Artikel wurde die Signalqualität von Fanout und Silizium-Interposer verglichen, die des Fanouts war besser. Auch beim Fanout kann man passive Bauelemente einzubinden.
- Die maximale Größe von Silizium-Interposer war für EPYC zu klein. Es wären maximal 4 CCDs möglich gewesen.
- Silizium Interposer waren zu teuer.
Wegen der Wiederverwendung der CCDs zwischen EPYC und Ryzen muss bei beiden dieselbe Packaging Technik verwendet werden.
Fanout war 2019 noch keine Option. Auch deshalb hat es Sam Naffziger nicht erwähnt.
Fanout ist im Vergleich zu einem Silizium Interposer erheblich billiger und auch die für EPYC erforderlichen Abmessungen sind möglich. Aber es ist teurer als die Lösung mit dem organic Substrat und wird bei Zen von der Bandbreite her nicht wirklich benötigt.
Wegen der mehreren Reihen von CCDs ist Evelated Fanout Bridge für EPYC nicht sinnvoll. Für Ryzen zu garantiert teuer.
Das Routing bei EPYC Zen 2 war herausfordernd, und mit 4 weiteren CCDs ist es bei Zen 4 nicht einfacher geworden. deshalb hätte ich, wie gesagt, erwartet, dass AMD auf ein Fanout umsteigt. Aber wenn sie es nicht jetzt getan haben werden sie es beim Zen 4 nicht mehr machen.
Das Substrat bei Zen 2 EPYC hat AFAIK 20 Layer und trotzdem musste AMD Layer aus dem Package in die CCDs verschieben. Nur dadurch konnte AMD unter deb CCDs Platz für den Inifinity Fabric schaffen.
Bei AM5 sehe ich es am kritischsten, dass man die Sockelmaße beibehalten hat.