http://www.cs.utah.edu/thememoryforum/mike.pdf
Auf Seite 11 hier steht das selbe nochmal zu lesen.
Auf Seite 12 steht exakt was Nai beschreibt.
Auf Seite 13 ist der Unterschied abgebildet den ich beschrieben habe:
Oben Nais Beschreibung, unten meine Beschreibung.
Bei oberer Auslastung der Channels ist INterleaving sinnvoll und wird angewand. Limitiert allerdings 4 Banks die zusammen Interleaven können.
Bei unterer Auslastung macht Interleaving keinen Sinn mehr, da der Channel lückenlos ausgelastet ist.
Detailierter ist das in dieser Quelle unter Pseudo-Channel beschrieben, die Auszüge habe ich hier schon gepostet im Thread.
http://www.hotchips.org/wp-content/...Bandwidth-Kim-Hynix-Hot Chips HBM 2014 v7.pdf
Dort findest du allerdings auch die Erklärung wie die I/O angebunden sind.
Das Wirebonding von GDDR5 ist auf Seite 4 erklärt.
Der Untrerschied zur TSV Anbindung auf HBM auf der folgenden Seite 5.
Eine Schematische Darstellung auf Seite 9 des gesamten Stacks inkl. der Tabelle wie die Chanell-verteilung auf eien Stack (4Hi-1GB) ist.
Auf Seite 10 dann die schematische Darstellung er Innterconnects im INterpsoer zum SoC (CPU oder GPU ist identisch angebunden)
Es gibt keinen Sockel der die IO verbindet. Auf dem Base Die (Logic-Die) sind laut Grafik enthalten: DFT Area, TSV Area und PHY - wie man erkennen kann werden die TSV nicht raus geleitet aus dem Stack, sondern es gibt eine Übergabe an den "PHY" - wie der gestaltet ist, ist noch nicht beschrieben worden in einer Quelle die mir bekannt wäre.
Noch etwas Detailierter ist es auf der Seite 12 dargestellt.
Was das Speicherinterface auf der GPU angeht: es wird kleiner trotz massivem Sprung auf 4096-bit bei 4 GB HBM.
Siehe dazu aus diesem Artikel bei pcper:
http://www.pcper.com/reviews/Genera...Memory-HBM-Architecture-AMD-Plans-Future-GPUs
Besides the spacing consideration and bandwidth improvements, there are likely going to be some direct changes to the GPUs that integrate support for HBM. Die size of the GPU should go down to some degree because of the memory interface reduction. With more simplistic clocking mechanisms and lower required clock rates, as well as with much finer pitches coming in through the GPUs PHY, integration of memory on an interposer can change die requirements for memory connections. Macri indicated that it would be nearly impossible for any competent GPU designer to build a GPU that doesn’t save die space with a move to HBM over GDDR5.
Edit:
Aus diesem Grund muss man übrigens auch zwei völlig unterschiedliche GPUs herstellen wenn man sie mit HBM oder GDDR5 bestücken will. Der Platz auf dem Die für 4096-bit SI ist nicht zu realisieren in vernünftigem Kostenrahmen. Daher wird es wohl keine FijiHBM und eine Fiji GDDR5 geben.