Laut den technischen Ausführungen bei PCPer ist aber nciht nur der kleinere Speicherpool langsamer angebunden sondern automatisch auch der ganze große Speicherpool.
Es wird zwar behauptet es ist ein 256-Bit SI, doch in der dortigen, Extra für dieses Problem angefertigten, Grafik ergibt sich folgendes Bild:
Offensichtlich sind die 3,5 GB Pool mit lediglich 7 ports anstatt 8 angebunden, weil eben dieser achte Port die restlichen 500MB separat anbindet, da sonst das Loadbalancing alle Ports mit der max. Geschwindigkeit des langsamsten achten Ports angebunden gewesen wären.
But the GTX 970 and its altered design has to do things differently. If you walked across the memory interface in the exact same way, over the same 4GB capacity, the 7th crossbar port would tend to always get twice as many requests as the other port (because it has two memories attached). In the short term that could be ok due to queuing in the memory path. But in the long term if the 7th port is fully busy, and is getting twice as many requests as the other port, then the other six must be only half busy, to match with the 2:1 ratio. So the overall bandwidth would be roughly half of peak. This would cause dramatic underutilization and would prevent optimal performance and efficiency for the GPU.
Damit fehlt allerdings auch der achte Port an dem grossen Speicherpool der 3,5 GB - somit kann wohl davon ausgehen, dass auch hier nicht die volle versprochene Anbindung vorhanden sein kann wie bei GTX980 - also selbst der 3,5 GB VRAM langsamer angesprochen wird um 1/8. Im Prinzip ist die Anbindung max. so schnell als wären lediglich 3,5 GB verbaut und somit haben alle echten 4 GB GPUs wie die GTX980 eine Bandbreite die um 1/8 höher ist.
Auf jeden Fall hat kein Stück des 3,5 GB VRAMs einer GTX 970 224 GB/s Bandbreite wie zugesagt. Die restlichen 500 MB sowieso nicht.