Der Chip schleppt, zumindest für's Gaming-Segment, einfach zu viel Ballast mit sich herum der Platz, Transistoren und Strom verbraucht, aber zu wenig bis garnichts für die Spieleleistung bringt.
Um mal die Unterschiede zu Tahiti hervorzuheben:
- verdoppelte ShaderEngines -> verbessert sicherlich die Auslastung/"IPC" etwas, aber benötigt eben auch doppelt so viel Platz und Transistoren und erhöht den Stromverbrauch dieses Teils der GPU (und durch die bessere Auslastung indirekt auch der CUs! Die 5870 war damals nicht grundlos etwas langsamer, aber eben auch sparsamer pro Takt und taktbarer, als man erwartet hätte, das war einfach auch eine Auslastungsgeschichte).
- verdoppelte Primitive-Pipelines & Tesselation-Einheiten -> bringt logischerweise nur in Spielen mit ziemlich hoher Polygonzahl bzw. Tesselation-Leveln was, macht den Chip aber ebenfalls größer und stromhungriger (unabhängig vom Spiel).
- größerer Tesselation Perimeter Cache -> keine Ahnung wie viel größer, kostet aber auf jeden Fall zusätzlichen Platz und Strom und bringt nur bei Tesselation was.
- verdoppelter L2 Cache -> hilft zwar ein wenig bei hohen Tesselation-Leveln und fängt zusammen mit DCC die geringere Bandbreite etwas auf, benötigt aber eben auch doppelt so viel Platz und damit Strom wie bei Tahiti. Und bevor jetzt jemand darauf verweist, dass ja 512KB deaktiviert sind: richtig, nur wenn ich den Die-Shot richtig lese, ist der L2 auf zwei Cache-Einheiten, an die je 3x256KB gekoppelt sind, verteilt, während Tahiti wohl nur eine hatte. Bei den Tongas ist dann zwar je 1x256KB pro L2-Einheit deaktiviert, aber die Kontroll-Logik dürfte voll aktiv sein und somit auch fast voll Strom verbrauchen, so dass der Verbrauch eben nicht nur 2/3 eines doppelten Tahiti-L2 entspricht.
- flächenoptimiertes SI -> braucht zwar weniger Platz pro 128 bit, es kann aber durchaus sein, dass Tahitis SI zwar größer ist, aber für Speicher-Taktraten von ~5.5-6GHz etwas weniger Strom braucht, weil es eben taktfreundlicher ist. Kann also sein, dass AMD nicht nur flächenmäßig, sondern auch vom Verbrauch her bei Tonga mit einem doppelten Bonaire-SI unterm Strich besser gefahren wäre (und von der Bandbreite bei 256-bit natürlich auch, weil dann 6.5-7GHz Speichertakt möglich gewesen wären, wovon zumindest die 380X profitiert hätte).
- 128 bit ungenutztes SI -> sind allein ca. 27-28 mm² ungenutzte Fläche, und ob die in Sachen Leakage/Verbrauch wirklich zu 100% deaktiviert/ge-power-gated/"totgelasert" sind und nichts verbrauchen, oder nur per Bios/ROM deaktiviert sind und trotzdem etwas zum Verbrauch beitragen, wissen wir auch nicht.
- Delta Color Compression -> soll zwar kaum Platz benötigen, aber auch das nimmt erstmal einen Tick mehr Transistoren und damit Strom in Anspruch, und hilft nur in Titeln mit genug Bandbreiten-Anforderungen.
- Hardware-DX12, FP16-Unterstützung und andere CU-Änderungen -> GCN1.2-CUs scheinen trotz 1:16 DP eher etwas größer und stromhungriger zu sein als selbst Tahitis 1:4-DP-CUs, von Pitcairns CUs ganz zu schweigen.
- Im "Uncore"-Bereich sitzen gegenüber Tahiti ein größerer UVD-Block, größerer VCE-Block, die TrueAudio DSPs, 6 zusätzliche ACEs (und wahrscheinlich auch noch größere, da ab GCN1.1 bis zu 8 Queues unterstützt werden), und der Display-Controller düfte u.a. durch FreeSync-Unterstützung auch etwas gewachsen sein.
Insgesamt quetscht Tonga halt trotz 1:16-DP mal eben satte ~700 Mio. Transistoren mehr in die gleiche Fläche, wobei diese höhere Dichte übrigens auch einer der Gründe für die miese Taktbarkeit sein könnte, evtl. hat der Chip einfach auch etwas mehr mit Leakage/Hotspots zu kämpfen als Tahiti und GM204.