GeForce GTX 980/970 im Test: Nvidia Maxwell 2.0 für High-End ist da

Wolfgang Andermahr
1.504 Kommentare
GeForce GTX 980/970 im Test: Nvidia Maxwell 2.0 für High-End ist da

Einleitung

Nvidia Maxwell in der zweiten Generation für High-End-Grafikkarten ist da. Die ersten beiden Grafikkarten tragen die Bezeichnung GeForce GTX 980 und 970. Sie ersetzen mit GTX 770, 780 und 780 Ti zu zweit gleich drei Vorgänger. Die alten Karten laufen aus.

Modell GPU Preis Status
GeForce GTX 980 GM204 540 Euro (UVP)
GeForce GTX 780 Ti GK110 499 Euro wird eingestellt
GeForce GTX 780 GK110 370 Euro wird eingestellt
GeForce GTX 970 GM204 320 Euro (UVP)
GeForce GTX 770 GK104 260 Euro wird eingestellt
Alle Preise auf Basis sofort lieferbarer Angebote

Die neuen Grafikkarten sollen bei der Leistungsfähigkeit überlegen sein und dabei deutlich weniger verbrauchen, verspricht Nvidia. Neue Funktionen, die der Bildqualität zu Gute kommen, gibt es auch. ComputerBase hat die Grafikkarten ausführlich getestet.

Neben der GeForce GTX 980 im Referenzdesign hat sich für den Test die Gigabyte GeForce GTX 980 G1 Gaming in der Redaktion eingefunden. Die günstigere Variante ist durch die Asus GeForce GTX 970 Strix und die Gigabyte GeForce GTX 970 G1 Gaming vertreten.

Maxwell 2.0

Maxwell als Nachfolger der Kepler-Architektur gibt es auf GeForce GTX 750 Ti und GeForce GTX 750 seit über einem halben Jahr. Die auf beiden Grafikkarten verwendete GM107-GPU setzte auf die Maxwell-Architektur der „ersten Generation“, deren oberstes Ziel die bessere Energieeffizienz gewesen sein soll.

Maxwell 2.0 als GM204 auf der GeForce GTX 980
Maxwell 2.0 als GM204 auf der GeForce GTX 980

Der GM204 der GeForce GTX 980 und GeForce GTX 970 basiert dagegen auf der „zweiten Generation“, die neben der Leistungsaufnahme auch die Geschwindigkeit sowie neue Features in den Fokus stellt. Ein Überblick der Neuerungen.

GPU-Architektur

Auch der GM204 wird von TSMC im bekannten 28-nm-HP-Verfahren hergestellt und umfasst 5,2 Milliarden Transistoren. Die Chipgröße liegt bei 398 mm², was ihn analog zur Ausstattung mit Transistoren näher am GK104 als am GK110 positioniert. Mit rein rechnerisch 13,1 Millionen Transistoren pro Quadratmillimeter liegt der GM204 bei der Packdichte vor den anderen Nvidia-GPUs im Vergleich, aber hinter Hawaii von AMD. Die Entwicklung der Grundarchitektur hat laut Nvidia bereits im Jahr 2011 begonnen.

Chip GM204 GM107 GK104 GK110 Hawaii
Transistoren ca. 5,2 Mrd. ca. 1,9 Mrd. ca. 3,5 Mrd. ca. 7,1 Mrd. ca. 6,2 Mrd.
Fertigung 28 nm HP TSMC 28 nm HP TSMC 28 nm HP TSMC 28 nm HP TSMC 28 nm HP TSMC
Chipgröße 398 mm² 148 mm² 294 mm² 550 mm² 438 mm²
Packdichte* 13,1 12,8 11,9 12,9 14,2
* In Millionen Transistoren pro mm²
GK104 auf GM204 auf GK110
GK104 auf GM204 auf GK110

Die Grundarchitektur des GM204 lehnt sich stark am GM107 an, anstelle eines Graphics Processor Cluster (GPC) gibt es allerdings deren vier. Im Detail gibt es jedoch Anpassungen, so dass GM204 nicht einfach dem Vierfachen des GM107 entspricht.

Das beginnt bei der Anzahl der Streaming Multiprocessors (SMM) pro GPC, die gegenüber dem GM107 von fünf auf vier gefallen ist. Gegenüber GK104 stellt das allerdings weiterhin eine Verdopplung dar. Beim Aufbau des SMM orientiert sich der große Maxwell-Chip hingegen an der kleinen Variante, 128 Shader und 8 TMUs bedeuten erneut eine klare Veränderung in der Architektur gegenüber Kepler. Dabei gibt Nvidia an, dass die ALUs auf dem GM204 um 40 Prozent schneller rechnen als auf dem GK104 – beim Sprung von GK107 auf GM107 hatte Nvidia von einem Leistungszuwachs von 35 Prozent gesprochen.

GM204 GM107 GK104
Graphics Processor Cluster (GPC) 4 1 4
Streaming Multiprocessors (SMM) pro GPC 4 5 2
Shader pro SSM 128 128 192
TMUs pro SSM 8 8 16
Polymorph-Engine pro SSM (Version) 1 (3.0) 1 (2.0) 1 (2.0)
Shader gesamt 2.048 640 1.536
TMUs gesamt 128 40 128

In zwei Punkten unterscheiden sich die SMM auf GM107 und GM204 allerdings doch. Nvidia gibt an, die Polymorph-Engine in den SMM erneut überarbeitet zu haben. Worin der Vorteil der Version 3.0 gegenüber der Version 2.0 liegt, darüber schweigt sich der Hersteller allerdings aus. Ein Blockschaltbild weist allerdings einen „Vertex Fetch“ sowie einen zusätzlichen „Attribute Setup“ aus, sodass die neuen Polymorph Engines Grafikobjekte schneller einlesen können sollten.

Bildvergleich: Blockdiagramm Nvidia GM204 Ein Streaming Multiprocessor Maxwell im Detail

Die zweite Änderung innerhalb der SMM ist im L1-Cache zu suchen. Bei GM204 legt der schnelle Zwischenspeicher um 50 Prozent auf nun 96 KB zu. Der L2 Cache außerhalb der SMMs bleibt dagegen mit 2.048 KB unangetastet. Während GM107 gegenüber GK107 also einen großen Schritt macht, ist der Cache „nur“ noch um 512 KB größer als bei GK110.

GM204 GM107 GK104 GK110
L1-Cache je SMM 96 KB 64 KB 64 KB 64 KB
L2-Cache je GPU 2.048 KB 2.084 KB 512 KB 1.536 KB

Auch abseits der GPCs und ihrer SMMs hat sich gegenüber GK104 etwas getan. So hat Nvidia die Anzahl der ROPs pro Cluster verdoppelt. Mit 64 ROPs bietet bereits GM204 damit ein Drittel mehr als GK110 und die doppelte Anzahl wie GK104. Beim Aufbau des Speicherinterface ist gegenüber GK104 dagegen alles beim Alten geblieben: Vier 64-Bit-Controller sorgen für ein 256 Bit breites Speicherinterface.

GM204 GM107 GK104 GK110
ROP-Cluster 4 2 4 6
ROPs pro Cluster 16 8 8 8
ROPs gesamt 64 16 32 48
Speichercontroller 4 × 64 Bit 2 × 64 Bit 4 × 64 Bit 6 × 64 Bit
Speicherinterface 256 Bit 128 Bit 256 Bit 384 Bit

Das ist damit um genau 50 Prozent kleiner als auf dem großen Kepler GK110. Der neue Chip soll das durch eine bessere Speicherkomprimierung, die mehr Farbvarianten komprimiert als zuvor (Delta Color Compression), allerdings in Teilen ausgleichen – genau wie AMD mit der Tonga-GPU. Die dritte Generation der Speicherkomprimierung (Fermi: 1. Generation, Kepler: 2. Generation) soll die vorhandene Bandbreite 25 Prozent effizienter nutzen: Rein rechnerisch entspricht das Speicherinterface des GM204 damit einem hypothetischen GK104 mit 320 Bit breitem Speicherinterface.

Die Geschwindigkeit bei der Berechnung in doppelter Genauigkeit (Double Precision) ist auch beim GM204 wie beim Maxwell-Chip der ersten Generation deutlich auf ein Zweiunddreißigstel reduziert.

GM204 GM107 GK104 GK110
DP/SP-Verhältnis* 1/32 1/32 1/24 1/3
* Leistung Double Precision im Verhältnis zu Single Precision, maximal

In Summe sollen alle Veränderungen gegenüber GK104 und GM107 zur Folge haben, dass GM204 bei gleichem Energieverbrauch doppelt so schnell rechnet wie GK104, stellt Nvidia in Aussicht.