GeForce GTX 960 im Test: Schneller und langsamer als die GeForce GTX 760

22.1.2015 15:00 Uhr

Einleitung

Nach GeForce GTX 980 für 540 Euro und GeForce GTX 970 für 320 Euro UVP bringt Nvidia die Maxwell-Architektur mit der GeForce GTX 960 in das Preissegment um 200 Euro. Das Rezept für den niedrigeren Preis: Die neue GM206-GPU, die einem halben GM204 der beiden größeren Grafikkarten nahe kommt. Zum Start zwei Gigabyte GDDR5 an einem nur 128 Bit breiten Speicherinterface halten die Kosten ebenfalls niedrig.

Für den ersten Test zur Markteinführung haben sich GeForce GTX 960 von Asus, EVGA, MSI und Palit in der Redaktion eingefunden. Ob Maxwell auch in der Mittelklasse für mehr Leistung bei weniger Verbrauch als die letzte Generation sorgt, klärt der Test.

Angestrebte Marktposition der GeForce GTX 960

Preissegment	AMD	Nvidia
220-250 Euro	Radeon R9 280X Preis: 215 € Leistung: 112 %	-
180-220 Euro	Radeon R9 285 Preis: 196 € € Leistung: 100 %	GeForce GTX 960 UVP: 199 €
150-180 Euro	Radeon R9 280 Preis: 179 € Leistung: 99 %	GeForce GTX 760 Preis: 179 € Leistung: 93 %
*Leistung bezieht sich auf 1.920 × 1.080 4xAA/16xAF Radeon R9 285 normiert auf 100%

Technische Eckdaten

Die auf der GeForce GTX 960 verbaute GM206-GPU wird wie der größere GM204 im 28-nm-Prozess bei TSMC hergestellt und weist eine Fläche von 227 mm² auf. Der Chip setzt sich aus 2,94 Milliarden Transistoren zusammen.

Chip	GM204	GM206	GM107	GK104	GK106
Eingesetzt in	GTX 980, GTX 970	GTX 960	GTX 750 Ti, GTX 750	GTX 770, 760, 680, 670, 660 Ti	GTX 660, GTX 650 Ti (Boost)
Transistoren	ca. 5,2 Mrd.	ca. 2,94 Mrd.	ca. 1,9 Mrd.	ca. 3,5 Mrd.	ca. 2,54 Mrd.
Fertigung	28 nm HP TSMC	28 nm HP TSMC	28 nm HP TSMC	28 nm HP TSMC	28 nm HP TSMC
Chipgröße	398 mm²	227 mm²	148 mm²	294 mm²	214 mm²
Packdichte*	13,1	13,0	12,8	11,9	11,9
* In Millionen Transistoren pro mm²

Während der GM204 noch auf vier Graphics Processor Cluster (GPC) zurück greifen kann, sind es beim GM206 laut Nvidia noch zwei. Da die interne Konfiguration der GPC identisch geblieben ist, wird die Anzahl der Ausführungseinheiten durch den Eingriff halbiert. So bleiben dem GM206 insgesamt 1.024 Shader. Dabei handelt es sich laut Nvidia um den aktivierten Vollausbau, weitere Einheiten sind physisch nicht vorhanden.

	GM204	GM 206	GM107	GK104	GK106
Shared Cache	96 KB	96 KB	64 KB	64 KB	64 KB
L2-Cache je GPU	2.048 KB	1.024 KB	2.084 KB	512 KB	384 KB

Da der GM206 der „zweiten Generation Maxwell“ entspricht, weisen der L1-Cache eine Größe von 48 KB pro SMM (insgesamt 384 KB) und der Shared-Cache eine Größe von 96 KB (insgesamt 768 Kilobyte) auf. Interessanterweise hat Nvidia auch den L2-Cache auf dem GM206 auf 1.024 KB reduziert. Nicht nur der GM204 kann auf einen mit 2.048 KB doppelt so großen L2-Cache zurück greifen, auch der langsamere GM107 setzt auf zwei Megabyte. Auch bei den ROPs findet sich der 50-Prozent-Rotstift, 32 ROPs in zwei Partitionen bleiben dem Chip.

	GM204	GM206	GM107	GK106
Graphics Processor Cluster (GPC)	4	2	1	3
Streaming Multiprocessors (SMM) pro GPC	4	4	5	2 und 1
Shader pro SSM	128	128	128	192
TMUs pro SSM	8	8	8	16
Polymorph-Engine pro SSM (Version)	1 (3.0)	1 (3.0)	1 (2.0)	1 (2.0)
Shader gesamt	2.048	1.024	640	960
TMUs gesamt	128	64	40	80

Der Basis-Takt der GeForce GTX 960 liegt bei 1.127 MHz. Die durchschnittliche Leistungsaufnahme beträgt bei dieser Frequenz 120 Watt. Daher ist ein Sechs-Pin-Stromstecker ausreichend, solange sich der Hersteller an die Referenzvorgaben hält. Nvidia überlässt es jedoch den Herstellern, eine andere Stromversorgung für einen höheren Taktspielraum zu nutzen.

Beim Speicherinterface sind auf dem GM206 zwei 64-Bit-Controller und damit ein 128-Bit-Interface übrig geblieben. Der Speichertakt beträgt nach den Referenzvorgaben 3.504 MHz. Die resultierende Speicherbandbreite beträgt 112 GB/s. Das liegt auch dann noch deutlich unter den 192 GB/s der GeForce GTX 760 mit 256-Bit-Bus, wenn Nvidias Angabe, Maxwell sei 25 Prozent effizienter bei der Nutzung der Bandbreite, in Betracht gezogen wird – effektiv 140 GB/s sind das Resultat. Bremsen soll das den Chip laut Nvidia nicht. Der Speicherausbau beträgt 2.048 MB, wobei es den Herstellern offiziell überlassen ist, auch 4.096-MB-Modelle anzubieten. „Zu Beginn wird es die aber nicht geben“, erklärt Nvidia.

Der GM206 kommt mit der modernsten Video-Engine aller Nvidia-GPUs daher. Als erste GPU kann der GM206 den H.265-Codec (HEVC) de- und encodieren, während bisherige GPUs den Codec ausschließlich encodieren können. Darüber hinaus ist der HDMI-Ausgang mit der neuesten Version des Kopierschutzes HDCP 2.2 ausgestattet, sodass die GeForce GTX 960 die erste Grafikkarte im Handel ist, die die zukünftigen Blu-rays mit Ultra-HD-Auflösung abspielen kann.

Zu guter Letzt hat sich auch bei den Monitoranschlüssen etwas getan: Der GM206 kann gleichzeitig vier Ultra-HD-Monitore oder vier 5K-Monitore ansteuern. Nvidia erwähnt darüber hinaus erneut, dass die neue GPU DirectX 12 unterstützt. Nichtsdestoweniger bleibt offen, was das heißt, da Microsoft die Spezifikationen noch nicht finalisiert hat. Das Feature-Level 11.2 wird, anders als bei Kepler, in jedem Fall vollständig unterstützt.

	GeForce GTX 760	GeForce GTX 960	GeForce GTX 970	Radeon R9 285
Shader-Einheiten	1.152	1.024	1.664	1.792
Basis-Chiptakt	980 MHz	1.127 MHz	1.015 MHz	X
Maximaler Takt	1.110 MHz	1.178 MHz**	1.178 MHz**	918 MHz
SP-GFLOPS	2.557 GFLOPS	2.412 GFLOPS	3.920 GFLOPS	3.290 GFLOPS
ROPs	32	32	64	32
Pixelfüllrate	35.520 MPix/s	37.696 MPix/s	61.256 MPix/s	29.376 MPix/s
TMUs	96	64	104	112
Texelfüllrate	106.560 MTex/s	75.392 MTex/s	122.512 MTex/s	102.816 MTex/s
DirectX (vollständig)	11.0	11.2	11.2	11.2
GPU ohne Monitor abschaltbar	X	X	X	✓ (ZeroCore)
Speichermenge	2.048 MB GDDR5	2.048 MB GDDR5	4.096 GDDR5	2.048 MB GDDR5
Speichertakt	3.004 MHz	3.504 MHz	3.504 MHz	2.750 MHz
Speicherinterface	256 Bit	128 Bit	256 Bit	256 Bit
Speicherbandbreite	192.256 MB/s	112.128 MB/s	224.384 MB/s	176.000 MB/s
Stromangaben Typisch/Maximal	170/? Watt	120/? Watt	145/? Watt	190/? Watt
** Durchschnittlicher Turbo-Takt; Basis für Leistungswerte