GeForce GTX 960 im Test: Schneller und langsamer als die GeForce GTX 760
Einleitung
Nach GeForce GTX 980 für 540 Euro und GeForce GTX 970 für 320 Euro UVP bringt Nvidia die Maxwell-Architektur mit der GeForce GTX 960 in das Preissegment um 200 Euro. Das Rezept für den niedrigeren Preis: Die neue GM206-GPU, die einem halben GM204 der beiden größeren Grafikkarten nahe kommt. Zum Start zwei Gigabyte GDDR5 an einem nur 128 Bit breiten Speicherinterface halten die Kosten ebenfalls niedrig.
Für den ersten Test zur Markteinführung haben sich GeForce GTX 960 von Asus, EVGA, MSI und Palit in der Redaktion eingefunden. Ob Maxwell auch in der Mittelklasse für mehr Leistung bei weniger Verbrauch als die letzte Generation sorgt, klärt der Test.
Preissegment | AMD | Nvidia |
---|---|---|
220-250 Euro | Radeon R9 280X Preis: 215 € Leistung: 112 % |
- |
180-220 Euro | Radeon R9 285 Preis: 196 € € Leistung: 100 % |
GeForce GTX 960 UVP: 199 € |
150-180 Euro | Radeon R9 280 Preis: 179 € Leistung: 99 % |
GeForce GTX 760 Preis: 179 € Leistung: 93 % |
*Leistung bezieht sich auf 1.920 × 1.080 4xAA/16xAF Radeon R9 285 normiert auf 100% |
Technische Eckdaten
Die auf der GeForce GTX 960 verbaute GM206-GPU wird wie der größere GM204 im 28-nm-Prozess bei TSMC hergestellt und weist eine Fläche von 227 mm² auf. Der Chip setzt sich aus 2,94 Milliarden Transistoren zusammen.
Chip | GM204 | GM206 | GM107 | GK104 | GK106 |
---|---|---|---|---|---|
Eingesetzt in | GTX 980, GTX 970 | GTX 960 | GTX 750 Ti, GTX 750 | GTX 770, 760, 680, 670, 660 Ti | GTX 660, GTX 650 Ti (Boost) |
Transistoren | ca. 5,2 Mrd. | ca. 2,94 Mrd. | ca. 1,9 Mrd. | ca. 3,5 Mrd. | ca. 2,54 Mrd. |
Fertigung | 28 nm HP TSMC | 28 nm HP TSMC | 28 nm HP TSMC | 28 nm HP TSMC | 28 nm HP TSMC |
Chipgröße | 398 mm² | 227 mm² | 148 mm² | 294 mm² | 214 mm² |
Packdichte* | 13,1 | 13,0 | 12,8 | 11,9 | 11,9 |
* In Millionen Transistoren pro mm² |
Während der GM204 noch auf vier Graphics Processor Cluster (GPC) zurück greifen kann, sind es beim GM206 laut Nvidia noch zwei. Da die interne Konfiguration der GPC identisch geblieben ist, wird die Anzahl der Ausführungseinheiten durch den Eingriff halbiert. So bleiben dem GM206 insgesamt 1.024 Shader. Dabei handelt es sich laut Nvidia um den aktivierten Vollausbau, weitere Einheiten sind physisch nicht vorhanden.
GM204 | GM 206 | GM107 | GK104 | GK106 | |
---|---|---|---|---|---|
Shared Cache | 96 KB | 96 KB | 64 KB | 64 KB | 64 KB |
L2-Cache je GPU | 2.048 KB | 1.024 KB | 2.084 KB | 512 KB | 384 KB |
Da der GM206 der „zweiten Generation Maxwell“ entspricht, weisen der L1-Cache eine Größe von 48 KB pro SMM (insgesamt 384 KB) und der Shared-Cache eine Größe von 96 KB (insgesamt 768 Kilobyte) auf. Interessanterweise hat Nvidia auch den L2-Cache auf dem GM206 auf 1.024 KB reduziert. Nicht nur der GM204 kann auf einen mit 2.048 KB doppelt so großen L2-Cache zurück greifen, auch der langsamere GM107 setzt auf zwei Megabyte. Auch bei den ROPs findet sich der 50-Prozent-Rotstift, 32 ROPs in zwei Partitionen bleiben dem Chip.
GM204 | GM206 | GM107 | GK106 | |
---|---|---|---|---|
Graphics Processor Cluster (GPC) | 4 | 2 | 1 | 3 |
Streaming Multiprocessors (SMM) pro GPC | 4 | 4 | 5 | 2 und 1 |
Shader pro SSM | 128 | 128 | 128 | 192 |
TMUs pro SSM | 8 | 8 | 8 | 16 |
Polymorph-Engine pro SSM (Version) | 1 (3.0) | 1 (3.0) | 1 (2.0) | 1 (2.0) |
Shader gesamt | 2.048 | 1.024 | 640 | 960 |
TMUs gesamt | 128 | 64 | 40 | 80 |
Der Basis-Takt der GeForce GTX 960 liegt bei 1.127 MHz. Die durchschnittliche Leistungsaufnahme beträgt bei dieser Frequenz 120 Watt. Daher ist ein Sechs-Pin-Stromstecker ausreichend, solange sich der Hersteller an die Referenzvorgaben hält. Nvidia überlässt es jedoch den Herstellern, eine andere Stromversorgung für einen höheren Taktspielraum zu nutzen.
Beim Speicherinterface sind auf dem GM206 zwei 64-Bit-Controller und damit ein 128-Bit-Interface übrig geblieben. Der Speichertakt beträgt nach den Referenzvorgaben 3.504 MHz. Die resultierende Speicherbandbreite beträgt 112 GB/s. Das liegt auch dann noch deutlich unter den 192 GB/s der GeForce GTX 760 mit 256-Bit-Bus, wenn Nvidias Angabe, Maxwell sei 25 Prozent effizienter bei der Nutzung der Bandbreite, in Betracht gezogen wird – effektiv 140 GB/s sind das Resultat. Bremsen soll das den Chip laut Nvidia nicht. Der Speicherausbau beträgt 2.048 MB, wobei es den Herstellern offiziell überlassen ist, auch 4.096-MB-Modelle anzubieten. „Zu Beginn wird es die aber nicht geben“, erklärt Nvidia.
Der GM206 kommt mit der modernsten Video-Engine aller Nvidia-GPUs daher. Als erste GPU kann der GM206 den H.265-Codec (HEVC) de- und encodieren, während bisherige GPUs den Codec ausschließlich encodieren können. Darüber hinaus ist der HDMI-Ausgang mit der neuesten Version des Kopierschutzes HDCP 2.2 ausgestattet, sodass die GeForce GTX 960 die erste Grafikkarte im Handel ist, die die zukünftigen Blu-rays mit Ultra-HD-Auflösung abspielen kann.
Zu guter Letzt hat sich auch bei den Monitoranschlüssen etwas getan: Der GM206 kann gleichzeitig vier Ultra-HD-Monitore oder vier 5K-Monitore ansteuern. Nvidia erwähnt darüber hinaus erneut, dass die neue GPU DirectX 12 unterstützt. Nichtsdestoweniger bleibt offen, was das heißt, da Microsoft die Spezifikationen noch nicht finalisiert hat. Das Feature-Level 11.2 wird, anders als bei Kepler, in jedem Fall vollständig unterstützt.
GeForce GTX 760 |
GeForce GTX 960 |
GeForce GTX 970 |
Radeon R9 285 |
|
---|---|---|---|---|
Shader-Einheiten | 1.152 | 1.024 | 1.664 | 1.792 |
Basis-Chiptakt | 980 MHz | 1.127 MHz | 1.015 MHz | X |
Maximaler Takt | 1.110 MHz | 1.178 MHz** | 1.178 MHz** | 918 MHz |
SP-GFLOPS | 2.557 GFLOPS | 2.412 GFLOPS | 3.920 GFLOPS | 3.290 GFLOPS |
ROPs | 32 | 32 | 64 | 32 |
Pixelfüllrate | 35.520 MPix/s | 37.696 MPix/s | 61.256 MPix/s | 29.376 MPix/s |
TMUs | 96 | 64 | 104 | 112 |
Texelfüllrate | 106.560 MTex/s | 75.392 MTex/s | 122.512 MTex/s | 102.816 MTex/s |
DirectX (vollständig) | 11.0 | 11.2 | 11.2 | 11.2 |
GPU ohne Monitor abschaltbar |
X | X | X | ✓ (ZeroCore) |
Speichermenge | 2.048 MB GDDR5 | 2.048 MB GDDR5 | 4.096 GDDR5 | 2.048 MB GDDR5 |
Speichertakt | 3.004 MHz | 3.504 MHz | 3.504 MHz | 2.750 MHz |
Speicherinterface | 256 Bit | 128 Bit | 256 Bit | 256 Bit |
Speicherbandbreite | 192.256 MB/s | 112.128 MB/s | 224.384 MB/s | 176.000 MB/s |
Stromangaben Typisch/Maximal |
170/? Watt | 120/? Watt | 145/? Watt | 190/? Watt |
** Durchschnittlicher Turbo-Takt; Basis für Leistungswerte |