GeForce GTX 980/970 im Test: Nvidia Maxwell 2.0 für High-End ist da

2/17

19.9.2014 4:30 Uhr

DirectX 11.2 und DirectX 11.3

Mit Maxwell 2.0 findet eine lange geführte Diskussion um das Für und Wider von DirectX 11.1 und DirectX 11.2 in den GPUs von Nvidia ein Ende: Als erster Chip unterstützt GM204 das volle „Feature Level“ der Microsoft API in der aktuellsten Version.

	GM204	GM107	GK104	GK110	Hawaii
DirectX (vollständig)	11.2	11.0	11.0	11.0	11.2

Ob die GPU auch alle Neuerungen von DirectX 12 und dem von Microsoft parallel zur Vorstellung von GTX 980 und 970 überraschend angekündigten DirectX 11.3 beherrschen wird, dazu gibt es noch keine Aussage. Zwar präsentiere Microsoft zusammen mit Nvidia vier neue Funktionen aus DirectX 11.3/DirectX 12, die GM204 mindestens unterstützen wird:

Rasterizer Ordered View
Typed UAV Load
Volume Tiled Resources
Conservative Raster

Es könnten auch mehr sein, offizielle Aussagen dazu gibt es nicht. Weder Nvidia noch AMD noch Intel können schon heute mit Sicherheit versprechen, die neuen APIs nach ihrer Fertigstellung vollumfänglich zu unterstützen – eben weil sie noch nicht fertig sind. Es wird weitere neue Funktionen geben, welche Hardware sie voraussetzen, hält Microsoft noch geheim. „Die Feature Levels sind seitens Microsoft noch nicht definiert“, heißt es seitens Nvidia.

Bei Kepler bot Nvidia am Ende vier der zehn neuen Funktionen von DirectX 11.1 in Hardware an, so dass eine Unterstützung auf vollem „Feature Level“ verwehrt blieb.

GM204 unterstützt Raster Ordered View aus DirectX 11.3 / 12

Microsoft hat beide APIs für das Weihnachtsgeschäft 2015 in Aussicht gestellt, die Spezifizierung allerdings noch nicht abgeschlossen.

GM204 unterstützt Conservative Raster aus DirectX 11.3 / 12

Video und Virtual Reality

Auch der Encoder NVENC erfährt mit dem GM204 eine kleine Überarbeitung und kann ab sofort Videos im H.265-Codec encodieren. Den älteren H.264-Codec kann der GM204 wie der GM107 dagegen um den Faktor 2,5 schneller encodieren als Kepler, sodass auch 3.840 × 2.160 mit 60 FPS über den NVENC läuft.

Ebenso neu sind Verbesserungen bezüglich Virtual Reality. Nvidia will bei GM204 die Latenz zwischen Körperbewegung und Umsetzung im Spiel von 40 Millisekunden auf 25 Millisekunden reduziert haben, Nvidia nennt das System dahinter „Asynchronous Warp“. Der bewirkt, dass die GPU direkt nach der Fertigstellung des ersten Frames das nächste Bild auf Verdacht anfängt zu berechnen ohne auf die Input-Eingabe zu warten. Die eigentliche Bewegung des Spielers wird so spät wie möglich im Renderprozess berücksichtigt.

Noch nicht implementiert, aber in Arbeit, ist ein neues SLI-Verfahren für Virtual Reality. Es soll nicht auf Alternate Frame Rendering (AFR) setzen wie das klassische Verfahren. Bei AFR berechnen die beiden GPUs abwechselnd jeweils ein Bild, das erzeugt Verzögerung. Bei der neuen Lösung soll stattdessen jede GPU ein einzelnes Display ansteuern – d.h. der eigentliche Bildschirminhalt wird auf beide GPUs aufgeteilt, die Berechnung der beiden Hälften für die beiden Augen erfolgt parallel.

Die neuen Grafikkarten

Eingesetzt wird der GM204 vorerst auf zwei Grafikkarten: Der GeForce GTX 980 und der GeForce GTX 970. Beide unterscheiden sich in der aktivierten Anzahl der Ausführungseinheiten sowie den GPU-Taktraten. Und wie sich mittlerweile (Stand vom 29.1.2015) herausgestellt hat, gibt es auch beim Speicher, dem Speicherinterface, den ROPs und dem L2-Cache einen Unterschied. Die Tabelle mit den technischen Daten wurde entsprechend nach den aktuellen Vermutungen korrigiert.

	GeForce GTX 980	GeForce GTX 970 (korrigierte, interpretierte Specs)	GeForce GTX 780 Ti	Radeon R9 290X
Shader-Einheiten	2.048	1.664	2.880	2.816
Basis-Chiptakt	1.126 MHz	1.050 MHz	875 MHz	-
Maximaler Takt	1.240 MHz	1.178 MHz**	1.006 MHz	1.000 MHz
SP-GFLOPS*	5.079 GFLOPS	3.920 GFLOPS	5.040 GFLOPS	5.632 GFLOPS
ROPs	64	56	48	64
Pixelfüllrate*	79.360 MPix/s	61.256 MPix/s	35.000 MPix/s	64.000 MPix/s
TMUs	128	104	240	176
Texelfüllrate*	158.720 MTex/s	122.512 MTex/s	210.000 MTex/s	176.000 MTex/s
L2-Cache	2.048 KB	1.792 KB	1.536 KB	1.024 KB
GPU ohne Monitor abschaltbar	X	X	X	✓ (ZeroCore)
Speichermenge	4.096 MB GDDR5	4.096 MB insgesamt 3.584 MB GDDR5 (224 Bit) + 512 MB GDDR5 (32 Bit)	3.072 GDDR5	4.096 MB GDDR5
Speichertakt	3.506 MHz	3.506 MHz	3.504 MHz	2.500 MHz
Speicherinterface	256 Bit	256 Bit insgesamt 224 Bit (3.584 MB) + 32 Bit (512 MB)	384 Bit	512 Bit
Speicherbandbreite	224.384 MB/s	196.336 MB/s + 28.048 MB/s	336.384 MB/s	320.000 MB/s
Stromangaben Typisch/Maximal	?/165 Watt	?/145 Watt	?/250 Watt	250/? Watt
* Leistungswerte für eine bessere Vergleichbarkeit auf Basis des maximalen Taktes
** Leistungswerte auf Basis des durchschnittlichen Turbo-Taktes