GeForce GTX 480 im Test: Nvidias neues Grafik-Flaggschiff sucht die Extreme

 2/29
Wolfgang Andermahr
2.740 Kommentare

Technische Daten und Details

Radeon
HD 5850
Radeon
HD 5870
GeForce
GTX 285
GeForce
GTX 470
GeForce
GTX 480
Logo ATi Radeon Graphics klein ATi Radeon Graphics klein Nvidia GeForce Nvidia GeForce Nvidia GeForce
Chip RV870/Cypress RV870/Cypress GT200b GF100 GF100
Transistoren ca. 2,15 Mrd. ca. 2,15 Mrd. ca. 1,4 Mrd. ca. 3 Mrd. ca. 3 Mrd.
Fertigung 40 nm 40 nm 55 nm 40 nm 40 nm
Chiptakt 725 MHz 850 MHz 648 MHz 607 MHz 700 MHz
Shadertakt 725 MHz 850 MHz 1.476 MHz 1.215 MHz 1.401 MHz
Shader-Einheiten
(MADD)
288 (5D) 320 (5D) 240 (1D) 448 (1D) 480 (1D)
FLOPs (MADD/ADD) 2.090 GFLOP/s 2.720 GFLOPS 1.063 GFLOPS 1.089 GFLOPS 1.345 GFLOPS
ROPs 32 32 32 40 48
Pixelfüllrate 23.200 MPix/s 27.200 MPix/s 20.736 MPix/s 24.280 MPix/s 33.600 MPix/s
TMUs 72 80 80 56 60
TAUs 72 80 80 56 60
Texelfüllrate 52.200 MTex/s 68.000 MTex/s 51.840 MTex/s 33.992 MTex/s 42.000 MTex/s
Shader-Model SM 5 SM 5 SM 4 SM 5 SM 5
Hybrid-CF/-SLI X X X X X
effektive Windows
Stromsparfunktion
Speichermenge 1.024 MB GDDR5 1.024 MB GDDR5 1.024 MB GDDR3 1.280 MB GDDR5 1.536 MB GDDR5
Speichertakt 2.000 MHz 2.400 MHz 1.242 MHz 1.676 MHz 1.848 MHz
Speicherinterface 256 Bit 256 Bit 512 Bit 320 Bit 384 Bit
Speicherbandbreite 128.000 MB/s 153.600 MB/s 158.976 MB/s 134.080 MB/s 177.408 MB/s

Die Nvidia GeForce-GTX-400-Serie basiert auf der GF100-GPU, die wohl besser unter der Bezeichnung „Fermi“ bekannt ist. Der GF100 setzt sich aus etwa drei Milliarden Transistoren zusammen, die im modernen und schwer zu beherrschenden 40-nm-Prozess bei TSMC hergestellt werden. Genauer auf die Architektur wollen wir an dieser Stelle nicht eingehen, da wir dies bereits in einem gesonderten Artikel vor einiger Zeit erledigt haben.

Nvidia schickt als erstes die GeForce GTX 480 und die GeForce GTX 470 in die Händlerregale, die in einer etwas anderen Konfiguration als bisher gedacht an den Start gehen werden. Denn obwohl der GF100 eigentlich über vier Graphics Processing Clusters (GPCs) mit jeweils vier Streaming-Multiprocessors (SM), insgesamt sind es deren 16, verfügt, deaktiviert Nvidia selbst bei dem Flaggschiff GeForce GTX 480 einen SM.

Damit erhält der Käufer nicht die theoretisch möglichen 512 ALUs (CUDA-Cores), sondern nur 480. Warum Nvidia diesen Schritt unternommen hat, ist unklar. Gerüchte gehen davon aus, dass nur so die TDP (maximal mögliche Leistungsaufnahme) in einem gewissen Rahmen gehalten werden konnte, andere vermuten einen Designfehler, der erst spät erkannt worden ist und einen SM unbrauchbar macht.

Wie auch immer, die 15 Streaming-Multiprocessors haben weitere Folgen: Denn die GeForce GTX 480 vertraut auf 60 vollwertige Textureinheiten anstatt auf die 64 verbauten im GF100 und es geht eine „Polymorph-Engine“ verloren, die sich um die Raster- und Geometrie-Arbeit kümmert. Auf der GeForce GTX 470 ist ein weiterer SM abgeschaltet, weswegen noch 448 ALUs, 56 TMUs und 14 Polymorph-Engines übrig bleiben.

GF100-GPU
GF100-GPU

In der Vollausstattung kommt dagegen das Speicherinterface der GeForce GTX 480 daher, das eine Breite von 384 Bit aufweist. Diese setzen sich aus sechs 64 Bit Controllern zusammen, die jeweils an eine der sechs ROP-Partitions angebunden sind. Jede ROP-Partition beinhaltet acht ROPs, also insgesamt 48. Der Speicherausbau beträgt 1.536 MB (12 x 128-MB-Chips, jeweils zwei mit einem Speichercontroller verbunden).

Auf der GeForce GTX 470 fehlt eine ROP-Partitions, was bei dem Endprodukt 40 ROPs, ein 320 Bit Speicherinterface und einen 1.280 MB großen VRAM bedeutet. Eine der größten Unbekannten waren bis jetzt die Taktraten. Die TMU-Domäne der GeForce GTX 480 taktet mit 700 MHz, während die Shadereinheiten mit den doppelt so hohen 1.401 MHz angesteuert werden. Gerüchte, dass die TMUs mit dem Hot-Clock der ALUs laufen, sind also unwahr. Der GDDR5-Speicher auf dem Flaggschiff wird mit konservativen 1.848 MHZ betrieben.

Auf der GeForce GTX 470 läuft die TMU-Domäne mit 607 MHz, die Shadereinheiten mit 1.215 MHz und der GDDR5-Speicher mit 1.674 MHz. Für zukünftige Produkte kann Nvidia die Speicherbandbreite also problemlos durch eine Erhöhung der Taktrate massiv steigern.

Die maximal mögliche Leistungsaufnahme der GeForce GTX 480 beläuft sich laut Nvidia auf 250 Watt, weswegen ein Sechs-Pin- und ein Acht-Pin-Stromstecker notwendig sind. Die GeForce GTX 470 verbraucht immer noch maximal 215 Watt, was jedoch zwei Sechs-Pin-Stromstecker ausreichend macht. Die Empfehlungen der Netzteile liegen bei 600 Watt (GTX 480) beziehungsweise 550 Watt (GTX 470). Unter Windows sollen die GF100-Probanden ähnlich effektiv wie die GeForce-GTX-200-Karten agieren, um Strom sparen zu können. Die verschiedenen Power-Modi der Karten führen wir in einer Tabelle gesondert auf, wobei „P0“ der Lastzustand und „P12“ der komplette Idle-Zustand sind.

GeForce GTX 480
P0 P3 P8 P12
TMU-Domäne 700 MHz 405 MHz 405 MHz 50 MHz
Shader-Domäne 1.401 MHz 810 MHz 810 MHz 101 MHz
Speicher 1.848 MHz 1.848 MHz 324 MHz 135 MHz
GeForce GTX 470
P0 P3 P8 P12
TMU-Domäne 607 MHz 405 MHz 405 MHz 50 MHz
Shader-Domäne 1.215 MHz 810 MHz 810 MHz 101 MHz
Speicher 1.676 MHz 1.676 MHz 324 MHz 135 MHz

Wie weiter oben erwähnt, finden sich ausführliche Informationen zur Architektur des GF100 in einem bereits früher erschienenen Artikel.