GeForce GTX 470 im Test: Nvidias neue „Kleine“ ist besser als der große Bruder

 2/25
Wolfgang Andermahr
698 Kommentare

Technische Daten

Radeon
HD 5850
Radeon
HD 5870
GeForce
GTX 470
GeForce
GTX 480
Logo ATi Radeon Graphics klein ATi Radeon Graphics klein Nvidia GeForce Nvidia GeForce
Chip RV870/Cypress RV870/Cypress GF100 GF100
Transistoren ca. 2,15 Mrd. ca. 2,15 Mrd. ca. 3 Mrd. ca. 3 Mrd.
Fertigung 40 nm 40 nm 40 nm 40 nm
Chiptakt 725 MHz 850 MHz 607 MHz 700 MHz
Shadertakt 725 MHz 850 MHz 1.215 MHz 1.401 MHz
Shader-Einheiten
(MADD)
288 (5D) 320 (5D) 448 (1D) 480 (1D)
FLOPs (MADD/ADD) 2.090 GFLOP/s 2.720 GFLOPS 1.089 GFLOPS 1.345 GFLOPS
ROPs 32 32 40 48
Pixelfüllrate 23.200 MPix/s 27.200 MPix/s 16.996 MPix/s 21.000 MPix/s
TMUs 72 80 56 60
TAUs 72 80 56 60
Texelfüllrate 52.200 MTex/s 68.000 MTex/s 33.992 MTex/s 42.000 MTex/s
Shader-Model SM 5 SM 5 SM 5 SM 5
Hybrid-CF/-SLI X X X X
effektive Windows
Stromsparfunktion
Speichermenge 1.024 MB GDDR5 1.024 MB GDDR5 1.280 MB GDDR5 1.536 MB GDDR5
Speichertakt 2.000 MHz 2.400 MHz 1.676 MHz 1.848 MHz
Speicherinterface 256 Bit 256 Bit 320 Bit 384 Bit
Speicherbandbreite 128.000 MB/s 153.600 MB/s 134.080 MB/s 177.408 MB/s

Die GeForce GTX 470 basiert wie der größere Bruder GeForce GTX 480 auf der neuen GF100-GPU, die etwa drei Milliarden Transistoren umfasst und im modernen 40-nm-Verfahren bei TSMC hergestellt wird. Die Architektur an sich ist bei den beiden GeForce-GTX-400-Karten identisch, wie üblich sind bei der kleineren Karte jedoch nicht alle Einheiten aktiviert (streng genommen bei der GeForce GTX 480 aber auch nicht).

So sind auf der GeForce GTX 470 noch 14 anstatt 15 Streaming-Multiprocessors (SM) übrig geblieben, weswegen die Anzahl der skalaren Shadereinheiten von 480 ALUs auf 448 ALUs sinkt. Und es folgen weitere Kürzungen. Denn so ist an jedem SM in der GF100-Architektur noch ein Texture-Cluster mit jeweils vier vollwertigen Texture Mapping Units, TMUs, angeschlossen, die pro Takt einen Pixel adressieren und texturieren können. Damit sind auf der GeForce GTX 470 nur noch 56 TMUs aktiv, während es auf der größeren Karte noch deren 60 sind. Zusätzlich geht noch eine Polymorph-Engine verloren, die sich um die Raster- und Geometrie-Arbeit kümmert. Dort liegt die Anzahl bei 14, da es pro Streaming-Multiprocessors eine Polymorph-Engine gibt.

Nvidia hat auf der GeForce GTX 470 auch das Speicherinterface gekürzt, was sich auf dem 3D-Beschleuniger noch aus fünf 64-Bit-Speichercontroller zusammen setzt – einer wurde deaktiviert. Das Speicherinterface ist also noch 320 Bit breit. Pro Speichercontroller existiert eine ROP-Partition, bestehend aus je acht ROPs, wovon es auf der kleinen GeForce-GTX-400-Karte also noch 40 und nicht mehr 48 gibt.

Zu den ROPs wollen wir an dieser Stelle noch eine Anmerkung machen, da uns im Launch-Review ein Fehler unterlaufen ist. Denn wir sind nicht nur davon ausgegangen, dass eine ROP pro Takt einen Pixel fertigstellen kann (solange dieses aus einem „einfachen“ Format wie 32 Bit, acht Bit pro Farbkanal, stammt) – was so weit auch richtig ist. Gleichzeitig sind wir davon ausgegangen, dass die GPU genauso pro Takt einen Pixel für einen ROPs zur Verfügung stellen kann, was aber falsch ist. Denn so kann jeder Streaming-Multiprocessors der GPU pro Takt nur zwei Pixel an die ROPs weiter schicken, bei der GeForce GTX 480 also 30 Pixel und bei der GeForce GTX 470 28 Pixel. Die 48 respektive 40 ROPs können damit nicht voll ausgelastet werden.

Die „arbeitslosen“ ROPs (18 auf der GTX 480 und zwölf auf der GTX 470) sollen indes die Leistung bei Speicherzugriffen und beim Berechnen von Anti-Aliasing zu steigern. Dasselbe gilt bei Formaten, für die die ROPs mehr als einen Takt für einen Pixel benötigen (zum Beispiel bei FP16), obwohl sich die Effektivität der ROPs dann theoretisch halbiert. Wie die Kollegen der PCGH aber herausgefunden haben, muss der GF100 bei höherwertigen Formate die internen Datenpfade zwischen den Shadern und den ROPs ändern, sodass die effektive Bandbreite gleich bleibt und somit erneut nicht alle ROPs mit Daten gefüttert werden können.

GF100-GPU
GF100-GPU

Der Speicherausbau der GeForce GTX 470 besteht aus zehn 128-MB-Chips (pro Speichercontroller zwei Speicherchips), was in 1.280 MB resultiert. Der GDDR5-Speicher agiert mit 1.674 MHz. Die TMU-Domäne werden mit 607 MHz angesteuert und die Shadereinheiten mit 1.215 MHz. Die maximale Leistungsaufnahme beläuft sich auf 215 Watt.

Ausführliche Informationen zur Architektur des GF100 haben wir bereits in einem früheren Artikel zusammen gefasst.