Nvidia-Grafikkarten im Test: Eine neue GeForce 9500 GT und alte 9800 GT

 2/30
Wolfgang Andermahr
125 Kommentare

Technische Daten

Radeon
HD 3650
GeForce
8600 GTS
GeForce
9500 GT
GeForce
9600 GT
Logo ATi Radeon Graphics Nvidia GeForce Nvidia GeForce Nvidia GeForce
Chip RV635 G84 G96 G94
Transistoren ca. 378 Mio. ca. 289 Mio. ca. 314 Mio. ca. 505 Mio.
Fertigung 55 nm 80 nm 55 nm
(zuerst 65 nm)
65 nm
Chiptakt 725 MHz 675 MHz 550 MHz 650 MHz
Shadertakt 725 MHz 1.450 MHz 1.400 MHz 1.625 MHz
Shader-Einheiten
(MADD)
24 (5D) 32 (1D) 32 (1D) 64 (1D)
FLOPs (MADD/ADD) 174 GFLOPS 139 GFLOPS* 134 GFLOP/s* 312 GFLOPS*
ROPs 4 8 8 16
Pixelfüllrate 2900 MPix/s 5400 MPix/s 4400 MPix/s 10400 MPix/s
TMUs 8 16 16 32
TAUs 16 16 16 32
Texelfüllrate 5800 MTex/s 10800 MTex/s 8800 MTex/s 20800 MTex/s
Shader-Model SM 4.1 SM 4 SM 4 SM 4
Hybrid-CF/-SLI X X X X
effektive Windows
Stromsparfunktion
X X X
Speichermenge 512 GDDR3 256 GDDR3 512 GDDR3 512 GDDR3
Speichertakt 800 MHz 1.000 MHz 800 MHz 900 MHz
Speicherinterface 128 Bit 128 Bit 128 Bit 256 Bit
Speicherbandbreite 25600 MB/s 32000 MB/s 25600 MB/s 57600 MB/s

Obwohl es die G96-GPU auf der GeForce 9500 GT in dieser Form noch nie gegeben hat, ist der Rechenkern nicht wirklich neu. Einfach ausgedrückt ist der G96 nichts anderes als ein G92-Chip (eingesetzt unter anderem auf der GeForce 8800 GT sowie GeForce 9800 GTX), der auf die Anzahl der Einheiten in dem G84-Vorgänger reduziert worden ist. Gleichzeitig nimmt der Chip dann natürlich die modernere Fertigung sowie einige Verbesserungen in der Architektur mit.

Der G96 wird zu Beginn im mittlerweile etwas angestaubten 65-nm-Prozess bei TSMC hergestellt und trägt mit 314 Millionen Transistoren etwas mehr Schaltungen als der ältere G84. In Kürze soll die Produktion der GPU jedoch auf den 55-nm-Prozess umgestellt werden, mit dem Nvidia die Produktionskosten senken kann. Wann genau dieser Schritt durchgeführt wird, ist aber noch unbekannt.

Dem Käufer einer GeForce 9500 GT stehen 32 skalare Shadereinheiten zur Verfügung, die pro Takt ein MAD (Multiply-ADD) sowie ein MUL (Multiplikation) durchführen können. Letzteres ist aber nur selten für „General Shading“-Aufgaben zu gebrauchen, da das MUL meistens mit Special-Function-Unit-Berechnungen (wie beispielsweise einer Kosinus-Operation) beschäftigt ist. Darüber hinaus gibt es 16 vollwertige Textureinheiten, womit pro Takt 16 bilineare Pixel adressiert und auch texturiert werden können. Die Anzahl der ROPs (Raster Operation Processors) liegt bei acht.

Da die ROPs an das Speicherinterface gekoppelt sind und es pro ROP-Cluster einen 64-Bit-Memorycontroller gibt, ist das Speicherinterface auf dem G96 128 Bit breit. Die TMU-Domäne taktet auf der GeForce 9500 GT mit 550 MHz, während die Shadereinheiten mit 1.400 MHz angesteuert werden. Von der Grafikkarte wird es verschiedene Speichervarianten geben. Die von uns verwendete und schnellste nutzt einen 512 MB großen GDDR3-Speicher, der mit 800 MHz taktet. Zusätzlich gibt es ein günstigeres Modell, das auf DDR2-VRAM mit niedrigeren Frequenzen setzt.

Die generellen Vorteile der G9x-Architektur hat natürlich ebenso der G96 inne. Somit gibt es ein gegenüber der G8x-Architektur verbessertes PureVideo sowie einige Performancemodifizierungen. Hybrid-SLI und vor allem Hybrid-Power, mit dem man die Grafikkarte komplett deaktivieren könnte, um so Strom zu sparen, gibt es auf der GeForce 9500 GT leider nicht.

Über die GeForce 9800 GT gibt es hingegen nicht viel Spannendes zu berichten, da diese vom technischen Aspekt identisch mit der GeForce 8800 GT ist und nur einen anderen Namen trägt. Somit wird der G92 mit 112 Shadereinheiten, 56 Texture Mapping Units, 16 ROPs sowie einem 256-Bit-Speicherinterface genutzt. Die TMU-Domäne wird mit denselben 600 MHz betrieben, die Shadereinheiten mit 1.512 MHz. Der 512 MB große GDDR3-Speicher arbeitet mit 900 MHz. Einen Vorteil gegenüber der GeForce 8800 GT hat die GeForce 9800 GT dann aber doch. So unterstützt sie auf einem passenden Nvidia-Mainboard Hybrid-Power.

G96-GPU
G96-GPU
G92-GPU
G92-GPU

*Die von uns angegebenen GFLOP-Zahlen der G80/G92-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.