Acht Nvidia GeForce 8600 GTS im Test: Direct3D 10 trifft auf Custom-Designs

 2/14
Wolfgang Andermahr
40 Kommentare

Technische Daten

GeForce
7600 GT
GeForce
8600 GTS
GeForce
8600 GT
Radeon
X1650 XT
Logo GeForce 7600 GT GeForce 8600 GTS GeForce 8600 GTS Radeon X1650 XT
Chip G73 G84 G84 RV560
Transistoren ca. 178 Mio. ca. 289 Mio. ca. 289 Mio. ca. 330 Mio.
Fertigung 90 nm 80 nm 80 nm 80 nm
Chiptakt 560 MHz 675MHz 540 MHz 575 MHz
Shadertakt 560 MHz 1450 MHz 1190 MHz 575 MHz
Pixel-Pipelines 12 X X 8
Shader-Einheiten
(MADD)
24 (4D) 32 (1D) 32 (1D) 24 (4D)
FLOPs (MADD/ADD) 107 GFLOPS 139 GFLOPS* 114 GFLOPS* 166 GFLOPS
ROPs 8 8 8 8
Pixelfüllrate 4480 MPix/s 5400 MPix/s 4320 MPix/s 4600 MPix/s
TMUs 12 16 16 8
TAUs 12 16 16 8
Texelfüllrate 6720 MTex/s 10800 MTex/s 8640 MTex/s 4600 MTex/s
Vertex-Shader 8 X X 5
Unified-Shader
in Hardware
X X
Pixelshader PS 3.0 SM 4 SM 4 PS 3.0
Vertexshader VS 3.0 SM 4 SM 4 VS 3.0
Geometryshader X X
Speichermenge 256 GDDR3 256 GDDR3 256 GDDR3 256 GDDR3
Speichertakt 700 MHz 1000 MHz 700 MHz 675 MHz
Speicherinterface 128 Bit 128 Bit 128 Bit 128 Bit
Speicherbandbreite 22400 MB/s 32000 MB/s 22400 MB/s 21600 MB/s

Die Nvidia GeForce 8600 GTS basiert auf der von TSMC im 80-nm-Prozess gefertigten G84-GPU, die wiederum auf dem G80 basiert und 289 Millionen Transistoren beherbergt. Auf der GPU werden 32 skalare Shadereinheiten im Unified-Shader-Prinzip verbaut, die pro Takt eine Skalaranweisung durchführen können. Aus diesem Grund sind die ALUs des G84 sehr flexibel, da sie unabhängig von der Shaderoperation (1D, 2D, 3D, 4D, 5D) arbeiten können. Die Auslastung wird somit maximiert. Die ALUs besitzen auf dem G84 eine eigene Taktdomäne, die auf der GeForce 8600 GTS mit 1450 MHz operiert. Neben Vertex- und Pixelshaderbefehlen kann der G84 zudem Geometryshaderanweisungen durchführen, was eine Voraussetzung der Direct3D-10-Spezifikation ist.

Darüber hinaus verbaut Nvidia auf dem G84 16 Texture Mapping Units sowie 16 Texture Addressing Units, die selbst FP32-Texturen filtern können (aktuelles Format in Spielen ist maximal FP16 pro Farbkanal – 64 Bit Farbtiefe). Die Fähigkeit, eine trilineare oder bilinear anisotrope Filterung innerhalb eines Taktes durchzuführen, ist auf einem G84 im Gegensatz zum G80 also nicht mehr vorhanden. Auf dem G84 sind acht ROPs vorhanden, die bis hinauf zu „richtigem“ High Dynamic Range Rendering mit 128 Bit Farbtiefe arbeiten, falls dies von einer Applikation angefordert wird. Die GPU arbeitet (abgesehen von den Shadereinheiten) mit einer Frequenz von 675 MHz.

Auf der GeForce 8600 GTS wird je nach Wahl des Herstellers ein 256 MB oder 512 MB großer Speicher verbaut, der an einem 128 Bit breiten Speicherinterface angebunden ist. Dies wird erreicht, indem je zwei Speicherbausteine mit einem 64 Bit breiten Bus an die GPU angebunden werden. Die Referenztaktung des VRAMs beträgt nach Nvidia-Vorgaben 1000 MHz. Wer genaueres über die G8x-Architektur erfahren möchte, dem empfehlen wir unseren Launch-Artikel zur GeForce 8800 GTX.



*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.