Nvidia GeForce 8800 GTS 512 im Test: Der G92 darf alle Muskeln spielen lassen
2/30Technische Daten
Radeon HD 3870 |
GeForce 8800 GTX |
(POV) GeForce 8800 GTS 512 |
GeForce 8800 GT |
GeForce 8800 GTS (320MB) |
|
---|---|---|---|---|---|
Logo | |||||
Chip | RV670 | G80 | G92 | G92 | G80 |
Transistoren | ca. 666 Mio. | ca. 681 Mio. | ca. 754 Mio. | ca. 754 Mio. | ca. 681 Mio. |
Fertigung | 55 nm | 90 nm | 65 nm | 65 nm | 90 nm |
Chiptakt | 775 MHz | 575 | 650 MHz (700 MHz) |
600 MHz | 500 MHz |
Shadertakt | 775 MHz | 1350 MHz | 1625 MHz (1750 MHz) |
1512 MHz | 1200 MHz |
Pixel-Pipelines | X | X | X | X | X |
Shader-Einheiten (MADD) |
64 (5D) | 128 (1D) | 128 (1D) | 112 (1D) | 96 (1D) |
FLOPs (MADD/ADD) | 496 GFLOPS | 518 GFLOPS* | 624 GFLOPS* (672 GFLOPS)* |
508 GFLOPS* | 346 GFLOPS* |
ROPs | 16 | 24 | 16 | 16 | 20 |
Pixelfüllrate | 12400 MPix/s | 13800 MPix/s | 10400 MPix/s (11200 MPix/s) |
9600 MPix/s | 10000 MPix/s |
TMUs | 16 | 64 | 64 | 56 | 48 |
TAUs | 32 | 32 | 64 | 56 | 24 |
Texelfüllrate | 12400 MTex/s | 36800 MTex/s | 41600 MTex/s (44800 MTex/s) |
33600 MTex/s | 24000 MTex/s |
Vertex-Shader | X | X | X | X | X |
Unified-Shader in Hardware |
✓ | ✓ | ✓ | ✓ | ✓ |
Shader-Model | SM 4.1 | SM 4 | SM 4 | SM 4 | SM 4 |
Geometryshader | ✓ | ✓ | ✓ | ✓ | ✓ |
Speichermenge | 512 GDDR4 | 768 GDDR3 | 512 GDDR3 | 512 GDDR3 | 640 GDDR3 (320 GDDR3) |
Speichertakt | 1125 MHz | 900 MHz | 970 MHz (1000 MHz) |
900 MHz | 800 MHz |
Speicherinterface | 256 Bit | 384 Bit | 256 Bit | 256 Bit | 320 Bit |
Speicherbandbreite | 72000 MB/s | 86400 MB/s | 62080 MB/s (64000 MB/s) |
57600 MB/s | 64000 MB/s |
Die GeForce 8800 GTS 512 basiert wie die GeForce 8800 GT auf der neuen G92-GPU, die im modernen 65-nm-Verfahren bei TSMC produziert wird und satte 754 Millionen Transistoren beinhaltet. Allerdings lief der G92 auf der GeForce 8800 GT, wie wir bereits vermutet hatten, nur mit angezogener Handbremse, die man nun auf der GeForce 8800 GTS 512 gelöst hat. Der G92 verfügt auf der GeForce 8800 GTS 512 wie die G80-GPU über 128 Shadereinheiten (acht aktive Cluster, auf der GeForce 8800 GT waren es dagegen nur sieben), die pro Takt ein MADD (Multiply-ADD) sowie ein MUL (Multiplikation) berechnen können. Letzteres ist aber nur selten für „General Shading“-Aufgaben zu gebrauchen, da das MUL meistens mit Special-Function-Unit-Berechnungen, wie beispielsweise eine Kosinus-Operation, beschäftigt ist.
Darüber hinaus sind auf dem G92 64 Textureinheiten aktiv (56 auf der GeForce 8800 GT), wobei pro Takt ein Texel gefiltert und adressiert werden kann. Diesbezüglich hat der G92 einen Vorteil gegenüber dem G80. Jedoch möchte Nvidia nicht, dass der G92 in jeder Situation vor dem G80 liegt, und hat deswegen die ROP-Partitionen gekürzt. Während auf dem G80 sechs ROP-Partitionen mit je vier Raster Operation Processors (24 ROPs) aktiv sind, agieren auf dem G92 nur vier ROP-Partitions, also insgesamt 16 ROPs – auch die GeForce 8800 GTS 512 ändert daran nichts. Dies wäre an und für sich nicht wirklich tragisch, da die ROPs in aktuellen 3D-Anwendungen nur selten der limitierende Faktor sind. Wer die G80-Architektur aber ein wenig kennt (und der G92 unterscheidet sich nicht wirklich von dieser), der weiß jedoch, dass der Speichercontroller an die ROPs gekoppelt ist.
An jeder ROP-Partition ist ein einzelner 64-Bit-Speichercontroller angeschlossen. Der G80 kann somit auf sechs 64-Bit-Controller zurückgreifen, weswegen das Speicherinterface 384 Bit breit ist. Auf dem G92 sind dagegen nur vier ROP-Partitions vorhanden, weswegen das Speicherinterface nur 256 Bit beträgt. Auch wenn Nvidia den Speichertakt mit 970 MHz leicht höher als auf der GeForce 8800 GTX ansetzt, ist die Speicherbandbreite um einiges niedriger. Selbst eine alte GeForce 8800 GTS hat eine höhere Bandbreite. Und auch die Speicherausstattung fällt geringer aus. Die Standardversion der GeForce 8800 GTS 512 bietet dem Käufer einen 512 MB großen VRAM. Gerüchten zu Folge soll es aber zudem 1024-MB-Konfigurationen geben.
Die TMU-Domäne taktet auf der GeForce 8800 GTS 512 mit 650 MHz, die Shaderdomäne dagegen mit sehr hohen 1625 MHz. Die Rohleistung der GPU ist dementsprechend (abgesehen von der Speicherbandbreite und der unwichtigen Pixelfüllrate) höher als die einer GeForce 8800 GTX und einer GeForce 8800 Ultra. Die geringere Bandbreite sowie der 512 MB große VRAM sind eindeutig der Flaschenhals auf der GeForce 8800 GTS 512.
Point of View schickt mit der GeForce 8800 GTS 512 Exo-Edition eine von Haus aus übertaktete GeForce 8800 GTS 512 ins Rennen. Die TMU-Domäne arbeitet auf der Point-of-View-Karte mit 700 MHz, die ALUs mit 1750 MHz und der Speicher mit nur knapp schnelleren 1000 MHz. Davon abgesehen gibt es keinerlei Unterschiede zu einer GeForce 8800 GTS 512 im Referenzdesign. Wer genauere Details über die G92-Architektur erfahren möchte, dem empfehlen wir unser Launch-Review zur GeForce 8800 GT.
*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.