nVidia GeForce 8800 Ultra im Test: Monster-Performance zu einem hohen Preis
2/31Technische Daten
Radeon X1950 XTX |
GeForce 7950 GX2 |
GeForce 8800 Ultra |
GeForce 8800 GTX |
GeForce 8800 GTS |
|
---|---|---|---|---|---|
Logo | |||||
Chip | R580+ | G71 | G80 | G80 | G80 |
Transistoren | ca. 384 Mio. | ca. 2x 278 Mio. | ca. 681 Mio | ca. 681 Mio. | ca. 681 Mio. |
Fertigung | 90 nm | 90 nm | 90 nm | 90 nm | 90 nm |
Chiptakt | 650 MHz | 500 MHz | 612 MHz | 575 MHz | 500 MHz |
Shadertakt | 650 MHz | 500 MHz | 1512 MHz | 1350 MHz | 1200 MHz |
Pixel-Pipelines | 16 | 2x 24 | X | X | X |
Shader-Einheiten (MADD) |
48 (4D) | 48 (4D) | 128 (1D) | 128 (1D) | 96 (1D) |
FLOPs (MADD/ADD/MUL) |
374 GFLOPS | 2x 192 GFLOPS | 581 GFLOPS* | 518 GFLOPS* | 346 GFLOPS* |
ROPs | 16 | 2x 16 | 24 | 24 | 20 |
Pixelfüllrate | 10400 MPix/s | 2x 8000 MPix/s | 14688 MPix/s | 13800 MPix/s | 10000 MPix/s |
TMUs | 16 | 2x 24 | 64 | 64 | 48 |
TAUs | 16 | 2x 24 | 32 | 32 | 24 |
Texelfüllrate | 10400 MTex/s | 2x 12000 MTex/s | 39168 MTex/s | 36800 MTex/s | 24000 MTex/s |
Vertex-Shader | 8 | 2x 8 | X | X | X |
Unified-Shader in Hardware |
X | X | ✓ | ✓ | ✓ |
Pixelshader | PS 3.0 | PS 3.0 | SM 4 | SM 4 | SM 4 |
Vertexshader | VS 3.0 | VS 3.0 | SM 4 | SM 4 | SM 4 |
Geometryshader | X | X | ✓ | ✓ | ✓ |
Speichermenge | 512 GDDR4 | 2x 512 GDDR3 | 768 GDDR3 | 768 GDDR3 | 640 GDDR3 |
Speichertakt | 1000 MHz | 600 MHz | 1080 MHz | 900 MHz | 800 MHz |
Speicherinterface | 256 Bit | 256 Bit | 384 Bit | 384 Bit | 320 Bit |
Speicherbandbreite | 64000 MB/s | 2x 38400 MB/s | 103680 MB/s | 86400 MB/s | 64000 MB/s |
Gerüchte über die GeForce 8800 Ultra gab es viele. Manche sprachen von einer übertakteten GeForce 8800 GTX, andere hingegen von einer Erweiterung der Shader-Cluster in der G80-GPU. Nun steht fest: Letzteres spart sich nVidia wohl für spätere Chips auf. Die GeForce 8800 Ultra basiert auf der bewährten G80-GPU und kommt mit einer angezogenen Taktschraube daher. Somit stehen dem Käufer 128 skalare 1D-Shadereinheiten zur Verfügung, die pro Takt jeweils ein MADD (Multiply-ADD) sowie ein MUL (Multiplikation)* berechnen können. Da die ALUs eine separate Taktdomäne besitzen, werden diese deutlich schneller angesteuert als die restlichen Teile der GPU. Dieser Takt beläuft sich bei der GeForce 8800 Ultra auf 1512 MHz (GeForce 8800 GTX: 1350 MHz), was eine theoretische Arithmetikleistung von satten 581 GFLOPS* ergibt.
Der G80 beinhaltet 32 TAU (Texture Addressing Units). Es können also 32 Texturen gleichzeitig adressiert werden. Interessanterweise verdoppelt man aber die Zahl der Texturfiltereinheiten auf 64, weswegen es auf einer GeForce 8800 möglich ist, entweder eine trilinear oder eine bilinear anisotrop gefilterte Textur innerhalb eines Takts fertigzustellen. Bisherige GPUs haben (bis auf wenige Ausnahmen) für diese Operation immer zwei Takte benötigt. Darüber hinaus sind 24 ROPs auf dem G80 verbaut, die vor allem bei reinen Z- oder Stencil-Anweisungen extrem schnell ihre Arbeit verrichten können. Der Takt der „TMU-Domäne“ auf der GeForce 8800 Ultra beträgt 612 MHz (GeForce 8800 GTX: 575 MHz).
Die GeForce 8800 Ultra setzt wie das alte Flaggschiff GeForce 8800 GTX auf ein sechs Mal 64 Bit breites Speicherinterface, aus dem eine Busbreite von 384 Bit resultiert. Der Speicherausbau beträgt weiterhin 768 MB, die mit 1080 MHz (GeForce 8800 GTX: 900 MHz) angetrieben werden. Im Vergleich zur GeForce 8800 GTX ist die Speicherbandbreite deswegen um ein gutes Stück auf etwas über 100 GB pro Sekunde angestiegen. Die Texelfüllrate machte hingegen lediglich einen kleineren Sprung. Etwa 3000 Millionen Texel pro Sekunde mehr können auf der GeForce 8800 Ultra berechnet werden. Wer weitere Details über die G80-Architektur von nVidia erfahren möchte, dem empfehlen wir unser Artikel zur Vorstellung der GeForce 8800 GTX.
*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.