Vorschau auf die nVidia GeForce 6800 Ultra: Auf NV30 folgt NV40
4/12Technische Daten
Der NV40 soll mit einem Rundumschlag nicht nur eine Steigerung gegenüber dem eigenen Vorgänger darstellen, sondern muss auch gegen den Next-Gen Chip von ATi bestehen, dem rund die doppelte Leistung der Radeon 9800 Pro nachgesagt wird.
GeForce4 Ti4800 |
GeForce FX 5800 Ultra |
GeForce FX 5950 Ultra |
GeForce 6800 Ultra |
|
---|---|---|---|---|
Chip | NV28 | NV30 | NV38 | NV40 |
Transistoren | ca. 63M | ca. 130M | ca. 135M | ca. 222M |
Fertigung | 0,15 µm | 0,13 µm | 0,13 µm | 0,13 µm |
Taktung (MHz) | 300 | 500 | 475 | 400 |
Renderpipes | 4 | 4 (8)* | 4 (8)* | 16(32) |
Pixelfüllrate | 1200MPix/s | 2000MPix/s | 1900MPix/s | 6400MPix/s |
TMUs je Pipe | 2 | 2 | 2 | 1 |
Texelfüllrate | 2400MTex/s | 4000MTex/s | 3800MTex/s | 6400MTex/s |
Vertexeinheit | DX8 VS1.1 | DX9 VS 2.0+ | DX9 VS 2.0+ | DX9 VS3.0 |
Vertexpipes | 2 | 3 (Array) | 3 (Array) | 6 |
Dreiecksdurchsatz | ca. 136MV/s | ca. 375MV/s | ca. 356MV/s | ca. 600MV/s |
Texturen pro Pass | 4 | 8 (16) | 8 (16) | 8 (16) |
Pixelshader | PS1.3 | PS 2.0+ | PS 2.0+ | PS 3.0 |
FP-Einheiten | - | 1 (Shadercore) | 2 (Shadercore + FPU) | 2 (Shader-Unit 1 & 2)** |
Speicher (MB) | 128 DDR | 128 DDR-II | 256 DDR | 256+ GDDR3 |
Anbindung | 128-bit DDR | 128-bit DDR | 256-bit DDR | 256-bit DDR |
Speichertakt (MHz) | 325 | 500 | 475 | 550 |
Bandbreite (MB/s) | 10400 | 16000 | 30400 | 35200 |
SinglePass Texturop. | 4 | 16 (D3D) / 4 (oGL) | 16 (D3D) / 4 (oGL) | 16 (D3D) / ? (oGL) |
FSAA/AF-Technik | AccuView | IntelliSample | IntelliSample HCT | IntelliSample 3.0 ° |
RAMDAC | 2x400MHz | 2x400MHz | 2x400MHz | 2x400MHz |
TV-Encoder | extern | integriert | integriert | integriert |
Sonstiges | DVD MC | DVD MC/iDCT | DVD MC/iDCT | DVD MC/iDCT, MPEG2 En- / Decoder, MPEG4 En- / Decoder |
Präz. pro Kanal | 9Bit (FX9) | 32Bit (FP32) | 32Bit (FP32) | 32Bit (FP32) |
* nVidias High-End GPU unterstützen seit dem NV30 ein Verfahren, bei dem in den ROPs am Ende der Pipeline jeweils zwei, anstatt der üblichen einen Z-/Stencilwerte verarbeitet werden können. Solange Pixel also ohne Farbwert auskommen und auch nicht texturiert sind (Stencilschatten und reine Z-Writes) bekommt man zwei Pixel pro Takt durch eine physikalische Pixelpipeline. | ||||
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird bis einschließlich NV38 mit geordnetem und daher ineffizientem Raster durchgeführt, der NV40 verwendet auch bei 4xMSAA ein gedrehtes Raster. Das AF von nVidia ist nur sehr gering winkelabhängig und auch im NV40 wird es einen Schalter für maximale AF-Qualität bis 16xAF geben. HCT steht für verlustarme Komprimierung des gesamten Contents. | ||||
** Wenn die vorliegenden Informationen korrekt sind, besitzt der NV40 zwei FP-Einheiten in jeder seiner 16 Pipelines. Allerdings scheint es ebenso vielfältige Möglichkeiten wie Einschränkungen zu geben, um diese gemeinsam zu nutzen. Nur die wenigsten der komplexeren Shader-Instruktionen können auf beiden wirklich parallel und ohne irgendwelche Abhängigkeiten laufen. Für detailliertere Informationen zur CineFX-Architektur der GeForceFX bietet 3DCenter.de einen passenden Artikel an. |
nVidia hat mit dem Design des NV40 anscheinend nicht gekleckert, sondern geklotzt. Vielleicht, weil man sich nach dem Rückstand im letzten Jahr in Zugzwang sah, vielleicht aber auch, weil man von ATis Next-Gen Chip, dem nach derzeitigen Informationen für Ende April angesetzten R420, viel erwartete. Es sei an dieser Stelle noch einmal ausdrücklich erwähnt, dass die Taktraten des normalen GeForce 6800 aktuell noch nicht feststehen. Ganz offensichtlich möchte der Grafikriese aus dem sonnigen Kalifornien hier der Konkurrenz aus Kanada den Vortritt lassen, so dass man gegebenfalls auf überraschende Ergebnisse des R420 und dessen Varianten reagieren kann.
Zusammengefasst lässt sich die 3D-Pipeline des NV40 in einer recht simplen Grafik zusammenfassen. Von den sechs Blöcken der ersten Reihe verköpert jeder einzelne eine Vertex Shader Pipeline. In der Mitte finden sich die insgesamt sechzehn Pixelshader und in der letzten Reihe finden wir die Raster Operators Pixel Pipeline.
Auf den nächsten Seiten wollen wir versuchen einige der durchaus eindrucksvollen Zahlen mit ein wenig Hintergrund zu füllen, wo uns dies ohne Betrachtungen am konkreten Objekt möglich ist.