Nvidia GeForce 9600 GT (SLI) im Test: Einmal Radeon-HD-3850-Konkurrenz, bitte!
3/30Technik im Detail
Die G94-GPU auf der GeForce 9600 GT basiert grundsätzlich auf derselben Architektur wie der G92-Chip auf der GeForce 8800 GT sowie der GeForce 8800 GTS 512, allerdings „verlötet“ Nvidia auf dem Stück Silizium weniger Einheiten. Im Gegensatz zur GeForce 8800 GT, bei der einige Einheiten auf dem G92 deaktiviert aber physikalisch noch vorhanden sind, lässt man diese auf dem G94 gleich komplett weg. Dementsprechend fällt der Chip auf der GeForce 9600 GT kleiner aus, weswegen Nvidia die GPU günstiger fertigen und somit auch preiswerter verkaufen kann. Der G94 wird wie der G92 im 65-nm-Verfahren bei TSMC gefertigt und beherbergt 505 Millionen Transistoren. Auf dem G94 verbaut Nvidia 64 voneinander unabhängige skalare Shadereinheiten, die pro Takt eine Komponente (entweder Rot, Grün, Blau oder den Alphawert) bearbeiten können. Jede ALU kann pro Takt ein MADD (Multiply-ADD) und ein MUL (Multiplikation) berechnen.
Während das MADD durchgängig für das so genannte „General Shading“ benutzt werden kann (sprich für sämtliche anstehende Shaderoperationen), sieht dies bei MUL anders aus. MUL ist zusätzlich als Special Function Unit (SFU), Perspektivenkorrektur oder als Attributinterpolator tätig und kann nur selten für General Shading verwendet werden. Dementsprechend fällt die reale Shaderleistung (oft gemessen in GFLOPS) niedriger aus, als man anhand der nackten Zahlen (wenn man das MUL miteinbezieht) vermuten könnte. Im Gegensatz zum RV670 unterstützt der G94 nicht die Direct3D-10.1-API, die mit dem Service Pack 1 den Einzug in Windows Vista erhalten wird. Man verlässt sich weiterhin auf Direct3D 10, da laut Nvidia die Erweiterung auf den 10.1-Standard nur eine marginale Verbesserung und den Aufwand nicht wert ist. Ob dies stimmt, werden aber erst die Zeit beziehungsweise die passenden 3D-Anwendungen zeigen. Die 64 Shadereinheiten agieren auf dem G94 erneut mit einer eigenen Taktdomäne. Die Frequenz der ALUs auf der GeForce 9600 GT beträgt 1625 MHz.
Nvidia setzt auf dem G94 32 vollwertige Textureinheiten (Texture Mapping Units, TMU) ein, die pro Takt 32 Pixel adressieren und filtern können. Auf dem G94 belässt man es wie beim G92 bei 16 Raster Operation Processors (Auf dem G80 gab es noch doppelt so viele Filter- wie Adressierungseinheiten, weswegen der Chip extrem schnell Texturen anisotrop Filtern kann). Somit können die ROPs insgesamt 16 Pixel mir Farb- sowie Z-Werten (Tiefeninformationen) pro Takt fertigstellen. Wie ab der GeForce-FX-Serie gewohnt, bieten die GeForce-ROPs bei reinen Z-Berechnungen die Möglichkeit, die Rechenkraft um ein Vielfaches zu steigern. So lange einzig und allein Tiefeninformationen berechnet werden, können nicht 16, sondern 128 Samples pro Takt zur weiteren Nutzung bereitgestellt werden. Bei 4xMSAA bleiben noch 32 Samples pro Takt übrig. Nvidia hat für den G94 die ROPs per Treiber leicht verbessert (wobei der G92 genauso von den Modifizierungen profitiert). So hat man die Kompression der ROPs erhöhen können, womit G92 sowie G94 vor allem bei höheren Qualitätseinstellungen weniger Speicher- und Speicherbandbreite benötigen. Die „TMU-Domäne“, die abgesehen von den ALUs den kompletten Chip ansteuert, arbeitet auf der GeForce 9600 GT mit einer Frequenz von 650 MHz.
Wer sich mit der G8x-Architektur auskennt, der weiß, dass durch die Deaktivierung einer ROP-Partition automatisch Einfluss auf den Memorycontroller genommen wird. Jede ROP-Partition (eine besteht aus vier ROPs) ist direkt mit einem Framebuffer verbunden. Während beim G80 sechs 64 Bit breite Speicherkanäle existieren, sind es beim G96 – analog der Anzahl der ROPS – nur noch vier. Somit bietet der G96 dem Käufer ein 256 Bit breites Speicherinterface an, das in vier 64-Bit-Speicherkanäle aufgeteilt ist. Jeder Speicherkanal ist an zwei Speicherbausteine angeschlossen, die je nach Version des 3D-Beschleunigers (512-MB- oder 1024-MB-Variante) 64 MB oder 128 MB groß sind. Die Taktfrequenz des Speichers auf der GeForce 9600 GT beläuft sich auf 900 MHz.
Nvidia setzt auf der GeForce 9600 GT denselben Videoprozessor wie auf der G92-GPU ein. Dieser kann den H.264-Codec vollständig beschleunigen, während der Chip beim VC-1-Format dem Prozessor nicht komplett die Arbeit abnehmen kann. Auch wenn Nvidia behauptet, dass eine vollständige Beschleunigung für VC-1-Videos nicht notwendig ist, da der Rechenaufwand für VC-1 nicht so hoch wie für H.264 ist, wünschen wir uns für die Zukunft, dass sämtliche Videoformate vollständig übernommen werden können.
Auch wenn der Chip dem des G92 entspricht, hat Nvidia für die GeForce 9600 GT einige Modifizierungen vorgenommen, die die Bildqualität verbessern, und einige andere Features hinzufügt. Wie das? Wie uns Nvidia auf Nachfrage bestätigte, handelt es sich bei diesen Modifizierungen um eine reine Treiberangelegenheit. Man wird die PureVideo-HD-Verbesserungen auch auf den G92 ausweiten, allerdings konnte man uns noch nicht sagen, ab welchem Treiber dies geschehen wird.
Die zwei Bildverbesserungen nennen sich „Dynamic Contrast Enhancement“ und „Dynamic Blue, Green and Skin Tone Enhancement“. Beide Features analysieren „on the fly“ das HD-Video und können dann zum Beispiel bei kontrastarmen Bildern die Kontraste verbessern sowie die Farbgebung erweitern und anpassen. Ebenfalls neu ist eine Funktion namens „Dual-Stream Decode“. Dadurch können zwei Videostreams gleichzeitig wiedergegeben und beschleunigt werden. Bis jetzt war es bei der Wiedergabe einer HD-DVD- oder Blu-ray-Disc normal, dass unter Windows Vista die Aero-Oberfläche deaktiviert und stattdessen das triste „Klassik-Design“ angewendet wird. Die GeForce 9600 GT weist diese Limitierung nicht mehr auf und lässt bei einem HD-Video den Aero-Desktop aktiv.
Der G94 unterstützt das neue PCIe-2.0-Interface, wodurch die Bandbreite pro Sendekanal (von der Grafikkarte weg und zur Grafikkarte hin) auf 16 GB gegenüber dem PCIe-1.1-Standard verdoppelt worden ist. Die maximale Leistungsaufnahme der GeForce 9600 GT liebt bei 95 Watt, weswegen ein 6-Pin-Stromstecker für den Betrieb notwendig ist. Die G94-GPU bietet dem Kunden nativen HDMI- und DisplayPort-Support. Das Referenzdesign sieht zwei Dual-Link-DVI-Ausgänge vor, jedoch bleibt es den Boardpartnern überlassen, ob man stattdessen lieber einen HDMI- oder DisplayPort-Anschluss verbaut.