Vorabtest der nVidia GeForce FX5900 Ultra: First Look At A New Dawn
2/16Die Karte
High-End Karten, insbesondere mit Chips von nVidia, waren schon immer ein wenig anders als andere. Meist bezog sich dies auf die Größe des lokalen Speichers, auf die Kühllösung oder schlicht und ergreifend auf das Boardlayout.
Nun, die GeForce FX5900 Ultra erfüllte in herausragendem Maße alle diese Kriterien. Es wurden 256MB hochgezüchtetes DDR-SDRAM verbaut, die Kühllösung, obgleich nicht mehr so extravagant wie die der urplötzlich wie ausgestorben erscheinenden GeForce FX5800 Ultra, belegt noch immer den ersten PCI-Slot mit und das Printed-Circuit Board (PCB) ist auch nicht gerade geringzuschätzen.
Der nV35-Chip, dessen Muskeln der FX5900 Ultra zu neuen Höhenflügen verhelfen soll, wird von einem sicher montierten Kühler bedeckt, der schon auf der QuadroFX und der FX5800 zum Einsatz kam.
Lediglich die mit 425MHz realem Takt sehr schnellen 256MB DDR-SDRAM benötigen offenbar ein wenig mehr Aufmerksamkeit bei der Kühlung, als die 400MHz-DDR-II Bausteine, die noch auf der FX5800 verbaut worden sind. Allerdings waren die Temperaturunterschiede im Betrieb recht deutlich. Insbesondere die unbelüftete Rückseite der Karte heizte sich deutlich weniger auf als die der FX5800 und wurde dabei gerade einmal etwas mehr als handwarm.
Nachdem wir zumindest die verschraubten RAM-Kühler nach unseren Tests einmal entfernt hatte, bot sich uns das erwartete Bild. Je acht Chips auf Vorder- und Rückseite im aktuellen BGA-Format in einer Anordnung um den Chip herum, die möglichst gleichkurze Signalwege für den 256Bit-Speichercontroller garantieren sollen. Der Kühler auf der GPU selber war nicht risikolos zu entfernen, so daß wir hiervon Abstand nehmen mussten.
Da bei der GeForceFX-Reihe der TV-Encoder in den Chip integriert worden ist, wird ein externer Chip nur noch für etwaige Video-In Funktionen benötigt. Im Falle unseres Referenzboards zeichnete hierfür ein Philips SAA7108AE verantwortlich. Der DVI-Ausgang wurde mit dem schon von vielen anderen Boards bekannten und bewährten Sil164CT64 von Silicon Image realisiert. Wie auf dem letzen Bild zu sehen, sitzt auf unserem Referenzsample ein nV35 im A1-Stepping, also einer sehr sehr frühen Version. Dies läßt entweder auf eine relative Problemlosigkeit beim Design schließen oder auf nur geringe Veränderungen im Gegensatz zum nV30. Ganz anders scheint die Entwicklung beim Board an sich verlaufen zu sein, trägt es doch die Revisionsnummer "G". Hier scheint man einige Probleme im Vorfeld gehabt zu haben, die nun behoben sein dürften.
Einen nicht unerheblichen Teil dieser Probleme dürfte die Regulierung der Stromversorgung beigetragen haben, denn der ohnehin nicht lapidare Teil des PCB, der schon bei der FX5800 für Spannungsregler verwandt wurde, ist noch einmal deutlich angewachsen, um eine gleichbleibend stabile Versorgung der üppigen 256MB Grafikspeicher gewährleisten zu können. Interessant scheint weiterhin der im Gegensatz zum Vorgänger abgewinkelte Anschluss für den 5,25"-Netzteilstecker. Wir werden gleich sehen, warum das so ist.
Schauen wir uns das ohne Zweifel schon durch seine schiere Größe beeindruckende PCB einmal näher und vor allem in Relation zu etwas Bekanntem an.
Radeon 9800 Pro und GeForce FX5800 wirken ein wenig zwergwüchsig im Vergleich zum nV35-Riesen. Bei diesem Anblick kam uns der Gedanke, die Karte mal mit einem anderen, urzeitlichen Riesen zu vergleichen.
Was auf den ersten Blick wie ein knapper Gleichstand aussieht, entpuppt sich dann doch als ein hauchdünner Sieg für die 3dfx Voodoo5 5500 AGP. Ungefähr zwei Millimeter länger als die GeForce FX5900 ist das mit zwei Grafikprozessoren bestückte, letzte Aufbäumen von 3dfx. Dafür muss man aber schon recht genau hinsehen.
Dies bringt uns zu der Frage, an der sich damals schon die Voodoo5-Käufer den Kopf zerbrachen (und viele der Gehäuseindustrie reichhaltige Umsätze bescherten): Passt so ein Monstrum überhaupt in meinen PC? Im Midi-Tower unseres Testsystem hatten wir trotz etwas beengter Zustände kein Problem damit, die FX5900 Ultra einzupassen. Wäre der Stromanschluss allerdings nach hinten heraus angelegt, wie bei der Radeon 9800 Pro oder GeForce FX5800, wir hätten ein Problem mit unseren Festplattenkühlern gehabt.
Ein PCI-Slot geht verloren, wie auch schon bei der FX5800. Ob das ein Problem ist, muss jeder für sich selbst entscheiden, da die allgemeine Empfehlung, den ersten PCI-Slot zwecks besserer Luftzufuhr für die AGP-Karte auch für andere Karten gilt und es auch zunehmend Boards gibt, die entweder den AMR-Riser oder sogar eine Blindfläche zwischen AGP und PCI-I haben, hat sich nVidia unserer Meinung nach nur dazu ermächtigt, die vormalige Empfehlung zwingend vorauszusetzen.
Technische Daten
Werfen wir einen Blick auf die Features der GeForce FX in neuester Inkarnation.
FX5900 Ultra | FX5800 Ultra | FX5800 | Radeon9800 Pro | |
---|---|---|---|---|
Chip | nV35 | nV30 | nV30 | R350 |
Herstellungsprozess | 0,13µ | 0,13µ | 0,13µ | 0,15µ |
Chiptakt in MHz (3D/2D) | 450/300 | 500/300 | 400/300 | 380/380 |
Rendering Pipelines* | 4 (8) | 4 (8) | 4 (8) | 8 |
Pixelfüllrate | 1800 MPix/s | 2000 MPix/s | 1600 MPix/s | 3040 MPix/s |
TMUs je Pipeline | 2 | 2 | 2 | 1 |
max. Texelfüllrate | 3600 MTex/s | 4000 MTex/s | 3200 MTex/s | 3040 MTex/s |
realer Speichertakt (3D/2D) | 425MHz | 500/300MHz | 400/300MHz | 340MHz |
Speicheranbindung/ -typ | 256Bit DDR | 128Bit DDR-II | 128Bit DDR-II | 256Bit DDR |
Speicherbandbreite | 27200 MB/s | 16000 MB/s | 12800 MB/s | 21760 MB/s |
unterstütze Speicherstandards | DDR / DDR-II | DDR-II | DDR-II | DDR / DDR-II |
Shaderhardware | VS/PS 2.0+ | VS/PS 2.0+ | VS/PS 2.0+ | VS/PS 2.0 (+) |
interne Genauigkeit | 128Bit (32Bit fp) | 128Bit (32Bit fp) | 128Bit (32Bit fp) | 96Bit (24Bit fp) |
max. Vertexdurchsatz | 338 MVert/s. | 375 MVert/s | 300 MVert/s | 380 MVert/s |
Single-Pass Texturoperationen** | 16(D3D) / 4(oGL) | 16(D3D) / 4(oGL) | 16(D3D) / 4(oGL) | 16(D3D) / 8(oGL) |
FSAA/AF-Technik° | Intellisample HCT | Intellisample | Intellisample | Smoothvision 2.1 |
RAMDAC | 2x400MHz | 2x400MHz | 2x400MHz | 2x400MHz |
TV-Encoder | integriert | integriert | integriert | integriert |
max. FP-Shaderops/s°° | 3600 | 2000 | 1800 | 3040 (9120) |
* nVidia gibt zwar ein Maxium von 8 Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloprationen zu. Ansonsten verhalten sich nV30 und nV35 wie ein Design mit vier Pipelines à zwei TMUs |
||||
** Mit den zum Test verwendeten Treibern Detonator 44.03 und Catalyst 3.5 | ||||
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA und optimiertes AF. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, ATi verwendet für 2x und 4x-FSAA ebenfalls ein solches, für 6x FSAA in sparsely sampled Raster, bei dem pro Achse sechs Samples erzeugt werden, die aber niemals Achsenkongruent sind. Das AF von nVidia ist nur sehr gering winkelabhängig, ATi verwendet hier eine stärkere Optimierung, die bei geringem Verzicht auf Bildqualität der Leistung zugute kommt. Zusätzlich bewirbt nVidia beim nV35 eine Compressionstechnologie für hohe Auflösungen (HCT), was genau sich dahinter verbirgt, bleibt allerdings im Dunkeln. |
||||
°° Diese Angaben stammen aus Marketingunterlagen von nVidia. FP-Shaderops sind dabei sehr gedehnt definierbar, so daß ATi gemäß eigener Definition drei solcher Operation pro Pipeline und pro Takt erreicht. Die Werte für den nV30 sind heruntergerechnet aus den Angaben für den nV35 |
Allein aufgrund der Spezifikationen sollte man meinen, daß man einen Test überhaupt nicht erst zu beginnen braucht, zu drückend scheint die Überlegenheit der GeForce FX 5900 ultra. Einzig bei den Vertex-Oprationen und bei der Pixelfüllrate kann ATi Bestmarken vorlegen.*
Die maximalen Instruktionslängen, Flow-Control-Angaben und sonstige Interna finden sich nicht in der Tabelle, da sie diejenigen, die sich wirklich mit so etwas beschäftigen müssen sowieso schon kennen und für uns normale User nicht wirklich interessant ist, ob die Radeon 9800 Pro wirklich eine unbegrenzte Anzahl von Pixelshaderinstruktionen verarbeiten oder ob die GeForce FX wirklich Vertexshader mit 1024 Befehlsslots ausführen kann, denn für solche Unterfangen sind beide im Echtzeitbereich um Größenordnungen zu langsam. Diese Features zielen vielmehr auf den Offline-Rendering Bereich, in dem sich damit zum Beispiel die Produktion von computeranimierten Kinofilmen beschleunigen liesse.
*Update 07.10.2003: In der Tabelle ist uns leider ein Fehler unterlaufen. Die Werte für den Vertexdurchsatz der beiden FX-Modelle sind nun korrekt.