Vorabtest der nVidia GeForce FX5900 Ultra: First Look At A New Dawn

 4/16
Carsten Spille
177 Kommentare

Lautstärke & Bildqualität

Das Design des nV35 wurde neben der Shaderoptimierung und UltraShadow vor allem in Hinblick auf Verlustleistung optimiert. So benötigt auch die größte Version der FX5900 keinen Gehäuse-Fön à la FlowFX mehr, sondern begnügt sich mit einer verhältnismäßig zivilen Kühlung. Die Boardhersteller werden ihr übriges tun, um vielleicht auch noch die eine oder andere Lösung herauszubringen, die keinen PCI-Slot mehr blockiert.

Durch diese Optimierung ist es auch möglich geworden, die Lautstärke des Lüfters selbst gegenüber einer regulären FX5800 zu senken. In unserem Test haben wir es nicht geschafft, den Lüfter einmal auf maximaler Lautstärke zu erleben, er säuselte höchstens in der zweiten von drei Stufen vor sich hin, wenn er richtig gefordert wurde.

Der Ton ist kein unangenehm hochfrequentes Sirren mehr, sondern passt sich recht gut der üblichen Geräuschkulisse, die ein PC produziert an, ohne unangenehm aufzufallen. Es gibt sicherlich leisere Lüfter, aber einen Hinderungsgrund stellt das Kühlsystem der FX5900 Ultra wohl nur für absolute Silent-PC Fans dar, die auf passive Kühlung aus sind.

Die 2D-Bildqualität war im Rahmen unseres Testmonitors, eines Illyama Vision Master 451 Pro, bis hin zur Auflösung von 1280x1024 mit 100Hz gut und lag damit in etwa auf einem Level mit der FX5800 und der Radeon9800. Ein minimal besseres Bild haben uns bislang nur eine Matrox G400, die Inno3D FX5200 und die Radeon7500 direkt von ATi geboten.

Unter 3D gab es einige Auffälligkeiten, was die Bildwiedergabe unseres Samples betraf. Die normale Darstellung entsprach unseren Erwartungen und auch Bild sowie Screenshots mit aktiviertem 2xFSAA und 4xAF waren so, wie man es von nVidia-basierten Karten gewohnt ist.

Sobald man jedoch auf 4xFSAA schaltete, war auf Screenshots eine deutliche Unschärfe zu erkennen, die uns während des laufenden Betriebs allerdings nicht störend auffiel.

Da wir eine vollständige Erklärung nicht anbieten können, wollen wir hier zwei unserer Spekulationen nebeneinanderstellen. Einerseits könnte, da es sich bei Screenshots stets um Framebuffer-Grabs (der ausgelesene Inhalt des gerade gerenderten Bildes) handelt, könnte hier die von nVidia als nV35-Novum beworbende HCT (High-Resolution Compression Technology) verantwortlich sein, die die Dekompression möglicherweise erst nach dem Auslesen aus dem Framebuffer auf dem Weg zum RAMDAC anwendet, um zusätzlich Bandbreite zu sparen.

Auch wäre es möglich, dass das Zusammenmischen der Multisample-Buffer erst im RAMDAC stattfindet, wodurch sich zwar die Probleme, die wir bei Screenshots in einigen Games hatten, nicht, aber die Unschärfe, die an Quincunx-FSAA erinnert, erklären liessen.

Dieses Quincunx-FSAA wäre unsere zweite Spekulation für die Unschärfe, dass anstelle des verlangten 4xFSAA das bisher nur über externe Tweakprogramme wie den aTuner mögliche 4x+9tap-FSAA ausgewählt wird, welches das 4x-Analogon von Quincunx-AA darstellt.

Weiterhin trat das Problem nur unter OpenGL auf, namentlich bei Quake3, Alice und RtCW. Hier haben wir davon mal einen kleinen Screenshot zu Verdeutlichung:

Alice 1280x960x32 0xAA 0xAF
Alice 1280x960x32 0xAA 0xAF

Und nun, von links nach rechts mit 8xAF, 2xAA/4xAF und schlußendlich mit 4xAA/8xAF. Am deutlichsten wird der Unterschied, wenn man sich die Bilder herunterlädt (Rechtsklick, Bild speichern unter) und sich dann z.B. mit IrfanView oder ACDSee schnell vor- und zurückwechselt.

Alice Crop 0xAA 8xAF
Alice Crop 0xAA 8xAF
Alice Crop 2xAA 4xAF
Alice Crop 2xAA 4xAF
Alice Crop 4xAA 8xAF
Alice Crop 4xAA 8xAF

Das Thema FSAA kann man ansonsten getrost und kurz abhaken: Bis auf architekturbedingte Beschleunigung der einzelnen Modi bekommt man hier seit der GeForce3 nichts Neues. Eine gelungene Übersicht und eine etwas technische Erklärung dazu hat das 3DCenter veröffentlicht.

Det.44.03 00xAA Qualität
Det.44.03 00xAA Qualität
Det.44.03 02xAA Qualität
Det.44.03 02xAA Qualität
Det.44.03 04xAA Qualität
Det.44.03 04xAA Qualität
Det.44.03 06xAA Qualität
Det.44.03 06xAA Qualität
Det.44.03 06xSxAA Qualität
Det.44.03 06xSxAA Qualität
Det.44.03 08xAA Qualität
Det.44.03 08xAA Qualität

Die Bilder zeigen im rechten Quadrat die Textursample-Positionen (bei Multisampling nur eine einzige, bei Supersampling mehrere) und im linken Quadrat die Sample-Positionen der Kantenpixel. Je höher die Anzahl der separaten Bildpunkte pro Achse ist, desto höher ist im Allgemeinen die Bildqualität. Gut zu sehen ist, dass z.B. beim Sprung 2xAA auf 4xAA die Anzahl der Samplepositionen pro Achse nicht erhöht, sondern nur zusätzliche Redundanz erzeugt wird. Daraus resultiert der nur geringe Anstieg der Bildqualität beim Wechsel von 2xFSAA auf 4xFSAA bei GeForce-Karten.

2xFSAA R300a.PNG
2xFSAA R300a.PNG
4xFSAA R300a.PNG
4xFSAA R300a.PNG
6xFSAA R300a.PNG
6xFSAA R300a.PNG

Hier zum Vergleich 2x, 4x und 6xFSAA der R300 (und höher). Die Qualität von nVidias FSAA kann nur im 2x-Modus etwa mithalten, auch wenn hier schon die Gamma-Gegenkorrektur zur Radeon fehlt. Einen Bonus gegenüber dieser kann man mit den Hybrid-Modi verbuchen, die Multisampling mit Supersampling verknüpfen, was allerdings so viel Geschwindigkeit kostet, das aktuelle Games damit meist zu langsam werden.

Anisotrope Filterung
Auch hier hat sich nichts weltbewegendes im Hinblick auf die Bildqualität getan. Zumindest gilt dies, wenn man die maximal erreichbare Qualität als Maßstab nimmt.

Um der drückenden Überlegenheit ATis in Sachen AF-Geschwindigkeit Herr zu werden, hat man sich bei nVidia nun auch dazu durchgerungen, leistungsoptimierte Modi zusätzlich zu der bereits bekannten trilinear-anisotropen Filterung anzubieten.

Det.44.03 00xAF Qualität
Det.44.03 00xAF Qualität
Det.44.03 02xAF Qualität
Det.44.03 02xAF Qualität
Det.44.03 04xAF Qualität
Det.44.03 04xAF Qualität
Det.44.03 08xAF Qualität
Det.44.03 08xAF Qualität
Det.44.03 00xAF Leistung
Det.44.03 00xAF Leistung
Det.44.03 02xAF Leistung
Det.44.03 02xAF Leistung
Det.44.03 04xAF Leistung
Det.44.03 04xAF Leistung
Det.44.03 08xAF Leistung
Det.44.03 08xAF Leistung
Det.44.03 00xAF Hohe Leistung
Det.44.03 00xAF Hohe Leistung
Det.44.03 02xAF Hohe Leistung
Det.44.03 02xAF Hohe Leistung
Det.44.03 04xAF Hohe Leistung
Det.44.03 04xAF Hohe Leistung
Det.44.03 08xAF Hohe Leistung
Det.44.03 08xAF Hohe Leistung

Von links nach rechts dargestellt sind hier trilineare Filterung (0xAF), 2xAF, 4xAF und schließlich 8xAF. Deutlich zu sehen ist, dass im Leistungs-Modus nur noch ein sehr schmales Band in den Genuß zumindest trilinearen Ditherings (einer leistungsparenden Annäherung an echte trilineare Filterung, wie sie auch schon die Voodoo-Chips von 3dfx nutzten) kommt. Der Hohe-Leistungs-Modus bietet zusätzlich noch das Zusammenfassen der ersten beiden Miplevel und einen höheren Grad an Winkelabhängigkeit.

Unsere Tests führen wir ausschließlich im Qualitäts-Modus durch, einen Worst-Case sozusagen.

Treibereien

Zusätzlich zu den oben angesprochenen Optimierungen und/oder Verschlimmbesserungen beim FSAA und AF verdichten sich die Anzeichen, dass nVidia nun mit ihrer Intellisample-Technologie ernst macht und unabhängig vom gewählten Grad an Filterung, besonders wenn dieses im Treiber und nicht über die Anwendung oder das Spiel eingestellt wird, Optimierungen vornimmt, die momentan manchmal leider noch zu Lasten der Bildqualität gehen.

So wird zum Beispiel von einem starken Abfall der Leistung mit achtfach anisotroper Filterung berichtet, wenn man die ausführbare Datei der 3DMark03 umbenennt und der Treiber hier keine Anpassung der Filterung mehr vornehmen kann.

Solange diese Optimierungen aber zu Lasten der Bildqualität gehen, sollte man, wenn irgend möglich, die anisotrope Filterung ausschließlich über die Applikation anfordern.

Ein paar zusätzliche Sorgen bereitete der ansonsten sehr stabile und zuverlässige Detonator 44.03 uns in Verbindung mit dem 3DMark03. Bei höheren Auflösungen als 640x480 war es nicht möglich, einen kompletten Benchmark durchlaufen zu lassen, ohne das die integrierte Temperaturüberwachung vermeldete, in Aktion getreten zu sein. Wie auf der nächsten Seite zu sehen, lag es offenbar nicht an der Kühlung unseres Exemplares, da ein späterer Versuch mit den inoffiziellen 44.65er Treibern erfolgreich verlief.

Auch sonst konnte das Gespann aus FX5900 Ultra und Deto44.03 nicht immer überzeugen. Besonders mit 4xFSAA und 8xAF in sehr hohen Auflösungen trat in der UT2003-Demo und bei Comanche4 derselbe Fehler auf, wie mit dem 3DMark03. In jedem Falle schuf der 44.65er-Treiber hier Abhilfe.

Der Hauptkonkurrent ATi scheint in Sachen Optimierungen noch einen anderen Weg zu gehen. Die seit dem 3.0 Catalyst zu beobachtenden Sprünge in der Leistung unter FSAA und AF scheinen auf eine recht simple, aber gerade angesichts der 8-Pipeline Designs unglaublich effiziente Optimierung zurückzuführen zu sein. In einigen Spiele, wenn nicht generell, wird selbst bei ausgewählter Qualitäts-Option des anisotropen Filters nur die Basis-Textur, die man am deutlichsten und detailliertesten sieht, trilinear-anisotrop gefiltert. Weitere Texturstages, in denen oftmals die Detailtexturen liegen, werden anscheinend per se nur bilinear gefiltert. ATi scheint hier darauf zu setzen, dass dies in hohen Auflösungen und mit hohen Leveln der Anisotropie kaum auffällt und tatsächlich sieht man dieses Verhalten am deutlichsten unterhalb von 1024 und mit höchstens 8xAF.

R9800p 128MB Cat3.5 Aquanox bilineare Detail Texturen
R9800p 128MB Cat3.5 Aquanox bilineare Detail Texturen
R9800p 128MB Cat3.5 Aquanox Crop
R9800p 128MB Cat3.5 Aquanox Crop
R9800p 128MB Cat3.5 UT2003 bilineare Detail Texturen
R9800p 128MB Cat3.5 UT2003 bilineare Detail Texturen
R9800p 128MB Cat3.5 UT2003 Crop
R9800p 128MB Cat3.5 UT2003 Crop

Deutlich zu sehen sind die Mip-Übergänge in den Detailtexturen, hervorgerufen durch bilineare Filterung. Behoben werden kann dieses unter Umständen unerwünschte Verhalten durch die Aktivierung des anisotropen Filters direkt in der Anwendung oder durch das rTool, eines praktischen und übersichtlichen Tweakers von Aleksander Nowak.

Auch wenn es eigentlich nicht in dieses First-Look passt, wollen wir noch einen kurzen Blick auf den möglichen Leistungsgewinn werfen.

Optimierungen
  • Aquanox, 1024x768, 2x/4x:
    • Radeon9800 Pro optimiert
      94,70
    • Radeon9800 Pro unoptimiert
      84,70
  • Aquanox, 1280x960, 4x/8x:
    • Radeon9800 Pro optimiert
      49,10
    • Radeon9800 Pro unoptimiert
      45,20
  • UT2003 Demo FlyBy, 1024x768, 2:
    • Radeon9800 Pro optimiert
      181,08
    • Radeon9800 Pro unoptimiert
      145,51
  • UT2003 Demo FlyBy, 1280x960, 2:
    • Radeon9800 Pro optimiert
      109,44
    • Radeon9800 Pro unoptimiert
      88,61
Einheit: Bilder pro Sekunde (FPS)

Leider liessen sich die Optimierungen von nVidia nicht so leicht aushebeln, sind allerdings in Aquanox und UT2003 auch nicht so offensichtlich. Gerüchte besagen, dass nVidia hier mit einer ausgeklügelten Texturanalyse arbeitet, während ATi eher die Holzhammermethode wählte.

Besonders die starken Schwankungen der Leistung im Vergleich zur Radeon 9800 Pro verleiten zu der Annahme, dass momentan noch jede Game-spezifische Optimierung per Hand in den Treiber integriert werden muss, wie es z.B. bei UT2003 geschehen ist. In Aquanox, welches offenbar eine geringe Priorität geniesst, oder RtCW als anderes Beispiel, sieht die in UT2003 glänzende FX5900 Ultra kaum einen Stich gegen die von der Spezifikation her deutlich unterlegene Radeon.

Wieviel Wert man angesichts solcher Optimierungen, die zusätzlich zu den vormals als Cheats bekannten unerlaubten Optimierungen im 3DMark03 und sicher nicht nur in diesen beiden Games vorhanden sind (Serious Sam SE soll angeblich auch von der Optimierung durch eine festgelegte Kamerafahrt profitieren), noch auf reine Benchmarkwerte legen will, muss jeder für sich selbst entscheiden.

Eine letzte Bemerkung vorweg: Aufgrund der kurzen Zeit, die uns die GeForce FX5900 Ultra zur Verfügung stand, haben wir mit den Standard-Settings, also inklusive eventuell möglicher Optimierungen getestet. Dies gilt selbstverständlich auch für die Vergleichskarten.