Nvidia GeForce RTX 4090 im Test: DLSS Frame Generation: Technik, Bildqualität und Leistung
4/6Nach einem Schluckauf im ersten Anlauf hat Nvidia mit DLSS 2.0 Upsampling zu einer ernsten Alternative zum Rendern in nativer Auflösung gemacht und die Qualität seitdem von Version zu Version (meistens) immer weiter und weiter verbessert. Heute sind DLSS 2.x und das konkurrierende FSR 2.x von AMD kaum noch aus modernen Spielen wegzudenken – vor allem beim Einsatz von Raytracing.
Mit der GeForce-RTX-4000-Serie geht Nvidia nun den nächsten Schritt und stellt DLSS 3.0 vor. Das läuft im Gegensatz zu den ersten beiden Hauptversionen nicht mehr auf allen GeForce RTX, sondern nur noch auf der neuen Generation.
Doch was ist DLSS 3 überhaupt?
Das steckt hinter Nvidia DLSS 3
Im Kern ist DLSS 3 nach wie vor DLSS 2, dessen Technologie und Feature-Set 1:1 übernommen wurde. Alle vier bekannten Qualitäts-Modi bleiben aus diesem Grund vorhanden und können in DLSS-3-Titeln wie gewohnt eingestellt werden. Nvidia nennt die DLSS-2-Funktionalität ab sofort „DLSS Super Resolution“, Spiele werden sich in Zukunft daran halten.
DLSS 3 = DLSS Super Resolution + Frame Generation
Bei DLSS 3 wird diese DLSS-2-Basis nun um eine weitere Funktion ergänzt: Frame Generation (FG). Games, die DLSS 3 unterstützen, werden diese Funktion auch genau so nennen.
Frame Generation macht dabei genau das, wonach es klingt: Frames generieren. Und das geht so:
- Datenbasis für DLSS 3 sind die letzten zwei gerenderten Bilder (entweder nativ oder auf Basis einer DLSS-2-Stufe).
- Diese Bilder werden mit Hilfe eines neuronalen Netzwerkes analysiert.
- Das geschieht über die Tensor-Kerne der 4. Generation, die mit Motion-Vektoren und dem neuen „Optical Flow Accelerator“ darauf spezialisiert sind, zu erkennen, wie sich Pixel von Frame zu Frame bewegt/verändert haben.
- Auf Basis dieser Analyse erstellt DLSS 3 einen Frame, der eine möglichst optimale Näherung des Zustands zwischen den zwei gerenderten Bildern repräsentiert.
Die GPU rendert also zunächst (mit Hilfe von DLSS Super Resolution) Frame 1 – und während dieser ausgegeben wird, wird Frame 2 berechnet. Frame 2 wird nun aber nicht sofort nach der Fertigstellung ausgegeben, sondern stattdessen verzögert. Beide fertigen Frames werden dann an das neuronale Netzwerk von DLSS 3 weitergegeben, das das Zwischenbild zwischen den zwei Frames generiert – was deutlich schneller möglich ist, als das Bild zu rendern.
Ist das Zwischenbild fertiggestellt, wird es dann quasi als Frame 1,5 ausgegeben und daraufhin das bereits fertiggestellte Frame 2. Währenddessen hat die GPU bereits an Frame 3 gearbeitet und wenn es fertig ist, wird es mit Frame 2 an das neuronale Netzwerk weitergegeben. Danach beginnt der Vorgang von vorne.
Theoretisch werden die FPS auf diesem Weg verdoppelt. Aber der Prozess hat einen Haken: die Verzögerung zwischen Eingabe durch den Anwender und Ausgabe auf dem Bildschirm – die Latenz, konkret auch Input-Lag genannt.
Nvidia Reflex ist bei DLSS 3 Pflicht
Das Erstellen des zusätzlichen Bildes und das Verzögern des zweiten Frames kosten Zeit, was sich negativ auf den Input-Lag auswirkt. Um diesen Effekt zu kompensieren, setzt Nvidia für DLSS 3 die Implementierung der API Reflex 1.6 oder höher (Test) voraus. Auf diesem Weg sei es sogar möglich, dass der Input-Lag gegenüber dem Einsatz von DLSS Super Resolution (DLSS 2) ohne Reflex im Optimalfall sinkt, während er ohne Reflex konzeptbedingt zwangsläufig deutlich höher wäre. Aus diesem Grund kann Reflex unter dem Einsatz von DLSS 3 nie deaktiviert werden. Reflex ohne DLSS 3 zu nutzen, ist hingegen drin.
FPS vs. Input-Lag
Auch der Einsatz von Reflex in Kombination mit Frame Generation ändert allerdings nichts daran, dass 100 statt 50 Frames über natives Rendering oder DLSS Super Resolution (DLSS 2) mehr wert sind als 100 statt 50 Frames mit DLSS 3 Frame Generation. Denn während DLSS Super Resolution und vergleichbare Technologien bezüglich der Performance die zwei wichtigen Metriken Animations-Performance und Input-Lag verbessern, verbessert Frame Generation „nur“ die Animations-Performance – der Input-Lag bleibt dagegen (grob gesagt) unverändert. 100 FPS mit nativer Auflösung oder DLSS Super Resolution sind damit „mehr wert“ als 100 FPS mit DLSS Super Resolution und Frame Generation und damit DLSS 3.
Der Frage, ob das mehr als nur ein theoretisches Problem ist und wie es um die Bildqualität der per neuronalem Netzwerk erstellten Bilder steht, ist die Redaktion anhand einer Vorabversion von Cyberpunk 2077 auf den Grund gegangen. ComputerBase standen auch weitere Spiele mit DLSS 3 als Beta zur Verfügung, doch die verfügbare Zeit sollte vorerst in die ausführliche Analyse eines Titels fließen. Weitere Tests werden zu einem späteren Zeitpunkt folgen.
Bevor es an die Details geht, noch ein paar Anmerkungen:
- Zur Verfügung stand eine Vorabversion eines zukünftigen Cyberpunk-2077-Patches. Bildqualität und Performance können sich also noch ändern.
- Integriert war in der Version neben DLSS 2.4.0.0 (DLSS Super Resolution) „DLSS-G 1.0.2.0“ (G steht für „Frame Generation“).
- Ein Spiel ist ein Spiel. Ein finales Urteil über DLSS 3 wird dieser Test noch nicht liefern können, dafür eine valide Aussage auf Basis einer ausführlichen Analyse in einem Game.
- Die Analyse von DLSS 3 ist dabei nicht nur sehr zeitintensiv, sondern vor allem sehr komplex und noch unerprobt. Die perfekte Variante hat die Redaktion noch lange nicht gefunden.
- Neben der Beurteilung des Spielgeschehens hat ComputerBase mit 120 FPS aufgenommene Videos zur Analyse erstellt – mit nur 60 FPS gingen zu viele erstellte Frames im Video verloren. YouTube stellt Videos aber mit lediglich 60 FPS dar.
- Für einen Detailblick wurden die 120-FPS-Videos teils Frame für Frame angesehen, um die KI-Bilder genau zu analysieren. Daraus stammen dann auch die in dem Artikel gezeigten Screenshots.
- Apropos Screenshots: Bereits bei DLSS 2 haben Screenshots nur die halbe Wahrheit gezeigt, bei DLSS 3 sind sie ohne Kontext eigentlich völlig wertlos. Screenshots sind nur verwertbar, wenn direkt zwei aufeinanderfolgende Frames gezeigt werden, die einmal gerendert und einmal erstellt wurden.
Die Bildqualität von DLSS 3 in Cyberpunk 2077
Der Ersteindruck zur Bildqualität von DLSS 3 in Cyberpunk fällt positiv aus. Während DLSS 1 die Redaktion nie zu überzeugen wusste und auch DLSS 2 ein paar Versionen benötigte, um wirklich gut zu sein, präsentieren sich die mit DLSS 3 Frame Generation erstellten Bilder in Cyberpunk 2077 direkt zum Start wesentlich besser, wenngleich auch nicht fehlerfrei. ComputerBase hat für alle Tests die Ziel-Auflösung Ultra HD mitsamt DLSS auf „Performance“ genutzt. In anderen Auflösungen kann das Ergebnis anders ausfallen.
Frame Generation fällt in CP 2077 kaum auf
Beim Spielen fällt meistens nicht auf, dass längst nicht jedes Frame gerendert worden ist. Dabei ist es ganz gleich, ob man sich im Kampf befindet, einfach nur durch die Open World schlendert oder es schnell per Auto vorwärts geht – die Bildqualität macht stets einen guten Eindruck. Die erstellten Frames wirken nicht wie ein Fremdkörper, sondern fügen sich sehr gut zwischen die wirklich gerenderten Bilder ein.
Während Frame Generation abseits von möglichen Bildfehlern eigentlich keinen Einfluss auf die Bildqualität haben sollte, hatte die Technik beim Testen einer Szene interessanterweise auch einen positiven Einfluss auf die Bildstabilität. So flimmerte mit DLSS auf „Performance“ ohne Frame Generation einer der Festwagen in der Paradeszene aus einem gewissen Winkel munter vor sich her. Es wirkte fast schon so, als würde DLSS Super Resolution gar nicht mehr greifen. Mit aktiver Frame Generation war dieses Problem verschwunden. Es blieb die einzige Szene mit einem solchen Effekt.
Manchmal liegt das neuronale Netzwerk daneben
Trotz des Lobes: Frame Generation arbeitet nicht perfekt. So gab es drei Szenen, die qualitativ spürbar abgefallen sind. Dabei handelt es sich in zweifacher Form um die große Parade im Spiel, wo teilweise transparente „Festwagen“ durch die Luft fahren. Diese haben stellenweise sichtbar mehr geflackert als ohne Frame Generation. Das liegt, wie die Analyse einzelner Frames ergeben hat, daran, dass das erstellte Frame des neuronalen Netzwerks diese Objekte doch deutlich anders dargestellt hat als die gerenderten Frames. Dasselbe ist dann auch nochmal in der Stadt passiert, wo die Beleuchtung einer Werbetafel aus demselben Grund geflackert hat.
Wer ganz genau hinschaut, wird auch noch andere Fehler sehen. So zeigen die einzelnen Frames, dass die KI abseits der bereits gezeigten Bilder offenbar die meisten Probleme damit hat, wenn sich die Spielerkamera und zugleich ein Objekt in die entgegengesetzte Richtung bewegen. Zumindest in Cyberpunk 2077 gibt es dann gerne Artefakte um dieses Objekt zu sehen, die gerenderte Frames nicht vorweisen. Je näher das Objekt an der Kamera dran ist, desto größer fallen sie aus. In Spielen zu sehen ist das ob der hohen Relativgeschwindigkeit in der Regel aber nicht. Bei mittlerer Entfernung scheint es generell keine Probleme zu geben.
Probleme mit verdeckten und dann plötzlich auftauchenden Objekten hatte Frame Generation zumindest in Cyberpunk 2077 keine gezeigt. Problematisch waren wiederum stellenweise fahrende Autos, bei denen es immer mal wieder zu Bildfehlern kam. Doch fallen auch sie in Bewegung nur minimal auf.
Die Performance von DLSS 3 in Cyberpunk 2077
Frame Generation als neuer Aspekt in DLSS 3 kann die Performance in Spielen massiv anheben, wenn auch bei weitem nicht verdoppeln. Dabei gilt zumindest in Cyberpunk 2077: Je mehr Renderpixel, desto größer ist der FPS-Schub. Bei nativer Auflösung – denn auch ohne DLSS Super Resolution lässt sich die Frame Generation aktivieren – bringt die Technologie einen Leistungsschub von durchschnittlich 74 Prozent und erreicht damit ziemlich genau die Leistung von DLSS auf „Quality“.
Warum DLSS-3-FPS nicht gleich viel wert sind wie „normale“ FPS, zeigt die Messreihe allerdings ebenfalls. Dafür hat die Redaktion auch die PC-Latenz mit Hilfe des Tools Nvidia FrameView gemessen (PC-Latenz ist die Latenz, die ein Frame im gesamten Rechner benötigt; Maus und Bildschirm bleiben außen vor. FrameView zeigt ähnliche Latenzen wie über den „Fotosensor“ LDAT gemessene Werte)
Es zeigt sich, dass Frame Generation die Latenz von 71,2 auf 86,3 ms erhöht, also um 21 Prozent. Die Latenz ist damit klar besser als bei nativer Auflösung ohne Reflex, doch ließe sich Reflex auch dann zusätzlich nutzen und bei vergleichbarer Framerate hat DLSS auf „Quality“ mit 69,7 ms selbst ohne Reflex eine um 24 Prozent niedrigere Verzögerung.
Frame Generation in Kombination mit nativen Rendering (also DLSS 3 ohne DLSS Super Resolution) zu nutzen, ergibt im Szenario der Redaktion also keinen Sinn. Allerdings ist DLSS 3 ohnehin nicht für den alleinigen Einsatz ohne Super Resolution gedacht. Mit DLSS auf „Quality“ legt FG dann um 53 Prozent an AVG-FPS zu, im Vergleich zu DLSS Super Resolution auf „Quality“ mit Reflex (aber ohne FG) sind es 66 Prozent – Reflex kostet in Cyberpunk 2077 ganz gut Leistung, ohne Reflex steigen die AVG-FPS um 8 Prozent an, die Perzentil-FPS um 13 Prozent). Damit ist DLSS auf „Quality“ mit FG 12 Prozent schneller als DLSS Super Resolution auf „Performance“. Die Latenzen sind mit 60,5 ms aber um 18 Prozent (ohne Reflex) respektive 36 Prozent (mit Reflex) schlechter.
Mit Super Resolution auf „Performance“ legt die Frame Generation dann um 44 Prozent bei der Durchschnitts-Framerate zu, gegenüber DLSS auf „Performance“ mit Reflex sind es 63 Prozent. Die Latenz ist mit 50 ms dann nur 1 Prozent schlechter gegenüber DLSS auf „Performance“, aber 22 Prozent schlechter gegenüber DLSS auf „Performance“ mit Reflex.
Eine erste Einschätzung
Frame Generation, neben DLSS 2 alias DLSS Super Resolution der neue Baustein in DLSS 3, kann die Framerate (noch weiter) massiv erhöhen, die Einflüsse auf die Latenz sind aber nicht von der Hand zu weisen. Die genaue Analyse stellt sich wiederum als komplex heraus, zumal erste Gehversuche in weiteren DLSS-3-Titeln andeuten, dass die Auswirkungen von Spiel zu Spiel stark unterschiedlich ausfallen. Die abschließende Antwort auf die Frage, wann DLSS 3 wo vorteilhaft eingesetzt werden kann, wird daher noch etwas Zeit und mehr Erfahrungen in mehr Spielen voraussetzen.
Was sich bereits abzeichnet, ist die folgende Erkenntnis: DLSS 3 respektive Frame Generation ist kein „Allheilmittel“ wie DLSS Super Resolution (DLSS 2), sondern eher ein „Spezialwerkzeug“. Denn während Super Resolution hervorragend dafür geeignet ist, bisher nicht spielbare Situationen in Bezug auf FPS und Input-Lag spielbar zu machen, scheint Frame Generation eher dafür geeignet zu sein, bei schon recht hohen Frameraten (und niedriger Latenz) noch mehr FPS aus dem System zu holen, um dann vor allem das Spielgefühl bei Monitoren mit hohen Bildwiederholfrequenzen zu verbessern. Bei niedrigen Ausgangs-FPS mit vergleichsweise hohem Input-Lag kann Frame Generation wiederum nur in Bezug auf die FPS Abhilfe schaffen, während der Input-Lag trotz Einsatz von Reflex nicht signifikant besser werden wird. Auch in diesem Punkt müssen weitere Erfahrungen in weiteren Spielen noch Klarheit schaffen.
Wann kommen die Spiele mit DLSS 3?
Bereits heute soll das erste Spiel mit DLSS 3 ausgerüstet werden, am 12. Oktober sollen zur Vorstellung dann zwei weitere Anwendungen folgen. Insgesamt hat Nvidia den genauen Zeitpunkt für fünf Games beziehungsweise Anwendungen mit DLSS 3 bekannt gegeben, mit dem MS Flight Simulator und A Plague Tale: Requiem sind auch zwei hochkarätige Titel darunter. Für die restlichen angekündigten Spiele mit DLSS 3 gibt es dagegen noch kein genaueres Datum. Konkrete Details hält die folgende Tabelle bereit.
Erscheinungsdatum mit DLSS 3 | |
---|---|
Super People (Early Access) | 11. Oktober |
Loopmancer | 12. Oktober |
Justice „Fuyun Court“ (Showcase) | 12. Oktober |
Microsoft Flight Simulator (Beta) | 17. Oktober |
A Plague Tale: Requiem | 18. Oktober |
- A Plague Tale: Requiem
- Atomic Heart
- Black Myth: Wukong
- Bright Memory: Infinite
- Chernobylite
- Conqueror's Blade
- Cyberpunk 2077
- Dakar Desert Rally
- Deliver Us Mars
- Destroy All Humans! 2: Reprobed
- Dying Light 2: Stay Human
- F1 22
- F.I.S.T.: Forged In Shadow Torch
- Hitman 3
- Hogwarts Legacy
- Icarus
- Jurassic World Evolution 2
- Justice
- Loopmancer
- Marauders
- Marvel's Spider-Man Remastered
- Microsoft Flight Simulator
- Midnight Ghost Hunt
- Mount & Blade II: Bannerlord
- Naraka: Bladepoint
- Perish
- Portal With RTX
- Ripout
- S.T.A.L.K.E.R 2: Heart of Chornobyl
- Scathe
- Super People
- Sword and Fairy 7
- Synced
- The Lord of the Rings: Gollum
- The Witcher 3: Wild Hunt
- Throne and Liberty
- Tower of Fantasy
- Warhammer 40,000: Darktide
- Unity
- Unreal Engine 4 & 5
- Frostbite Engine
- Nvidia Omniverse
- Nvidia Racer RTX