Nvidia nennt für die GeForce RTX 4090 Founders Edition einen durchschnittlichen Boost-Takt von 2.520 MHz. Doch wie von den letzten GeForce-Generationen bekannt, takten die Grafikkarten in Spielen für gewöhnlich deutlich höher. Dabei zeigt sich, dass der Boost-Mechanismus von Ampere auf Ada Lovelace quasi gleich geblieben ist, Nvidia die Grafikkarte aber völlig anders konfiguriert hat.
Das Power-Target ist nur selten ein Limit
Der maximale Takt des Testmusters der RTX 4090 FE lag ohne manuelle Anpassungen bei 2.790 MHz. Sichtbar war das kurz bei niedriger Last und geringen GPU-Temperaturen.
Bei den meisten Ampere-Grafikkarten lag der maximale Takt in Spielen in der Regel deutlich niedriger, da die GPUs für so hohe Frequenzen viel zu viel Energie benötigt hätten und vom Power-Target gebremst wurden. Das ist bei Ada Lovelace in der Regel nicht der Fall, weshalb der Takt in Games im Test nicht weit unter dem theoretischen Maximum rangierte.
AD102 taktet nahe am Maximum
Mit 2.775 MHz lag der höchste protokollierte Takt in Spielen tatsächlich nur einen „Takt-Schritt“ unter dem generellen Maximum, denn AD102 wechselt den Takt in 15-MHz-Schritten. Und auch im Durchschnitt aller Spiele taktete die GeForce RTX 4090 mit 2.744 MHz nicht viel weiter vom theoretischen Maximum (-46 MHz) entfernt.
Bereits ohne einen Blick auf die gemessene Leistungsaufnahme ist damit klar, dass Ada Lovelace massiv an Energieeffizienz gegenüber Ampere gewonnen hat. Nvidia hat sich daraufhin offensichtlich dafür entschieden, die Taktraten deutlich näher an das theoretische Maximum zu bringen, ohne dass es einen gravierenden Malus auf die Leistungsaufnahme gibt. In vielen Fällen erreicht die GeForce RTX 4090 selbst mit dieser Konfiguration die maximale TDP von 450 Watt nicht.
Die tatsächlichen durchschnittlichen Taktraten im Fractal Design Torrent
3.840 × 2.160
Nvidia GeForce RTX 4090 FE
Maximaler Takt in Spielen
2.775 MHz
CoD: Vanguard
2.727 MHz
Cyberpunk 2077
2.760 MHz
Cyberpunk 2077 + RT
2.714 MHz
Deathloop
2.745 MHz
Deathloop + RT
2.749 MHz
Doom Eternal
2.723 MHz
Doom Eternal + RT
2.745 MHz
Dying Light 2
2.760 MHz
Dying Light 2 + RT
2.708 MHz
F1 22
2.754 MHz
F1 22 + RT
2.688 MHz
Far Cry 6
2.760 MHz
Far Cry 6 + RT
2.760 MHz
Forza Horizon 5
2.745 MHz
Ghostwire: Tokyo
2.760 MHz
Ghostwire: Tokyo + RT
2.760 MHz
God of War
2.745 MHz
Guardians of the Galaxy
2.760 MHz
Guardians of the Galaxy + RT
2.745 MHz
Halo Infinite
2.745 MHz
Metro Exodus Enhanced
2.702 MHz
Saints Row
2.760 MHz
Saints Row + RT
2.760 MHz
Shadow Warrior 3
2.749 MHz
Sniper Elite 5
2.760 MHz
Spider-Man Remastered
2.744 MHz
Spider-Man Remastered + RT
2.745 MHz
Tiny Tina's Wonderlands
2.745 MHz
Durchschnitt
2.744 MHz
In den einzelnen Spielen zeigten sich dann auch nur leichte Variationen. 2.760 MHz lagen als höchster durchschnittlicher Takt in Cyberpunk 2077, Dying Light 2, Far Cry 6, Ghostwire: Tokyo, Guardians of the Galaxy, Saints Row und Sniper Elite 5 an.
Unter 2.700 MHz rutscht der Takt nur sehr selten
Den geringsten Takt gab es wiederum in F1 22 bei angeschaltetem Raytracing, nur dort rutschte der Takt unter 2.700 MHz. Doch auch dieser Wert war mit 2.688 MHz lediglich 102 MHz vom theoretischen Maximum entfernt. Metro Exodus Enhanced Edition war mit 2.702 MHz das Spiel mit dem zweitniedrigsten Takt.
Wenig verwunderlich änderte sich an den Taktraten wenig bis gar nichts, wenn auf der RTX 4090 das Power-Limit ohne manuelle Taktanpassung angehoben wurde. Nur dort, wo das Power-Limit überhaupt limitierte, ging es leicht nach oben, so dass mindestens 2.745 MHz anlagen. Die verbleibende Differenz zum Maximum von 2.790 MHz hatte eine andere Ursache als das neue Power-Limit, das nicht erreicht wurde.
Bei der GeForce-RTX-3000-Serie war das anders: Da diese Modelle in der Regel so hoch takteten, wie es das Power-Limit erlaubte, konnte der Takt durch ein höheres Power-Limit direkt mit angehoben werden.
Taktverlauf – Ultra HD, Doom Eternal
Benchmarks mit und ohne RT in 3.840 × 2.160
Die GeForce RTX 4090 zeigt in 3.840 × 2.160 bei den Rasterizer-Spielen bei den Durchschnitts-FPS eine um 65 Prozent bessere Performance als die GeForce RTX 3090 Ti. Das Plus gegenüber der Asus GeForce RTX 3090 Strix OC liegt bei 73 Prozent, während die Radeon RX 6900 XT XTXH als schnellste AMD-Grafikkarte eine Differenz von 83 Prozent aufweist. Bei den Perzentil-FPS liegt der Vorsprung der GeForce RTX 4090 zu den beiden Vorgängern aus dem eigenen Haus bei 60 und 70 Prozent.
Bei den Raytracing-Spielen kann die GeForce RTX 4090 ihren Vorsprung nochmal etwas aufbauen, auch wenn die Unterschiede im Performancerating nur gering sind. Dann liegt das neue Nvidia-Flaggschiff bei den AVG-FPS um 69 Prozent vor der GeForce RTX 3090 Ti und um 79 Prozent vor der GeForce RTX 3090. Die AMD-Grafikkarten auf Basis von RDNA 2 sind bei den angehobenen Raytracing-Einstellungen chancenlos: Hier bietet die GeForce RTX 4090 mal eben 159 Prozent mehr Leistung als die Radeon RX 6900 XT XTXH – AMD hat mit RDNA 3 viel aufzuholen.
Die Rohleistung kommt in Spielen oft nicht an
Die Benchmarks zeigen eine massive Leistungssteigerung der GeForce RTX 4090, doch mit Blick auf die theoretische Rechenleistung (+107 Prozent gegenüber der RTX 3090 Ti) wird klar: So einiges kommt nicht an. Das gilt für den Einsatz ohne und mit Raytracing.
Offenbar hat die AD102-GPU Schwierigkeiten damit, ihre vielen FP32-ALUs auszulasten – etwas, mit dem auch schon Ampere zu kämpfen hatte. Da Nvidia das Frontend bei Ada Lovelace nicht großartig geändert hat, verwundert es auch nicht, dass die Schwierigkeiten geblieben sind.
Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel
Das heißt aber nicht, dass es keine Spiele gibt, in denen deutlich mehr Performance ankommt. In Call of Duty: Vanguard ist die GeForce RTX 4090 mal eben satte 90 Prozent schneller als die GeForce RTX 3090 Ti und bewegt sich damit durchaus recht nahe am theoretischen Maximum. In Forza Horizon 5 lässt sich ein sehr gutes Plus von 87 Prozent messen, in Sniper Elite 5 immerhin 82 Prozent und in Halo Infinite 81 Prozent. Auf der anderen Seite gibt es aber auch Titel, in denen die Skalierung schlechter ist. In Cyberpunk 2077 legt die neue GeForce so „nur“ um 57 Prozent zu, in Dying Light 2 sind es 55 Prozent, in Far Cry 6 50 Prozent und in Ghostwire: Tokyo 41 Prozent. Und ein CPU-Limit gibt es dort nicht.
Manche Spiele profitieren spürbar von den RT-Verbesserungen
In den einzelnen Spielen zeigt sich dann auch besser, dass Ada Lovelace bei der Raytracing-Performance mehr zulegt als bei der Rasterizer-Leistung, was im Performancerating ein wenig untergeht. So läuft Cyberpunk 2077 bei Rasterizer-Grafik um 57 Prozent schneller als die GeForce RTX 3090 Ti, mit Raytracing sind es dagegen klar bessere 84 Prozent. In Deathloop liegen die Verhältnisse bei 61 zu 82 Prozent, bei Dying Light 2 bei 55 zu 75 Prozent und in Ghostwire: Tokyo bei 41 zu 67 Prozent. Bei den anderen RT-Titeln sind die Unterschiede deutlich geringer oder gar nicht vorhanden. Dabei hat dies nichts mit „viel oder wenig Raytracing“ zu tun. So hat Deathloop keine hohen RT-Kosten, hier ist Ada Lovelace aber klar besser als Ampere. Guardians of the Galaxy hat dagegen hohe RT-Kosten, profitiert aber überhaupt nicht von den RT-Verbesserungen.
DLSS ist auf der RTX 4090 eine Option – aber kein Must-have
Wer bis jetzt mit Raytracing in Ultra HD spielen möchte, ist auf Upsampling angewiesen – ansonsten reicht die Performance einfach nicht aus. Mit der GeForce RTX 4090 ist dies anders. Die Grafikkarte hat eine so hohe Rechenleistung, dass DLSS eine sinnvolle Option, aber kein Muss mehr ist. Einzig Cyberpunk 2077 krebst mit 34 FPS in 3.840 × 2.160 herum, alle anderen Spiele laufen mit mindestens 60 FPS oder gleich deutlich mehr. Keine andere Grafikkarte ist aktuell dazu auch nur im Ansatz in der Lage.
Benchmarks mit RT und FSR 2.x/DLSS 2.x in 3.840 × 2.160
Wird in Ultra HD DLSS 2.x Quality aktiviert, steigt die Performance der GeForce RTX 4090 spürbar an, der Vorsprung zur GeForce RTX 3090 Ti reduziert sich jedoch auf 51 Prozent. Das verwundert auch nicht, weil bei weniger Renderpixeln AD102 den Vorteil der vielen ALUs weniger ausspielen kann. Zudem rückt das CPU-Limit in der Auflösung automatisch deutlich näher – gerade, wenn Raytracing aktiviert ist.
Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel
Während Deathloop, God of War und Spider-Man mit DLSS zum Beispiel kaum flotter werden, legen Dying Light 2 und Ghostwire: Tokyo deutlich zu. In Dying Light 2 erhöht sich die Framerate um starke 68 Prozent von kaum mehr als 60 FPS in den dreistelligen Framebereich. Und in Ghostwire: Tokyo liegt das Plus bei immer noch sehr guten 50 Prozent, was von knapp 60 FPS in leicht mehr als 90 FPS resultiert.
In 2.560 × 1.440 gerät die GeForce RTX 4090 dann auch mit dem Intel Core i9-12900K immer mal wieder in ein CPU-Limit. Darüber hinaus fällt es der GPU automatisch schwerer, die vielen FP32-ALUs auszulasten. Und damit kann sich die neue Grafikkarte in WQHD dann „nur“ noch um 47 Prozent in Rasterizer-Spielen von der GeForce RTX 3090 Ti absetzen, was deutlich weniger als bei Ultra HD ist.
In Raytracing-Titeln ist das Plus mit 51 Prozent dann wieder etwas höher als ohne die Strahlen, fällt aber auch mit diesen klar gegenüber den Ergebnissen von Ultra HD zurück. Das verwundert nicht, denn Raytracing benötigt oft mehr CPU-Leistung als reine Rasterizer-Grafik.
Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel
Das CPU-Limit ist dabei das größere Problem als die komplexere Auslastung der ALUs. In Deathloop bremst es die GeForce RTX 4090 zum Beispiel deutlich ein, die neue Grafikkarte liefert dann nur noch 24 Prozent höhere FPS als das alte Flaggschiff. Mit Raytracing sind es gar nur 16 Prozent, da die CPU eine noch größere Rolle spielt. Ähnlich sieht es in F1 22 ohne Raytracing sowie generell in Far Cry 6 und Ghostwire: Tokyo aus.
In manchen Games bremst die GPU dann jedoch nicht und die GeForce RTX 4090 legt wieder massiv gegenüber der GeForce RTX 3090 Ti zu, wenn auch in kleinerem Ausmaß als in 3.840 × 2.160. In CoD: Vanguard beträgt das Plus immer noch sehr hohe 76 Prozent, in Cyberpunk 2077 mit RT sind es 78 Prozent, in Doom Eternal mit RT 70 Prozent und in Dying Light 2 mit RT 75 Prozent. Das Highlight ist Forza Horizon 5 mit einer sehr hohen Leistungssteigerung von 83 Prozent.
Bei der extrem hohen Auflösung von 5.120 × 2.880 sollte man eigentlich davon ausgehen, dass die GeForce RTX 4090 ihre Shader-Einheiten nochmal etwas besser als in Ultra HD auslasten kann. Dennoch kann sich die Grafikkarte in der Auflösung mit 62 Prozent etwas weniger als in Ultra HD von der GeForce RTX 3090 Ti absetzen. Technisch gibt es dafür eigentlich keinen Grund, vermutlich hat Nvidia jedoch den Treiber einfach weniger auf die ungewöhnliche Auflösung angepasst.
Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel
Dennoch schafft es die GeForce RTX 4090 spielend, in den meisten Games teils klar mehr als 60 FPS zu erreichen. Einzig in Cyberpunk 2077 und Ghostwire: Tokyo bleibt die Grafikkarte knapp unter der Marke. Anders als die GeForce RTX 3090 Ti erreicht das neue Modell dennoch gut spielbare Frameraten. In letztgenanntem Titel müsste die GeForce RTX 4090 eigentlich deutlich mehr FPS liefern, doch ohne Raytracing kommt sie hier nicht so richtig gegenüber dem Vorgänger vorwärts.
Die nachfolgende Tabelle fasst alle Spiele-Einzelergebnisse im Vergleich GeForce RTX 4090 zu GeForce RTX 3090 Ti abschließend übersichtlich zusammen. Das bereits angesprochene Verhalten mit aktivem Raytracing, wo es mal deutlich und mal weniger deutlich zugunsten der neuen Generation ausgeht, wird so noch einmal deutlicher.
Spiel
RTX 4090 FE vs. RTX 3090 Ti
WQHD (RT)
UHD (RT) inkl. FSR/DLSS
UHD (RT)
5K
COD Vanguard
+76 %
-
+90 %
+82 %
Cyberpunk 2077
+48 %
-
+75 %
+63 %
Cyberpunk 2077 + RT
+78 %
-
+84 %
-
Deathloop
+24 %
-
+61 %
+53 %
Deathloop + RT
+16 %
-
+82 %
-
Doom Eternal
+59 %
-
+68 %
+61 %
Doom Eternal + RT
+70 %
+36 %
+69 %
-
Dying Light 2
+60 %
-
+55 %
+57 %
Dying Light 2 + RT
+75 %
+75 %
+75 %
-
F1 22
+17 %
-
+69 %
+69 %
F1 22 + RT
+66 %
-
+76 %
-
Far Cry 6
+19 %
-
+50 %
+42 %
Far Cry 6 + RT
+12 %
-
+48 %
-
Forza Horizon 5
+83 %
-
+87 %
+82 %
Ghostwire Tokyo
+ 19 %
-
+41 %
+36 %
Ghostwire Tokyo + RT
+41 %
+46 %
+67 %
-
God of War
+49 %
+54 %
58 %
+58 %
Guardians of the Galaxy
+51 %
-
+60 %
+55 %
Guardians of the Galaxy + RT
+66 %
-
+64 %
-
Halo Infinite
+45 %
-
+81 %
+72 %
Metro Exodus Enhanced
+63 %
-
+64 %
-
Saints Row
+57 %
-
+61 %
+64 %
Saints Row + RT
+58 %
-
+63 %
-
Shadow Warrior 3
+39 %
-
+59 %
+48 %
Sniper Elite 5
+85 %
-
+82 %
+72 %
Spider-Man Remastered
+50 %
-
+77 %
+76 %
Spider Man Remastered + RT
+32 %
+49 %
+74 %
-
Tiny Tina's Wonderlands
+48 %
-
+63 %
+57 %
Benchmarks in Anwendungen
Spiele sind das eine, doch Grafikkarten können heute weit mehr als das und Nvidia hat mit CUDA eine besonders mächtige API zu bieten, die sich am Markt einer weiten Verbreitung erfreut. In der aktuellen Version macht CUDA nicht nur die Shader, sondern auch die RT- und die Tensor-Kerne zugänglich.
Mit Adobe Premiere Pro, Agisoft Metashape und Blender Benchmark musste sich die GeForce RTX 4090 sowohl der versammelten letzten Generation als auch Radeon RX 6000 und Intel Arc stellen.
Rendern ist die Paradedisziplin
Am deutlichsten fällt der Leistungszugewinn in Blender Benchmark aus, wo die RTX 4090 satte 90 Prozent vor der RTX 3090 Ti liegt. Ein Grund dafür ist auch, weil in diesem Test weder die CPU noch die Video-Einheit einen Einfluss haben, die Rohleistung der GPU also ungebremst in Performance umgesetzt werden kann.
Beim Projekt-Export in Adobe Premiere Pro 22.5 ist das nicht der Fall. Hier spielen auch die CPU (immer ein Ryzen 7 7700X, DDR5-5200CL32) und die Video-Einheit eine Rolle, so dass der Vorsprung der neuen GPU weniger als 10 Prozent beträgt. In Agisoft Metashape sind es gut 15 Prozent.
Ebenfalls beschleunigen respektive effizienter als die CPU abwickeln können GPUs das De- und Encodieren von Videos über ihre dedizierte Video-Einheit. Im Vergleich Ampere zu Ada Lovelace haben NVDEC (Decoder) und NVENC (Encoder) folgende wesentliche Überarbeitungen erfahren:
NVENC unterstützt AV1, bis dato beherrschte das nur Intel Arc.
NVENC ist leistungsfähiger.
NVENC liegt in AD102 zweifach vor, was die Leistung beim Encoding (H.265, AV1) theoretisch verdoppeln kann.
Dass NVENC in AD102 schneller arbeitet, kann in der aktuellen Nightly von HandBrake nachvollzogen werden, da es prinzipiell auch AV1-Hardware-Encoding unterstützt. Genutzt werden konnte diese Funktion allerdings nur auf Intel Arc, „AV1 (NVENC)“ blieb als Codec auf der RTX 4090 verborgen. Der Test mit H.265 zeigt dafür: NVENC in Ada ist etwas über 20 Prozent schneller fertig als NVENC in Ampere, Quicksync in Intel Arc für Desktop-PCs ist aber noch flotter unterwegs.
Medion Erazer Major X10 Core i7-12700H, Arc A730M, Turbo
1:56
Einheit: Minuten, Sekunden
Dass AD102 auf der Nvidia GeForce RTX 4090 AV1-Encoding beherrscht, konnte die Redaktion in DaVinci Resolve 18 Studio bestätigen. Auch war dort der von Nvidia versprochene Leistungszugewinn bei Nutzung beider NVENC sichtbar. Das galt allerdings nur in dem von Nvidia bereitgestellten Projekt auf Basis einer angepassten Variante von DaVinci Resolve 18 Studio.
Ein von der Redaktion genutztes Projekt in derselben App zeigte beim Export in AV1 wiederum lediglich den in HandBrake sichtbaren Zugewinn gegenüber Ampere, obwohl die erforderlichen Einstellungen (Output in 4K oder 8K, Preset „Very Fast“ oder „Faster“, Tuning „High Quality“) auch in Rücksprache mit Nvidia korrekt gesetzt waren. Die Redaktion ist mit Nvidia um eine Klärung bemüht.
Davon unabhängig gilt: Nvidia NVENC in Ada Lovelace ist schneller als der Vorgänger und beherrscht AV1. Durch parallele Nutzung beider Encoder lässt sich die Leistung in der Tat verdoppeln. Dafür ist allerdings angepasste Software vonnöten.