Nvidia GeForce „Blackwell“: Neue Details und Benchmarks zu RTX 5090, 5080 & 5070 (Ti)

Update Wolfgang Andermahr
592 Kommentare
Nvidia GeForce „Blackwell“: Neue Details und Benchmarks zu RTX 5090, 5080 & 5070 (Ti)
Bild: Nvidia

Nvidia hat neue Details zur GeForce RTX 5090, GeForce RTX 5080, GeForce RTX 5070 Ti und GeForce RTX 5070 bekannt gegeben, die sowohl die Technik als auch die Features betreffen. Teilweise sind die Informationen gänzlich neu, teilweise wird bereits bekanntes ergänzt. Neue Benchmarks gibt es auch. Eine Zusammenfassung.

Update

Die Leistungsabschätzung auf Basis der von Nvidia präsentierten Benchmarks wurde um die drei Super-Varianten der GeForce-RTX-4000-Serie ergänzt. Nvidia vergleicht die neue Generation bis dato ausschließlich mit den Ur-Varianten, dabei haben insbesondere die beiden 70er-Varianten mit den Super-Modellen bei Leistung (beide) und Speicher (70 Ti) bereits Mid-Cycle-Aufwertungen erhalten.

Auch die Preisübersicht RTX 5000 vs. RTX 4000 enthält jetzt die Preise der Super-Varianten, mit der Nvidia den zuvor stark kritisierten Preis der RTX 4080 bereits deutlich reduziert hatte. Während die RTX 5080 im Vergleich zur RTX 4080 deutlich günstiger starten wird, sieht es im Vergleich zur RTX 4080 Super anders aus.

Die zwei wichtigsten neuen Features der Blackwell-Generation für Spieler sind zum einem DLSS 4 mit einem neuen neuronalen Netzwerk inklusive Transformer-Model sowie DLSS Multi Frame Generation (MFG), das die Bildqualität und auch die Performance verbessern, und Reflex 2, das die Latenzen mit einem neuen Ansatz im Griff behalten soll. Abseits von DLSS 4 Multi Frame Generation (drei statt ein KI-Zwischenbild) werden alle neuen DLSS-4- und Reflex-2-Features und –Verbesserungen entweder sofort oder auf absehbarer Zeit auch auf älteren GeForce-RTX-Grafikkarten zur Verfügung stehen. ComputerBase hat für beide Features separate Inhalte verfasst:

Die in diesem Artikel präsentierten neuen Informationen beziehen sich daher auf Eigenschaften abseits von DLSS 4 und Reflex 2. Hier sind nun die Details:

Die neuen Neural Shader

Nvidia will mit Blackwell mehr AI in Spiele abseits von DLSS bringen. Aus diesem Grund unterstützen alle GeForce-RTX-5000-Grafikkarten „Neural Shader“, wobei es sich schlicht um AI-Programme im normalen Shader Code handelt, was es bis jetzt noch nicht gegeben hat. Ohne eine spezielle, zusätzliche API ist es nicht möglich gewesen, ein neuronales Netzwerk in einem Spiel zu nutzen.

Mehr AI in Spielen abseits von DLSS

Neural Shader sollen das jetzt ändern. Dabei werden die AI-Anteile der Shaderprogramme auf den Tensor-Kernen berechnet, das eigentliche Rendern wird weiterhin von den normalen FP32-ALUs durchgeführt.

Die neuen Neural Shader werden dabei auch den Weg in DirectX finden und somit potenziell von allen Grafikkarten-Herstellern genutzt werden können. Microsoft nennt das Feature „Cooperative Vectors“, dass es „bald“ in Windows geben soll.

Realistischere Haut, Haare und Gesichter mit weniger VRAM-Bedarf

Nvidia gibt auch einen ersten Einblick, was mit den Neural Shader alles möglich sein soll. So wird „RTX Neural Materials“ genannt, mit dem eine filmische Oberflächenqualität bei vorab vom Entwickler antrainierten Materialien bei geringem Speicherverbrauch ermöglicht werden soll. „RTX Neural Radiance Cache“ soll indirekte Beleuchtung per Pathtracing mit einem Bounce pro Pixel mittels eines selbst in Echtzeit anlernendes, neuronales Netzwerk bieten.

Auch die Darstellung von Charakteren jeglicher Art soll mit Neural Shader besser werden. Nvidia nennt hier „RTX Skin“ für die Hautdarstellung und „RTX Neural Faces“ für Gesichter. Sowohl die Beleuchtung von Gesichtern als auch die dargestellten Emotionen sollen vorab auf einem Supercomputer antrainiert werden, die dann mittels eines neuronalen Netzwerkes auf der Grafikkarte für die Spielszene umgesetzt und gerendert werden soll.

Mit „RTX Hair“ sind dann die Haare dran, wo die Haardarstellung sowohl schöner als auch ressourcenschonender umgesetzt werden soll. Mit RTX Hair soll nur ein Drittel des Datenbedarfs gegenüber klassischer Rendermethoden mittels Raytracing notwendig sein, was VRAM einsparen und zugleich die Performance erhöhen soll.

Blackwell vs. Ada Lovelace – Architekturunterschiede

Nvidia hält sich auch bei den neuen Informationen zurück bezüglich Informationen zur eigentlichen GPU-Architektur, was vermutlich daran liegt, dass sich dort gar nicht so viel gegenüber Ada Lovelace geändert hat.

So scheint der generelle Aufbau von Blackwell identisch zu Ada Lovelace zu sein und primär nach oben zu skalieren, es gibt entsprechend mehr Einheiten. Bei den Streaming Multiprocessors hat sich dann doch etwas getan, wo Nvidia bereits in den vergangenen Generationen immer mal wieder etwas geändert hat.

Angepasste Streaming Multiprocessors

Nvidia Blackwell Architektur (Bild: Nvidia)

So konnte ein Streaming-Multiprocessor (SM) bei Turing pro Takt 64 Floating-Point und 64-Integer-Berechnungen durchführen, bei Ampere und Ada Lovelace sind es dann 128 FP- oder 64 FP und 64 INT-Berechnungen. Bei Blackwell macht Nvidia dann eine Mischung aus Turing und Ampere, ein SM kann 128 Floating-Point- oder 128 Integer-Berechnungen durchführen, die Integer-Seite wurde entsprechend verbessert. Und genauso ist es auch möglich, eine Mischung von FP- und INT-Operationen gleichzeitig durchzuführen, wobei nicht klar ist, ob es dann nur ein festes 64/64-Verhältnis gibt oder ob dies auch dynamisch konfiguriert werden kann.

Das will Nvidia gemacht haben, da dies besser zu den Anforderungen von Neural-Shader-Programmen passt.

Doppelter RT-Durchsatz bei den Raytracing-Einheiten

Blackwell kommt mit der vierten Generation an Raytracing-Einheiten daher, die eine verdoppelten Intersection-Rate gegenüber Ada Lovelace mitbringt. Es kann also doppelt so schnell geprüft werden, ob ein Strahl auf ein Dreieck trifft. Nvidia hat seit Turing bei jeder neuen RT-Generation die Intersection-Rate verdoppelt.

Das mit Ada Lovelace eingeführte Shader Executive Reordering soll bei Blackwell nun ebenso doppelt so schnell erfolgen als beim Vorgänger. Neben den klassischen Shaderprogrammen soll Blackwell auch dazu in der Lage sein, Neural Shader zu sortieren und diese für die Berechnung auf den Tensor-Kernen vorzubereiten. SER muss vom Spiel explizit unterstützt werden und verbessert primär bei Full-Raytracing-Spielen die Performance.

Darüber hinaus soll Raytracing auf Blackwell 25 Prozent weniger Grafikkartenspeicher benötigen als Ada Lovelace.

Die Tensor-Kerne können ein neues Datenformat

Die Tensor-Kerne liegen mit Blackwell in der fünften Generation vor, die zwar bei gleicher Präzision keinen höheren Datendurchsatz gegenüber Ada Lovelace aufweisen, dafür aber mit einem neuen Datenformat umgehen können. Bei RTX 4000 war bei FP8 Schluss, RTX 5000 beherrscht nun auch FP4. Wenn eine Matrizenberechnung also mit FP4-Genauigkeit arbeitet, kann Blackwell doppelt so viele Operationen durchführen wie Ada Lovelace.

Blackwell kommt zudem mit einem neuen „AI Management Processor“ daher, der die Zusammenarbeit zwischen den Render-ALUs, den RT-Einheiten und den Tensor-Kernen verbessern soll, wenn diese gleichzeitig arbeiten. Da der AI Management Processor Einheiten priorisieren kann, soll zum Beispiel das Frame Pacing bei Frame Generation besser sein als ohne.

Neue Tensor-Kerne und AI-Features (Bild: Nvidia)

Display-Anschlüsse und Video En-/Decoding

DisplayPort 2.1 und HDMI 2.1

Alle GeForce-RTX-5000-Grafikkarten kommen mit einer neuen Display-Engine daher, die DisplayPort 2.1 mit einer Datenrate von UHBR20 und damit 80 Gbps unterstützt. Bei HDMI bleibt es beim 2.1-Standard.

Blackwells Display Engine kommt zudem mit dem so genannten „Flip Metering“ zurecht, was bei DLSS Multi Frame Generation wichtig ist. Mit Flip Metering bestimmt nicht mehr die CPU über das Pacing der Bildausgabe, sondern die Display Engine der Grafikkarte, wodurch gutes Frame Pacing bei DLSS MFG erst möglich sein soll.

Neue Display- und Video-Engine
Neue Display- und Video-Engine (Bild: Nvidia)

Mehr und neuere Video-Einheiten

Blackwell kommt mit der neunten Generation an Encoder- und der sechsten Decoder-Einheit daher. Diese kann das neue Ultra-High-Quality-Preset vom AV1-Codec beschleunigen, dasselbe gilt für MV-HEVC (Multiview High Efficiency Video Coding), das für die 3D-Wiedergabe auf VR-Headsets gedacht ist. Neu hinzu gekommen mit RTX 5000 ist die Beschleunigung von Videos mit einer Farbunterabtastung von 4:2:2, Ada Lovelace konnte nur mit 4:2:0 umgehen.

Nvidia will nicht nur die Qualität der En- und Decoder verbessert haben, darüber hinaus gibt es auch mehr davon, um die Performance weiter zu verbessern. So verfügen die größeren GeForce-RTX-4000-Karten erstmals über 2 NVENC-Einheiten zum Encodieren, manche RTX-5000-Beschleuniger haben derweil 3 NVENC-Einheiten. Es soll nicht nur die Bildqualität um 10 Prozent besser mit der neuen GPU-Architektur ausfallen (BD-BR PSNR), mit der zusätzlichen, dritten NVENC-Einheit soll die GeForce RTX 5090 ein nicht näher spezifiziertes Video in 10 Minuten encodieren, wofür die GeForce RTX 4090 16 Minuten benötigt. Darüber hinaus gibt es erstmals bei manchen RTX-5000-Grafikkarten 2 Decoder-Einheiten, die GeForce-RTX-4000-Generation beschränkt sich immer auf einen Decoder.

Weitere RTX-5000-Gaming-Benchmarks

Nvidia zeigt auch neue Gaming-Benchmarks, die eine GeForce RTX 5090 mit einer GeForce RTX 4090 vergleicht. Dabei stellt Nvidia in den meisten Szenarien erneut DLSS 4 auf RTX 5000 mit Multi Frame Generation (drei Zwischenbilder) und auf RTX 4000 mit Frame Generation (ein Zwischenbild) gegenüber, es gibt mit Resident Evil 4 (Raytracing, aber ohne DLSS) und Horizon Forbidden West (kein Raytracing, DLSS Super Resolution, kein DLSS (M)FG) aber zwei neue Ergebnisse mit denselben relevanten Settings.

Benchmarks der GeForce RTX 5090
Benchmarks der GeForce RTX 5090 (Bild: Nvidia)
Benchmarks der GeForce RTX 5090
Benchmarks der GeForce RTX 5090 (Bild: Nvidia)
Benchmarks der GeForce RTX 5090
Benchmarks der GeForce RTX 5090 (Bild: Nvidia)
Benchmarks der GeForce RTX 5080
Benchmarks der GeForce RTX 5080 (Bild: Nvidia)
Benchmarks der GeForce RTX 5070 Ti
Benchmarks der GeForce RTX 5070 Ti (Bild: Nvidia)
Benchmarks der GeForce RTX 5070
Benchmarks der GeForce RTX 5070 (Bild: Nvidia)

Näherungsweise lassen die beiden Benchmarks in Resident Evil 4 und Horizon Forbidden West folgende Zuwächse ableiten:

Klasse Zuwachs Shader Zuwachs im Benchmark
RTX 5000 RTX 4000S RTX 4000 RTX 5000* RTX 4000S** RTX 4000
90er 133 % 100 % ~ 133 % 100 %
80er 111 % 105 % 100 % ~ 115 % 102 % 100 %
70er Ti 117 % 110 % 100 % ~ 120 % 110 % 100 %
70er 104 % 122 % 100 % ~ 120 % 116 % 100 %
* Schätzung auf Basis der von Nvidia präsentierten Benchmarks in RE 4 und Horizon FW
** Zuwachs gemäß Super-Tests von Januar 2024 (UHD, ohne RT)

Das Abschneiden der RTX 5070 fällt dabei klar aus dem Rahmen dessen, was die anderen drei Modelle zeigen: Hier soll es deutlich mehr Leistung als Zuwachs bei den Shadern geben. Die Speicherbandbreite sollte es nicht sein, die TDP ist allerdings deutlich gestiegen. Dass die Leistung dazu fast analog steigt, erscheint zur Stunde allerdings noch nicht schlüssig.

Nvidia vergleich die neue Generation aktuell zudem immer nur mit den Ur-Versionen der GeForce-RTX-40-Serie. Auf dieser Basis sieht es so als, als würde die 5080 den kleinsten Sprung in der Rohleistung hinlegen. Werden allerdings die Super-Varianten herangezogen, wie ComputerBase das getan hat, dreht sich das Bild: Weil 4070 Super und 4070 Ti Super (deutlich) mehr Leistung brachten, die 4080 Super hingegen quasi auf der Stelle trat, legt die 5080 in diesem Vergleich am Ende sogar (knapp vor der 5070 Ti) am deutlichsten zu, während die 5070 zur 4070 Super kaum Wachstum zeigt. Unabhängig der geänderten Reihenfolge sind die Zuwächse aller neuen Grafikkarten gegenüber den Super-Varianten natürlich noch einmal kleiner.

Die neue Founders Edition – Der Double-Flow-Through-Kühler

Ein paar neue Details zum neuen Founders-Edition-Kühler auf der GeForce RTX 5090 und GeForce RTX 5080 gibt es auch. Diesen nennt Nvidia „Double Flow Through“-Design, da beide Lüfter ungebremst über die Kühllamellen durch den Kühler die Luft pusten können. Bei den großen RTX-4000-Modellen konnte dies nur der hintere Lüfter, beim vorderen war dagegen das PCB im Weg. Der Lüfter hat entsprechend nicht die Luft durch den Kühler gepustet, sondern versucht diese über die Slotblende abzugeben, in dem diese gegen das PCB gepustet worden ist.

Laut Nvidia soll das Double-Flow-Through-Design eine deutlich bessere Kühlleistung erreichen als das bisherige Design, wobei Nvidia jedoch nur das neue Dual-Slot-Design mit einem Dual-Slot-Design der RTX-4000-Generation vergleicht, nicht aber mit dem deutlich größeren und besseren 3-Slot-Design der GeForce RTX 4080 und GeForce RTX 4090.

Im reinen 2-Slot-Vergleich schneidet der Double-Flow-Through-Kühler dann deutlich besser als der Vorgänger ab, selbst 600 Watt soll dieser leiser abführen können als 400 Watt mit dem alten Kühler und zugleich kaum lauter sein als der alte Kühler mit 300 Watt – was schon ein riesiger Unterschied ist. Mit 400 Watt soll der neue Kühler auch entsprechend leicht leiser als das alte Derivat mit nur 200 Watt sein.

Nvidia GeForce RTX 5000: Mehr Details, Preise und Release

ComputerBase berichtet umfangreich über die neuen GeForce-RTX-5000-Grafikkarten in Form der GeForce RTX 5090, GeForce RTX 5080, GeForce RTX 5070 Ti und GeForce RTX 5070 und wird dies in den kommenden Wochen auch weiter tun inklusive groß angelegter Tests zu jedem einzelnen Blackwell-Modell.

Gerüchten zufolge fällt das Embargo auf Tests der RTX 5090 am 24. Januar, auf Tests der RTX 5080 am 29. (Karten zum Einstiegs-UPV) respektive 30. Januar (teurere Modelle). Marktstart beider Serien ist der 30. Januar.

UVP GeForce RTX 5000 vs. RTX 4000 im Vergleich
Klasse UVP in USD (vor Steuern) UVP in Euro (inkl. MwSt.)
RTX 5000
„Blackwell“
RTX 4000 (Super)
„Ada Lovelace“
RTX 5000
„Blackwell“
RTX 4000 (Super)
„Ada Lovelace“
90er 1.999 USD 1.599 (-) USD 2.329 Euro 1.949 (-) Euro
80er 999 USD 1.199 (999) USD 1.169 Euro 1.469 (1.109) Euro
70er Ti 749 USD 799 (799) USD 879 Euro 899 (899) Euro
70er 549 USD 599 (599) USD 649 Euro 659 (659) Euro
Angaben in Klammern für die Super-Varianten

Erste Analysen zu den neuen Details zur Technik hinter GeForce RTX 50 und eine Einordnung der Herstellerbenchmarks stellen Jan und Fabian in der aktuellen Folge des ComputerBase-Podcasts CB-Funk an:

CB-Funk lässt sich nicht nur über den in diesen Artikel eingebetteten Podigee-Player abspielen, sondern auch bequem direkt in den Podcast-Apps eurer Wahl abonnieren und hören. Verfügbar ist der ComputerBase-Podcast auf Spotify, Apple Podcasts, Amazon Music und ebenso auf Deezer.

Nachfolgend eine Übersicht über alle bisherigen RTX-5000-Meldungen und im Anschluss noch einmal die technischen Eckdaten im Detail.

Überblick über die Eckdaten der GeForce-RTX-5000-Serie
Modell GeForce RTX 5090 GeForce RTX 5080 GeForce RTX 5070 Ti GeForce RTX 5070
Architektur Blackwell
GPU GB202 GB203 GB205
CUs aktiv (Chip*) 170 (192) 84 (84) 70 (84) 48 (50)
aktive Shader 21.760 10.752 8.960 6.144
Taktraten Boost/Basis 2.410/2.010 2.620/2.300 2.450/2.300 2.510/2.160
Speicher 32 GB GDDR7 16 GB GDDR7 12 GB GDDR7
Speicher-Interface 512 Bit 256 Bit 192 Bit
Speicherdurchsatz 28 Gbps 30 Gbps 28 Gbps 28 Gbps
Bandbreite 1.792 GB/s 960 GB/s 896 GB/s 672 GB/s
PCI Express 5.0 x16
TDP 575 W 360 W 300 W 250 W
Founders Edition Ja Nein Ja
2 Slot (304 mm) 2 Slot (242mm)
Stromanschluss (mind.) 1x 12V-2x6 (600 Watt) 1x 12V-2x6 (min. 450 Watt) 1x 12V-2x6 (min. 300 Watt)
I/O 3× DisplayPort 2.1b
1× HDMI 2.1
? 3× DisplayPort 2.1b
1× HDMI 2.1
DLSS DLSS 4
AI TOPS 3.352 1.801 1.406 988
Markteinführung 30. Januar 2025 Februar
UVP (ink. MwSt.) 2.329 Euro 1.169 Euro 879 Euro 649 Euro
* unbestätigt

ComputerBase hat Informationen zu diesem Artikel von Nvidia unter NDA erhalten. Eine Einflussnahme des Herstellers auf die oder eine Verpflichtung zur Berichterstattung bestand nicht. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.

Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.