Nvidia GeForce „Blackwell“: Neue Details und Benchmarks zu RTX 5090, 5080 & 5070 (Ti)
Nvidia hat neue Details zur GeForce RTX 5090, GeForce RTX 5080, GeForce RTX 5070 Ti und GeForce RTX 5070 bekannt gegeben, die sowohl die Technik als auch die Features betreffen. Teilweise sind die Informationen gänzlich neu, teilweise wird bereits bekanntes ergänzt. Neue Benchmarks gibt es auch. Eine Zusammenfassung.
Die Leistungsabschätzung auf Basis der von Nvidia präsentierten Benchmarks wurde um die drei Super-Varianten der GeForce-RTX-4000-Serie ergänzt. Nvidia vergleicht die neue Generation bis dato ausschließlich mit den Ur-Varianten, dabei haben insbesondere die beiden 70er-Varianten mit den Super-Modellen bei Leistung (beide) und Speicher (70 Ti) bereits Mid-Cycle-Aufwertungen erhalten.
Auch die Preisübersicht RTX 5000 vs. RTX 4000 enthält jetzt die Preise der Super-Varianten, mit der Nvidia den zuvor stark kritisierten Preis der RTX 4080 bereits deutlich reduziert hatte. Während die RTX 5080 im Vergleich zur RTX 4080 deutlich günstiger starten wird, sieht es im Vergleich zur RTX 4080 Super anders aus.
Die zwei wichtigsten neuen Features der Blackwell-Generation für Spieler sind zum einem DLSS 4 mit einem neuen neuronalen Netzwerk inklusive Transformer-Model sowie DLSS Multi Frame Generation (MFG), das die Bildqualität und auch die Performance verbessern, und Reflex 2, das die Latenzen mit einem neuen Ansatz im Griff behalten soll. Abseits von DLSS 4 Multi Frame Generation (drei statt ein KI-Zwischenbild) werden alle neuen DLSS-4- und Reflex-2-Features und –Verbesserungen entweder sofort oder auf absehbarer Zeit auch auf älteren GeForce-RTX-Grafikkarten zur Verfügung stehen. ComputerBase hat für beide Features separate Inhalte verfasst:
- Nvidia DLSS 4 im Detail: Multi Frame Generation und ein neues neuronales Netzwerk
- Nvidia Reflex 2 im Detail: So senkt Frame Warp die Latenz in allen Szenarien
Die in diesem Artikel präsentierten neuen Informationen beziehen sich daher auf Eigenschaften abseits von DLSS 4 und Reflex 2. Hier sind nun die Details:
Die neuen Neural Shader
Nvidia will mit Blackwell mehr AI in Spiele abseits von DLSS bringen. Aus diesem Grund unterstützen alle GeForce-RTX-5000-Grafikkarten „Neural Shader“, wobei es sich schlicht um AI-Programme im normalen Shader Code handelt, was es bis jetzt noch nicht gegeben hat. Ohne eine spezielle, zusätzliche API ist es nicht möglich gewesen, ein neuronales Netzwerk in einem Spiel zu nutzen.
Mehr AI in Spielen abseits von DLSS
Neural Shader sollen das jetzt ändern. Dabei werden die AI-Anteile der Shaderprogramme auf den Tensor-Kernen berechnet, das eigentliche Rendern wird weiterhin von den normalen FP32-ALUs durchgeführt.
Die neuen Neural Shader werden dabei auch den Weg in DirectX finden und somit potenziell von allen Grafikkarten-Herstellern genutzt werden können. Microsoft nennt das Feature „Cooperative Vectors“, dass es „bald“ in Windows geben soll.
Realistischere Haut, Haare und Gesichter mit weniger VRAM-Bedarf
Nvidia gibt auch einen ersten Einblick, was mit den Neural Shader alles möglich sein soll. So wird „RTX Neural Materials“ genannt, mit dem eine filmische Oberflächenqualität bei vorab vom Entwickler antrainierten Materialien bei geringem Speicherverbrauch ermöglicht werden soll. „RTX Neural Radiance Cache“ soll indirekte Beleuchtung per Pathtracing mit einem Bounce pro Pixel mittels eines selbst in Echtzeit anlernendes, neuronales Netzwerk bieten.
Auch die Darstellung von Charakteren jeglicher Art soll mit Neural Shader besser werden. Nvidia nennt hier „RTX Skin“ für die Hautdarstellung und „RTX Neural Faces“ für Gesichter. Sowohl die Beleuchtung von Gesichtern als auch die dargestellten Emotionen sollen vorab auf einem Supercomputer antrainiert werden, die dann mittels eines neuronalen Netzwerkes auf der Grafikkarte für die Spielszene umgesetzt und gerendert werden soll.
Mit „RTX Hair“ sind dann die Haare dran, wo die Haardarstellung sowohl schöner als auch ressourcenschonender umgesetzt werden soll. Mit RTX Hair soll nur ein Drittel des Datenbedarfs gegenüber klassischer Rendermethoden mittels Raytracing notwendig sein, was VRAM einsparen und zugleich die Performance erhöhen soll.
Blackwell vs. Ada Lovelace – Architekturunterschiede
Nvidia hält sich auch bei den neuen Informationen zurück bezüglich Informationen zur eigentlichen GPU-Architektur, was vermutlich daran liegt, dass sich dort gar nicht so viel gegenüber Ada Lovelace geändert hat.
So scheint der generelle Aufbau von Blackwell identisch zu Ada Lovelace zu sein und primär nach oben zu skalieren, es gibt entsprechend mehr Einheiten. Bei den Streaming Multiprocessors hat sich dann doch etwas getan, wo Nvidia bereits in den vergangenen Generationen immer mal wieder etwas geändert hat.
Angepasste Streaming Multiprocessors
So konnte ein Streaming-Multiprocessor (SM) bei Turing pro Takt 64 Floating-Point und 64-Integer-Berechnungen durchführen, bei Ampere und Ada Lovelace sind es dann 128 FP- oder 64 FP und 64 INT-Berechnungen. Bei Blackwell macht Nvidia dann eine Mischung aus Turing und Ampere, ein SM kann 128 Floating-Point- oder 128 Integer-Berechnungen durchführen, die Integer-Seite wurde entsprechend verbessert. Und genauso ist es auch möglich, eine Mischung von FP- und INT-Operationen gleichzeitig durchzuführen, wobei nicht klar ist, ob es dann nur ein festes 64/64-Verhältnis gibt oder ob dies auch dynamisch konfiguriert werden kann.
Das will Nvidia gemacht haben, da dies besser zu den Anforderungen von Neural-Shader-Programmen passt.
Doppelter RT-Durchsatz bei den Raytracing-Einheiten
Blackwell kommt mit der vierten Generation an Raytracing-Einheiten daher, die eine verdoppelten Intersection-Rate gegenüber Ada Lovelace mitbringt. Es kann also doppelt so schnell geprüft werden, ob ein Strahl auf ein Dreieck trifft. Nvidia hat seit Turing bei jeder neuen RT-Generation die Intersection-Rate verdoppelt.
Das mit Ada Lovelace eingeführte Shader Executive Reordering soll bei Blackwell nun ebenso doppelt so schnell erfolgen als beim Vorgänger. Neben den klassischen Shaderprogrammen soll Blackwell auch dazu in der Lage sein, Neural Shader zu sortieren und diese für die Berechnung auf den Tensor-Kernen vorzubereiten. SER muss vom Spiel explizit unterstützt werden und verbessert primär bei Full-Raytracing-Spielen die Performance.
Darüber hinaus soll Raytracing auf Blackwell 25 Prozent weniger Grafikkartenspeicher benötigen als Ada Lovelace.
Die Tensor-Kerne können ein neues Datenformat
Die Tensor-Kerne liegen mit Blackwell in der fünften Generation vor, die zwar bei gleicher Präzision keinen höheren Datendurchsatz gegenüber Ada Lovelace aufweisen, dafür aber mit einem neuen Datenformat umgehen können. Bei RTX 4000 war bei FP8 Schluss, RTX 5000 beherrscht nun auch FP4. Wenn eine Matrizenberechnung also mit FP4-Genauigkeit arbeitet, kann Blackwell doppelt so viele Operationen durchführen wie Ada Lovelace.
Blackwell kommt zudem mit einem neuen „AI Management Processor“ daher, der die Zusammenarbeit zwischen den Render-ALUs, den RT-Einheiten und den Tensor-Kernen verbessern soll, wenn diese gleichzeitig arbeiten. Da der AI Management Processor Einheiten priorisieren kann, soll zum Beispiel das Frame Pacing bei Frame Generation besser sein als ohne.
Display-Anschlüsse und Video En-/Decoding
DisplayPort 2.1 und HDMI 2.1
Alle GeForce-RTX-5000-Grafikkarten kommen mit einer neuen Display-Engine daher, die DisplayPort 2.1 mit einer Datenrate von UHBR20 und damit 80 Gbps unterstützt. Bei HDMI bleibt es beim 2.1-Standard.
Blackwells Display Engine kommt zudem mit dem so genannten „Flip Metering“ zurecht, was bei DLSS Multi Frame Generation wichtig ist. Mit Flip Metering bestimmt nicht mehr die CPU über das Pacing der Bildausgabe, sondern die Display Engine der Grafikkarte, wodurch gutes Frame Pacing bei DLSS MFG erst möglich sein soll.
Mehr und neuere Video-Einheiten
Blackwell kommt mit der neunten Generation an Encoder- und der sechsten Decoder-Einheit daher. Diese kann das neue Ultra-High-Quality-Preset vom AV1-Codec beschleunigen, dasselbe gilt für MV-HEVC (Multiview High Efficiency Video Coding), das für die 3D-Wiedergabe auf VR-Headsets gedacht ist. Neu hinzu gekommen mit RTX 5000 ist die Beschleunigung von Videos mit einer Farbunterabtastung von 4:2:2, Ada Lovelace konnte nur mit 4:2:0 umgehen.
Nvidia will nicht nur die Qualität der En- und Decoder verbessert haben, darüber hinaus gibt es auch mehr davon, um die Performance weiter zu verbessern. So verfügen die größeren GeForce-RTX-4000-Karten erstmals über 2 NVENC-Einheiten zum Encodieren, manche RTX-5000-Beschleuniger haben derweil 3 NVENC-Einheiten. Es soll nicht nur die Bildqualität um 10 Prozent besser mit der neuen GPU-Architektur ausfallen (BD-BR PSNR), mit der zusätzlichen, dritten NVENC-Einheit soll die GeForce RTX 5090 ein nicht näher spezifiziertes Video in 10 Minuten encodieren, wofür die GeForce RTX 4090 16 Minuten benötigt. Darüber hinaus gibt es erstmals bei manchen RTX-5000-Grafikkarten 2 Decoder-Einheiten, die GeForce-RTX-4000-Generation beschränkt sich immer auf einen Decoder.
Weitere RTX-5000-Gaming-Benchmarks
Nvidia zeigt auch neue Gaming-Benchmarks, die eine GeForce RTX 5090 mit einer GeForce RTX 4090 vergleicht. Dabei stellt Nvidia in den meisten Szenarien erneut DLSS 4 auf RTX 5000 mit Multi Frame Generation (drei Zwischenbilder) und auf RTX 4000 mit Frame Generation (ein Zwischenbild) gegenüber, es gibt mit Resident Evil 4 (Raytracing, aber ohne DLSS) und Horizon Forbidden West (kein Raytracing, DLSS Super Resolution, kein DLSS (M)FG) aber zwei neue Ergebnisse mit denselben relevanten Settings.
Näherungsweise lassen die beiden Benchmarks in Resident Evil 4 und Horizon Forbidden West folgende Zuwächse ableiten:
Klasse | Zuwachs Shader | Zuwachs im Benchmark | ||||
---|---|---|---|---|---|---|
RTX 5000 | RTX 4000S | RTX 4000 | RTX 5000* | RTX 4000S** | RTX 4000 | |
90er | 133 % | – | 100 % | ~ 133 % | – | 100 % |
80er | 111 % | 105 % | 100 % | ~ 115 % | 102 % | 100 % |
70er Ti | 117 % | 110 % | 100 % | ~ 120 % | 110 % | 100 % |
70er | 104 % | 122 % | 100 % | ~ 120 % | 116 % | 100 % |
* Schätzung auf Basis der von Nvidia präsentierten Benchmarks in RE 4 und Horizon FW ** Zuwachs gemäß Super-Tests von Januar 2024 (UHD, ohne RT) |
Das Abschneiden der RTX 5070 fällt dabei klar aus dem Rahmen dessen, was die anderen drei Modelle zeigen: Hier soll es deutlich mehr Leistung als Zuwachs bei den Shadern geben. Die Speicherbandbreite sollte es nicht sein, die TDP ist allerdings deutlich gestiegen. Dass die Leistung dazu fast analog steigt, erscheint zur Stunde allerdings noch nicht schlüssig.
Nvidia vergleich die neue Generation aktuell zudem immer nur mit den Ur-Versionen der GeForce-RTX-40-Serie. Auf dieser Basis sieht es so als, als würde die 5080 den kleinsten Sprung in der Rohleistung hinlegen. Werden allerdings die Super-Varianten herangezogen, wie ComputerBase das getan hat, dreht sich das Bild: Weil 4070 Super und 4070 Ti Super (deutlich) mehr Leistung brachten, die 4080 Super hingegen quasi auf der Stelle trat, legt die 5080 in diesem Vergleich am Ende sogar (knapp vor der 5070 Ti) am deutlichsten zu, während die 5070 zur 4070 Super kaum Wachstum zeigt. Unabhängig der geänderten Reihenfolge sind die Zuwächse aller neuen Grafikkarten gegenüber den Super-Varianten natürlich noch einmal kleiner.
Die neue Founders Edition – Der Double-Flow-Through-Kühler
Ein paar neue Details zum neuen Founders-Edition-Kühler auf der GeForce RTX 5090 und GeForce RTX 5080 gibt es auch. Diesen nennt Nvidia „Double Flow Through“-Design, da beide Lüfter ungebremst über die Kühllamellen durch den Kühler die Luft pusten können. Bei den großen RTX-4000-Modellen konnte dies nur der hintere Lüfter, beim vorderen war dagegen das PCB im Weg. Der Lüfter hat entsprechend nicht die Luft durch den Kühler gepustet, sondern versucht diese über die Slotblende abzugeben, in dem diese gegen das PCB gepustet worden ist.
Laut Nvidia soll das Double-Flow-Through-Design eine deutlich bessere Kühlleistung erreichen als das bisherige Design, wobei Nvidia jedoch nur das neue Dual-Slot-Design mit einem Dual-Slot-Design der RTX-4000-Generation vergleicht, nicht aber mit dem deutlich größeren und besseren 3-Slot-Design der GeForce RTX 4080 und GeForce RTX 4090.
Im reinen 2-Slot-Vergleich schneidet der Double-Flow-Through-Kühler dann deutlich besser als der Vorgänger ab, selbst 600 Watt soll dieser leiser abführen können als 400 Watt mit dem alten Kühler und zugleich kaum lauter sein als der alte Kühler mit 300 Watt – was schon ein riesiger Unterschied ist. Mit 400 Watt soll der neue Kühler auch entsprechend leicht leiser als das alte Derivat mit nur 200 Watt sein.
Nvidia GeForce RTX 5000: Mehr Details, Preise und Release
ComputerBase berichtet umfangreich über die neuen GeForce-RTX-5000-Grafikkarten in Form der GeForce RTX 5090, GeForce RTX 5080, GeForce RTX 5070 Ti und GeForce RTX 5070 und wird dies in den kommenden Wochen auch weiter tun inklusive groß angelegter Tests zu jedem einzelnen Blackwell-Modell.
Gerüchten zufolge fällt das Embargo auf Tests der RTX 5090 am 24. Januar, auf Tests der RTX 5080 am 29. (Karten zum Einstiegs-UPV) respektive 30. Januar (teurere Modelle). Marktstart beider Serien ist der 30. Januar.
Klasse | UVP in USD (vor Steuern) | UVP in Euro (inkl. MwSt.) | ||
---|---|---|---|---|
RTX 5000 „Blackwell“ |
RTX 4000 (Super) „Ada Lovelace“ |
RTX 5000 „Blackwell“ |
RTX 4000 (Super) „Ada Lovelace“ |
|
90er | 1.999 USD | 1.599 (-) USD | 2.329 Euro | 1.949 (-) Euro |
80er | 999 USD | 1.199 (999) USD | 1.169 Euro | 1.469 (1.109) Euro |
70er Ti | 749 USD | 799 (799) USD | 879 Euro | 899 (899) Euro |
70er | 549 USD | 599 (599) USD | 649 Euro | 659 (659) Euro |
Angaben in Klammern für die Super-Varianten |
Erste Analysen zu den neuen Details zur Technik hinter GeForce RTX 50 und eine Einordnung der Herstellerbenchmarks stellen Jan und Fabian in der aktuellen Folge des ComputerBase-Podcasts CB-Funk an:
CB-Funk lässt sich nicht nur über den in diesen Artikel eingebetteten Podigee-Player abspielen, sondern auch bequem direkt in den Podcast-Apps eurer Wahl abonnieren und hören. Verfügbar ist der ComputerBase-Podcast auf Spotify, Apple Podcasts, Amazon Music und ebenso auf Deezer.
Nachfolgend eine Übersicht über alle bisherigen RTX-5000-Meldungen und im Anschluss noch einmal die technischen Eckdaten im Detail.
- Preise, Specs, DLSS 4: Nvidia GeForce RTX 5090, 5080, 5070 Ti und 5070 im Detail
- Nvidia DLSS 4 im Detail: Multi Frame Generation und ein neues neuronales Netzwerk
- Nvidia DLSS 4: Diese 75 Spiele erhalten Multi Frame Generation
- Nvidia Reflex 2 im Detail: So senkt Frame Warp die Latenz in allen Szenarien
- GeForce RTX 5090, 5080, 5070 (Ti): Custom-Designs von Asus über MSI bis Zotac im Überblick
- Nvidia RTX 5000 vs. RTX 4000: Die technischen Daten der Grafikkarten im Vergleich
- GeForce RTX 5000 Laptop GPU: RTX 5090, 5080 & 5070 Ti im Notebook mit 24, 16 & 12 GB
Modell | GeForce RTX 5090 | GeForce RTX 5080 | GeForce RTX 5070 Ti | GeForce RTX 5070 |
---|---|---|---|---|
Architektur | Blackwell | |||
GPU | GB202 | GB203 | GB205 | |
CUs aktiv (Chip*) | 170 (192) | 84 (84) | 70 (84) | 48 (50) |
aktive Shader | 21.760 | 10.752 | 8.960 | 6.144 |
Taktraten Boost/Basis | 2.410/2.010 | 2.620/2.300 | 2.450/2.300 | 2.510/2.160 |
Speicher | 32 GB GDDR7 | 16 GB GDDR7 | 12 GB GDDR7 | |
Speicher-Interface | 512 Bit | 256 Bit | 192 Bit | |
Speicherdurchsatz | 28 Gbps | 30 Gbps | 28 Gbps | 28 Gbps |
Bandbreite | 1.792 GB/s | 960 GB/s | 896 GB/s | 672 GB/s |
PCI Express | 5.0 x16 | |||
TDP | 575 W | 360 W | 300 W | 250 W |
Founders Edition | Ja | Nein | Ja | |
2 Slot (304 mm) | – | 2 Slot (242mm) | ||
Stromanschluss (mind.) | 1x 12V-2x6 (600 Watt) | 1x 12V-2x6 (min. 450 Watt) | 1x 12V-2x6 (min. 300 Watt) | |
I/O | 3× DisplayPort 2.1b 1× HDMI 2.1 |
? | 3× DisplayPort 2.1b 1× HDMI 2.1 |
|
DLSS | DLSS 4 | |||
AI TOPS | 3.352 | 1.801 | 1.406 | 988 |
Markteinführung | 30. Januar 2025 | Februar | ||
UVP (ink. MwSt.) | 2.329 Euro | 1.169 Euro | 879 Euro | 649 Euro |
* unbestätigt |
ComputerBase hat Informationen zu diesem Artikel von Nvidia unter NDA erhalten. Eine Einflussnahme des Herstellers auf die oder eine Verpflichtung zur Berichterstattung bestand nicht. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.
Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.