News GeForce RTX 50: Nvidia veröffentlicht technisches Whitepaper für Blackwell

jube schrieb:
Niemand wird dazu gezwungen, die Karten zu kaufen
Pscht, dieses "Konzept" durchbricht aber die Jammertiraden ;-)

Und wir wissen erst seit Monaten, dass das nur 16 Gb VRAM werden. Die MIR auch zu wenig wären. Also zwingt mich Nvidia die 5090 zu kaufen, merke ich gerade. ASUS, bringt die 5090 ASTRAL ran! :D

Aber nochmal im ernst, bezüglich des Whitepapers:
The GeForce RTX 5090 ships with 28 Gbps GDDR7 memory and delivers 1.792 TB/sec peak
memory bandwidth, while the GeForce RTX 5080 ships with 30 Gbps GDDR7 memory, delivering
960 GB/sec of peak memory bandwidth.
Die 5080 hat fast den Durchsatz, den die 4090 hatte aber 16 GB Limit.

Das Thema Texturen Kompression steht erst am Anfang, Nvidia hat in den Marketingseiten folgendes:
We've integrated neural networks inside of programmable shaders to create neural shaders. RTX Neural Shaders will drive the next decade of graphics innovations. They can be used to compress textures by up to 7X, saving massive amounts of graphics memory. And be used to create cinematic-quality textures, and even more advanced lighting effects in games.

Im Whitepaper finde ich auf Seite 40:
NVIDIA has worked with Microsoft to create the new
Cooperative Vectors API.
When combined with
differentiable shading language features in
Slang, Cooperative Vectors unlock the ability for
game developers to use neural techniques in
their games including neural texture
compression, that provides up to seven-to-one
VRAM compression
over block compressed
formats, and other techniques such as RTX
Neural Materials, Neural Radiance Cache, RTX
Skin, and RTX Neural Faces


Es mag sein, dass "demnächst" das VRAM Problem bald keines mehr in der "Form" wie bisher ist.

Nach AI Frames kommt AI Ram, und ich will das (tm) darauf hier im Forum Zwinkersmiley
 
  • Gefällt mir
Reaktionen: Turbolord, axi, one2know und 3 andere
jube schrieb:
Niemand wird dazu gezwungen, die Karten zu kaufen.
Niemand kann dazu gezwungen werden, die Karten zu kaufen.

Ich habe es mal korrigiert :D
 
  • Gefällt mir
Reaktionen: SweetOhm
Che-Tah schrieb:
Hoffentlich. Ich kann mich nicht erinnern, wann es das letzte mal keinen Shrink gegegeben hat.

GTX1000 16nm
RTX2000 12nm
RTX3000 8nm (Samsung)
RTX4000 5nm
RTX5000 5nm

...aber auch möglich, dass 2026 stattdessen eine RTX5000 Titan und eine RTX5080 Super/Ti in 3nm kommen.
...oder es wird eine lange Durststrecke bis 2027 in 5nm.
Kein Druck seitens AMD mit der 9070, das wusste Nvidia möglicherweise früh und hat nur optimiert statt revolutioniert. Sollte die 9070 zu dicht kommen, drehen sie unter der 5090 schlicht den Preis runter.
 
Che-Tah schrieb:
Hoffentlich. Ich kann mich nicht erinnern, wann es das letzte mal keinen Shrink gegegeben hat.
Mit Maxwell (GTX 900) und Turing (RTX 20) ist Nvidia auch auf der Stelle getreten, einmal auf 28 nm TSMC und das andere mal auf 16/12 nm TSMC (das war kein voller Schritt). Aber denoch waren in beiden Generation "von 80 zu 80" rund 25-30 Prozent mehr Leistung drin, bei obendrein gesteigerter Effizienz. Gerade Maxwell hat da einen riesigen Schritt gemacht, und das obwohl der GM204 der GTX 980/970 sogar viel kleiner war als der GK110 der GTX 780 (Ti) (398 vs. 550 mm²). Nvidia selbst hat also durchaus schon vorgemacht, wie man bei gleicher Fertigung aus einem kleineren Chip mehr Leistung bei geringerem Verbrauch rausholen kann.
 
  • Gefällt mir
Reaktionen: Flutefox, sil79, SweetOhm und 6 andere
Laphonso schrieb:
So wie alle RTX Karten seit Turing vom DLSS4 Transformermodell profitieren und über 6 Jahre später weitere fps Boots und bessere Scaling Qualität erhalten.
Ergänzung ()
Das ist auch eher was ich unter "Fine Wine" verstehe und nicht dass Die Banane beim Kunden reift.
 
  • Gefällt mir
Reaktionen: evilhunter und Laphonso
Blackwell ist eine Karte für die Zukunft, so ähnlich es Turing damals war. Und diese bekommt sogar noch das geniale dlss4 Update.
 
  • Gefällt mir
Reaktionen: Laphonso
TheInvisible schrieb:
Blackwell ist eine Karte für die Zukunft, so ähnlich es Turing damals war.
Dass eine 2060 mit dem DLSS4 TRansformer und SR Modell nochmal bessere Bildqualität und mehr fps bekommt, hatte ich vor 6 Jahren nicht auf meiner Bingo Karte, muss ich gestehen.

Das Whitepaper mit dem Technologiefundament macht in diesem Kontext eine 5080 in meinen Augen für RTX2000 und RTX3000 Umsteiger ziemlich interessant.
Bzw generell die RTX5000er, je nach Segment, aus dem man kommt und Ada Lovelace mal außen vor gelassen.

Das DLSS Featureset bekommt mit der Blackwell Neural Rendering Architektur einen weiteren Baustein für Zukunftspotenzial.
 
  • Gefällt mir
Reaktionen: _Lukas_, one2know und evilhunter
Ich verstehe viel zu wenig von der ganzen Materie im Detail, aber Blackwell sieht für mich nach Turing 2.0 aus.

Neue Features die noch nicht perfekt sind aber in ein paar Jahren absoluter Standard sein werden. DLSS wurde damals auch in der Luft zerrissen, heute nutzt es fast jeder. MFG wird vielleicht genau so laufen.

Wäre interessant mal die Meinung von Experten wie @.Sentinel. zu hören :)
 
ElectricStream schrieb:
In 1-2 Jahren wird Blackwell obsolet sein und Rubin wird eingeführt, möglicherweise schon Ende nächsten Jahres, da Rubin auf 3nm setzt.
Ende nächsten Jahres ist rund 23 Monate entfernt...

Che-Tah schrieb:
...oder es wird eine lange Durststrecke bis 2027 in 5nm.
Ich würde auf 2027 tippen für neue Grakas.
Einziger Grund wieso es 2026 neue Grakas geben sollte wäre wenn ein neues Feature gewaltige AI performance plus bringen würde.

Blackwell ist auch keine Gaming Architektur. Alles nur auf Computer/AI optimiert.
 
  • Gefällt mir
Reaktionen: sil79 und rentex
Wenn man in das Whitepaper schaut sind die Änderungen doch etwas größer als vorerst angenommen.
Eventuell könnte es auch erst die nötige Software inkl. Mega Geometry bzw. Neural Shaders brauchen, damit die Karten auch was die RT Cores betrifft richtig ausgelastet werden. Das könnte noch spannend werden.

Blackwell’s RT Core introduces hardware-based ray intersection testing support for a new primitive called Linear Swept Spheres (LSS). A linear swept sphere is similar to a tessellated curve, but is constructed by sweeping spheres across space in linear segments. The radii of the spheres may differ between start and end point of each segment, allowing flexible approximation of various strand types. As a special case of LSS, the Blackwell hardware primitive also supports spheres directly (without a swept linear segment), which is useful for applications like particle systems. Common use cases, like the rendering of hair on humans, are about 2x faster with LSS compared to DOTS, while also requiring about 5x less VRAM to store the geometry.
ElectricStream schrieb:
Blackwell Gaming ist eine Zwischenstufe. Diese Serie setzt im Zyklus der Geforce-Grafikkarten nur eine Fußnote.
Ada und Tesla waren bisher Nvidias beste GPU-Generationen.
So gesehen war jede Generation eine Zwischenstufe. Irgendwann muss man einmal damit anfangen werden.
Wie gut Blackwell letztendlich ist bzw. war wird sich erst dann zeigen, wenn NTC, NRC, LSS, MG, OME usw. genutzt werden. Wenn ich im Whitepaper lese, dass beispielsweise die CPU Last für das BVH Management reduziert werden kann, was bei aktuellen RT Titeln durchaus ein Problem darstellt, könnte da noch einiges möglich sein.

Mit der "neural rendering Architektur" werden gleich mehrere Probleme adressiert und an Schräubchen gedreht. Ich verstehe davon nicht viel, aber ab Seite 15 ist das schon recht interessant.
Wesentlich interessanter als die 10-15% mehr Performance.

NRC arbeitet bei Raytracing "ähnlich" wie DLSS. Es wird nur initial ein kleiner Teil der Bounces berechnet und die restlichen übernimmt dann das AI Modell. So steigert man die Beleuchtungsqualität und die Performance ohne es überhaupt zu berechnen.
NRC improves performance as the GPU doesn’t have to trace the rays beyond the small initial number of bounces and Indirect Lighting quality is improved because NRC can infer a multitude of bounces on a limited ray budget.
Das ist extrem spannend. :)
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: evilhunter
Laphonso schrieb:
Es mag sein, dass "demnächst" das VRAM Problem bald keines mehr in der "Form" wie bisher ist.
Und täglich grüßt das Murmeltier.
Laphonso schrieb:
Nach AI Frames kommt AI Ram, und ich will das (tm) darauf hier im Forum Zwinkersmiley
Ah, Kurve gekriegt. Sehr gut.
 
  • Gefällt mir
Reaktionen: sil79, Slim.Shady und Laphonso
hahaqp schrieb:
Ich verstehe viel zu wenig von der ganzen Materie im Detail, aber Blackwell sieht für mich nach Turing 2.0 aus.

Neue Features die noch nicht perfekt sind aber in ein paar Jahren absoluter Standard sein werden. DLSS wurde damals auch in der Luft zerrissen, heute nutzt es fast jeder. MFG wird vielleicht genau so laufen.

Wäre interessant mal die Meinung von Experten wie @.Sentinel. zu hören :)
Ja wenn Cooperative Vector in DirectX kommt könnte es interessant werden, bis dann aber Games kommen dauert es sicher wieder. Man kann zwar die NVApi nutzen aber das funzt dann halt nur mehr auf Nvidia GPUs.

Man kauft quasi die Technik von Morgen ohne diese richtig nutzen zu können. Mit der nächsten Generation Rubin könnte das ganze schon spruchreif sein, durch bessere Fertigung wirds auch wieder mehr Grundperformance geben.
Ergänzung ()

Laphonso schrieb:
Es mag sein, dass "demnächst" das VRAM Problem bald keines mehr in der "Form" wie bisher ist.
Die Frage ob man das zweigleisig fahren kann. Also GPUs die es unterstützen nutzen NeuralTexture und die anderen "normale" TExturen.
 
  • Gefällt mir
Reaktionen: Laphonso
Letztendlich hätte Nvidia statt RTX 5000 einfach eine 4090 Ti (oder Ada Titan) und ein paar weitere Zwischenmodelle bringen sollen, dann hätte es hier vermutlich eine viel realistische Erwartungshaltung bezüglich dieser Karten gegeben und man hätte ganz gelassen noch ein Jahr überbrücken können, um RTX 5000 dann in 3 nm und als ordentliches Upgrade zu bringen.

Leider wollte man am Zeitplan offenbar nichts ändern und musste zwangsläufig nochmal auf eine 5 nm-Iteration setzen, wodurch man physikalisch kaum noch Spielraum nach oben hatte. Das war aber nun schon seit vielen Monaten bekannt, daher waren die mageren Leistungswerte doch eigentlich absehbar.

Kritisiert werden kann weiterhin die Preispolitik und die magere Speicherausstattung, wobei ich letzteres für überbewertet halte. Letztendlich sind die Karten ja trotzdem gut und auch besser als die Vorgänger-Karten, nur halt in einem Maße, von dem viele sich halt deutlich mehr erhofft haben.
 
  • Gefällt mir
Reaktionen: SweetOhm
Blackwell mit seinen sogenannten "Neuerungen" ist als Architektur so unglaublich langweilig, ich komm aus dem Gähnen nicht mehr heraus. Und auf sowas hat man über zwei Jahre lang gewartet? Naja...
 
  • Gefällt mir
Reaktionen: DeMeP, sil79 und SweetOhm
TheInvisible schrieb:
Man kauft quasi die Technik von Morgen ohne diese richtig nutzen zu können.
Das ist die letzten Jahre bereits passiert, und die größten Naysayer und Zweifler an DLSS (wie auch Igor und einige Tech Kannäle wie Vex btw) seit 2018 sind ziemlich geflashed und beeindruckt (deren Worte) vom DLSS4 SR und Transformer Modell, das jetzt für 4 RTX Generationen aktiviert wird: Bessere Qualität bei noch mehr fps auf Knopfdruck.

Wer die Blackwell GPUs kauft, sollte und wird das eh nicht wegen NTC machen oder auf die Wette, dass die 5080 eine jemals eine lupenreine 4K GPU wird.
Aber das "inklusive" mitzukaufen für future feature unlocks ist ja kein Nachteil. Zumal es da "nur" 50% einer 5090 kostet ;)
Ergänzung ()

Zer0DEV schrieb:
Der Zwang bei den Benchmarkranglisten an erster Stelle zu stehen schon!!!111!!11!
Eben! Bin schon akut gestresst!
1738181474043.png
 
Jenergy schrieb:
Blackwell mit seinen sogenannten "Neuerungen" ist als Architektur so unglaublich langweilig, ich komm aus dem Gähnen nicht mehr heraus. Und auf sowas hat man über zwei Jahre lang gewartet? Naja...
Ne langweilig ist sie nur wenn man die rohen Performancewerte ansieht.
 
  • Gefällt mir
Reaktionen: Hungerstreit
Und gut ist sie nur wenn man den fehlenden VRAM ausblendet. Durch das Featureset und andere Neuerungen wird aus der 4070 mit den 12 GB auch keine 4K Karte. Der Applaus ist irgendwie zum Fremdschämen. Ja, ich werde mir wahrscheinlich auch ne Nvidia kaufen. Ich muss mir das ganze aber trotzdem nicht schönreden.
 
  • Gefällt mir
Reaktionen: SweetOhm
INT- und FP-Berechnungen können innerhalb einer Shader-Partition nicht mehr gleichzeitig in einem Taktzyklus ausgeführt werden.

Gut, dass das hier im Artikel heraus gestellt wurde, evt. hebt sich nVidia die Wiedereinführung gleichzeitiger Berechnung bei INT und FP für RTX 6000 wieder auf und da Neuralshader wohl eher eine Weile brauchen dürften, bis diese in neuen, ausgesuchten/gesponsorten Spielen (ähnlich RT-PT, also evt. ganze 4 Spiele in 2 Jahren) mit Mehrwert zum tragen können, kann man sich das auch für dahingehend wohl stärker ausgestattete RTX 6000er Grafikkarten aufheben oder schauen, was die Konkurrenz macht in dem Bereich.

Die RTX 5000er Generation von nVidia wird man sich also leistungs-, effizienz-/abwärme- und feature-technisch gut sparen können.
Ergänzung ()

LamaMitHut schrieb:
Wenn man der 5080 24GB gegeben hätte, dann würde sie wahrscheinlich tatsächlich 6 Jahre genügen.
Die wird doch kommen als mobile RTX 5090 in neuen RTX 5000er Notebooks angeblich ab März, also kannst Du Dir schon eine besorgen, wenn Du diese für lohnend mit 24 GB hältst (in Sachen sinnvoller Architektur-Features und Leistungszuwachs bleibt die RTX 5080 aber voraussichtlich nach wie vor mau).
 
Zuletzt bearbeitet:
Sargnagel und Deckel zu
Folgen sind
legacy (dx9 ogl) 64fp32 pro sm war bei ada auch so
dx12 ft11 10 9 80fp32
dx11/10 80fp32
dx12_2 96fp32

Damit wird man flexibel bei neuen dx12 features und kann bis zu 128fp32 nutzen aber das gilt nur wenn die software das auch anspricht. Bisher gibt es keine software die das macht. hier wird in Zukunft von den neural shader Funktion viel abhängen .
ich rechen mit einen sehr mauen Unterstützung da dies explizit upscaler voraussetzen udn in game engines explizit auch unterstützt werden muss.
Das wird nix
Konsequenz abseits den Abwärtskompatibilität zu bisherige Nutzung der dx12 und dx11 Funktion reduziert sich die Auslastung von 88fp32 auf 80fp32
Darum diese kleinen Sprünge von nur +10% bei gleichen Takt und faktisch 4sm mehr
Das lässt vermuten das die rtx5070 2,5ghz und rtx5070ti 2,5ghz quasi gleich schnell werden wie die Vorgänger.
jetzt machen die preise auch Sinn

Das gute diese Amp Funktion reduziert das cpu limit das ist positiv bedingt aber zwingend hags
Ser2 verbessert die Effizienz bei dxr workloads weniger cpu limit bedingt aber ein ansprechen vom gamecode.

überrascht hat mich 16sm per gpc eine raster engine sind jetzt 16sm zuvor 24sm =2gpc
(directx skaliert nur bis 6 Rasterengines linear)
Das erklärt auch das die rtx5090 immer noch in cpu limits rennt trotz amp und ser2
man setzt voll auf Software upscaling und neural shading.
Das gute abseits amp und ser2 können das auch alle rtx gpu, hags vorausgesetzt.
Ernüchternd würde ich sagen also wird das maximal erst beim refresh auf n4 rtx60 was werden diese gen kann man getrost überspringen
Achja hags ist nicht unumstritten da es durchaus Probleme macht hier kommt es auf die reife der Treiber an je älter der code eines spiels desto anfälliger für abstürze.
Ein Grund warum ich es nicht mehr nutze das nvidia zukünftig dies voraussetzt sagt mir das ich es an abschalten muss je spiel wo es nicht stabil ist. Das nervt da jedes mal Neustarts zu machen sind.
 
Zurück
Oben