GeForce RTX 4090D: Nvidia stellt das neue China-Topmodell offiziell vor
Mit dem Inkrafttreten neuer Handelsrestriktionen der USA darf Nvidia nicht nur einige professionelle Lösungen, sondern auch die Gaming-Grafikkarte GeForce RTX 4090 seit Mitte November nicht mehr in China verkaufen. Jetzt tritt die bereits kolportierte RTX 4090D mit stärker kastrierter AD102-GPU in die Fußstapfen des Topmodells.
Eine kleinere RTX 4090 für China
Dass die offizielle Ankündigung wahrscheinlich am 28. Dezember erfolgen würde, das hatte die Gerüchteküche bereits vorhergesagt. Bislang ungeklärt war aber, inwiefern sich die GeForce RTX 4090D (D = „Dragon“) von der „klassischen“ GeForce RTX 4090 (Test), wie sie hierzulande weiter erhältlich ist und sein wird, unterscheidet. Zeitweise war im Gespräch, dass es lediglich bei der Speicherbandbreite – also der Anbindung zwischen Grafikprozessor und Grafikspeicher – und respektive oder bei den für KI-Berechnungen besonders relevanten Tensor Cores Einschnitte geben wird.
Neun Prozent weniger Kerne und ohne OC
Die jetzt von Nvidia veröffentlichten Spezifikationen zeichnen aber ein anderes Bild: Die Speicherbandbreite von 1.008 GB/s bleibt erhalten, der AD102-250 büßt aber im Vergleich zum AD102-300 insgesamt 14 Streaming-Multiprozessoren und damit 1.792 FP32-Ausführungseinheiten ein; das entspricht knapp 9 Prozent. Im Zuge dessen gehen auch 56 Tensor Cores verloren, sodass die GeForce RTX 4090D letztlich 114 SMs mit 14.592 FP32-ALUs und 456 Tensor Cores bietet. Die von Nvidia spezifizierte Leistungsaufnahme sinkt von 450 auf 425 Watt, obschon auch die GeForce RTX 4090 diesen Wert bei normaler Gaming-Last ohnehin nur sehr selten auszuschöpfen weiß.
RTX 4090 | RTX 4090D*** | RTX 4080 Super* | RTX 4080** | RTX 4070 Ti Super* | RTX 4070 Ti** | RTX 4070 Super* | RTX 4070 | RTX 4060 Ti | RTX 4060 | |
---|---|---|---|---|---|---|---|---|---|---|
Architektur | Ada Lovelace | |||||||||
GPU | AD102 | AD103 | AD104 | AD106 | AD107 | |||||
Fertigung | TSMC 4N | |||||||||
Transistoren | 76,3 Mrd. | 45,9 Mrd. | 35,8 Mrd. | 22,9 Mrd. | 18,9 Mrd. | |||||
Chipgröße | 609 mm² | 379 mm² | 295 mm² | 188 mm² | 159 mm² | |||||
SM | 128 | 114 | 80 | 76 | 66 | 60 | 56 | 46 | 34 | 24 |
FP32-ALUs | 16.384 | 14.592 | 10.240 | 9.728 | 8.448 | 7.680 | 7.168 | 5.888 | 4.352 | 3.072 |
RT-Kerne | 128, 3rd Gen | 114, 3rd Gen | 80, 3rd Gen | 76, 3rd Gen | 66, 3rd Gen | 60, 3rd Gen | 56, 3rd Gen | 46, 3nd Gen | 34, 3nd Gen | 24, 3rd Gen |
Tensor-Kerne | 512, 4th Gen | 456, 4th Gen | 320, 4th Gen | 304, 4th Gen | 264, 4th Gen | 240, 4th Gen | 224, 4th Gen | 184, 4th Gen | 136, 4th Gen | 96, 4th Gen |
Base-Takt | 2.230 MHz | 2.280 MHz | ? | 2.210 MHz | ? | 2.310 MHz | ? | 1.920 MHz | 2.310 MHz | 1.830 MHz |
Boost-Takt | 2.520 MHz | 2.510 MHz | 2.610 MHz | 2.475 MHz | 2.535 MHz | 2.460 MHz | ||||
FP32-Rechenleistung | 82,6 TFLOPS | ~75 TFLOPS | 48,8 TFLOPS | 40,1 TFLOPS | 29,1 TFLOPS | 22,1 TFLOPS | 15,1 TFLOPS | |||
FP16-Rechenleistung | 82,6 TFLOPS | ~75 TFLOPS | 48,8 TFLOPS | 40,1 TFLOPS | 29,1 TFLOPS | 22,1 TFLOPS | 15,1 TFLOPS | |||
FP16 über Tensor | 330 TFLOPS | ~300 TFLOPS | 195 TFLOPS | 160 TFLOPS | 117 TFLOPS | 88,3 TFLOPS | 60,5 TFLOPS | |||
Textureinheiten | 512 | 456 | 320 | 304 | 264 | 240 | 224 | 184 | 136 | 96 |
ROPs | 176 | ? | 112 | ? | 80 | ? | 64 | 48 | ||
L2-Cache | 73.728 KB | 65.536 KB | 49.152 KB | 36.864 KB | 32.768 KB | 24.576 KB | ||||
Speicher | 24 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 8 GB GDDR6 | ||||||
Speicherdurchsatz | 21 Gbps | 22,4–24 Gbps | 22,4 Gbps | 21 –22,4 Gbps | 21 Gbps | 18 Gbps | 17 Gbps | |||
Speicherinterface | 384 Bit | 256 Bit | 192 Bit | 128 Bit | ||||||
Speicherbandbreite | 1.008 GB/s | ? | 717 GB/s | ? | 504 GB/s | 288 GB/s | 272 GB/s | |||
Slot-Anbindung | PCIe 4.0 ×16 | PCIe ×8 | ||||||||
Video-Engine | 2 × NVENC (8th Gen) 1 × NVDEC (5th Gen) |
? | 1 × NVENC (8th Gen) 1 × NVDEC (5th Gen) |
|||||||
TDP | 450 Watt | 425 Watt | 320 Watt | 285 Watt | 225 Watt | 200 Watt | 160 Watt | 115 Watt | ||
Marktstart | Okt. 2022 | Dez. 2023 | Jan. 2024 | Nov. 2022 | Jan. 2024 | Jan. 2023 | Jan. 2024 | Apr. 2023 | Mai 2023 | Juni 2023 |
UVP | 1.799 Euro | – | 999–1.199 USD | 1.329 Euro | 799–849 USD | 899 Euro | 599–649 USD | 659 Euro | 439 Euro | 329 Euro |
*Angaben nicht offiziell bestätigt **Produktion wird angeblich zeitnah eingestellt ***Modell nur für den chinesischen Markt |
Erwähnenswert ist zudem, dass Nvidia den Base-Takt zwar ein wenig anhebt, den Boost-Takt aber bei 2.520 MHz belässt – und ein Übertakten der GeForce RTX 4090D soll Gerüchten zufolge nicht möglich sein. Darauf deutet auch hin, dass Boardpartner bislang zwar schon zahlreiche Custom-Designs der „neuen“ Grafikkarte vorgestellt haben – die abseits der GPU weitestgehend denen der GeForce RTX 4090 entsprechen –, davon aber keines werkseitig übertaktet ist oder mit OC-Funktionen beworben wird. Offen bleibt derweil, ob Nvidia bei der RTX 4090D vielleicht auch den 73 MB großen L2-Cache und die ROPs beschnitten hat; davon ist aber nicht auszugehen.
Der Preis bleibt gleich, die Gaming-Leistung ähnlich
Benchmarks zur neuen Grafikkarte gibt es noch nicht. Unter Berücksichtigung der vergleichsweise schwachen Skalierung der GeForce RTX 4090 zur RTX 4080 – fast 70 Prozent mehr Kerne bringen selbst in UHD im Durchschnitt nur 33 Prozent mehr FPS – ist allerdings nicht davon auszugehen, dass 9 Prozent weniger Ausführungseinheiten voll auf die Leistung durchschlagen werden. Stattdessen ist damit zu rechnen, dass eine GeForce RTX 4090D in Spielen je nach verbauter CPU gleichwertig oder nur wenig schwächer abschneiden wird als eine „normale“ RTX 4090. Dass der Preis für chinesische Kunden laut Nvidia unverändert bleiben soll, mag daher nicht verwundern.