GeForce RTX 4090D: Nvidia stellt das neue China-Topmodell offiziell vor

28.12.2023 21:30 Uhr

Mit dem Inkrafttreten neuer Handelsrestriktionen der USA darf Nvidia nicht nur einige professionelle Lösungen, sondern auch die Gaming-Grafikkarte GeForce RTX 4090 seit Mitte November nicht mehr in China verkaufen. Jetzt tritt die bereits kolportierte RTX 4090D mit stärker kastrierter AD102-GPU in die Fußstapfen des Topmodells.

Eine kleinere RTX 4090 für China

Dass die offizielle Ankündigung wahrscheinlich am 28. Dezember erfolgen würde, das hatte die Gerüchteküche bereits vorhergesagt. Bislang ungeklärt war aber, inwiefern sich die GeForce RTX 4090D (D = „Dragon“) von der „klassischen“ GeForce RTX 4090 (Test), wie sie hierzulande weiter erhältlich ist und sein wird, unterscheidet. Zeitweise war im Gespräch, dass es lediglich bei der Speicherbandbreite – also der Anbindung zwischen Grafikprozessor und Grafikspeicher – und respektive oder bei den für KI-Berechnungen besonders relevanten Tensor Cores Einschnitte geben wird.

Neun Prozent weniger Kerne und ohne OC

Die jetzt von Nvidia veröffentlichten Spezifikationen zeichnen aber ein anderes Bild: Die Speicherbandbreite von 1.008 GB/s bleibt erhalten, der AD102-250 büßt aber im Vergleich zum AD102-300 insgesamt 14 Streaming-Multiprozessoren und damit 1.792 FP32-Ausführungseinheiten ein; das entspricht knapp 9 Prozent. Im Zuge dessen gehen auch 56 Tensor Cores verloren, sodass die GeForce RTX 4090D letztlich 114 SMs mit 14.592 FP32-ALUs und 456 Tensor Cores bietet. Die von Nvidia spezifizierte Leistungsaufnahme sinkt von 450 auf 425 Watt, obschon auch die GeForce RTX 4090 diesen Wert bei normaler Gaming-Last ohnehin nur sehr selten auszuschöpfen weiß.

Spezifikationen und Gerüchte zu GeForce RTX 40 im Überblick

	RTX 4090	RTX 4090D***	RTX 4080 Super*	RTX 4080**	RTX 4070 Ti Super*	RTX 4070 Ti**	RTX 4070 Super*	RTX 4070	RTX 4060 Ti	RTX 4060
Architektur	Ada Lovelace
GPU	AD102		AD103			AD104			AD106	AD107
Fertigung	TSMC 4N
Transistoren	76,3 Mrd.		45,9 Mrd.			35,8 Mrd.			22,9 Mrd.	18,9 Mrd.
Chipgröße	609 mm²		379 mm²			295 mm²			188 mm²	159 mm²
SM	128	114	80	76	66	60	56	46	34	24
FP32-ALUs	16.384	14.592	10.240	9.728	8.448	7.680	7.168	5.888	4.352	3.072
RT-Kerne	128, 3rd Gen	114, 3rd Gen	80, 3rd Gen	76, 3rd Gen	66, 3rd Gen	60, 3rd Gen	56, 3rd Gen	46, 3nd Gen	34, 3nd Gen	24, 3rd Gen
Tensor-Kerne	512, 4th Gen	456, 4th Gen	320, 4th Gen	304, 4th Gen	264, 4th Gen	240, 4th Gen	224, 4th Gen	184, 4th Gen	136, 4th Gen	96, 4th Gen
Base-Takt	2.230 MHz	2.280 MHz	?	2.210 MHz	?	2.310 MHz	?	1.920 MHz	2.310 MHz	1.830 MHz
Boost-Takt	2.520 MHz			2.510 MHz		2.610 MHz		2.475 MHz	2.535 MHz	2.460 MHz
FP32-Rechenleistung	82,6 TFLOPS	~75 TFLOPS		48,8 TFLOPS		40,1 TFLOPS		29,1 TFLOPS	22,1 TFLOPS	15,1 TFLOPS
FP16-Rechenleistung	82,6 TFLOPS	~75 TFLOPS		48,8 TFLOPS		40,1 TFLOPS		29,1 TFLOPS	22,1 TFLOPS	15,1 TFLOPS
FP16 über Tensor	330 TFLOPS	~300 TFLOPS		195 TFLOPS		160 TFLOPS		117 TFLOPS	88,3 TFLOPS	60,5 TFLOPS
Textureinheiten	512	456	320	304	264	240	224	184	136	96
ROPs	176	?	112		?	80	?	64	48
L2-Cache	73.728 KB	?	65.536 KB		?	49.152 KB	?	36.864 KB	32.768 KB	24.576 KB
Speicher	24 GB GDDR6X		16 GB GDDR6X			12 GB GDDR6X			8 GB GDDR6
Speicherdurchsatz	21 Gbps		22,4–24 Gbps	22,4 Gbps	21 –22,4 Gbps	21 Gbps			18 Gbps	17 Gbps
Speicherinterface	384 Bit		256 Bit			192 Bit			128 Bit
Speicherbandbreite	1.008 GB/s		?	717 GB/s	?	504 GB/s			288 GB/s	272 GB/s
Slot-Anbindung	PCIe 4.0 ×16								PCIe ×8
Video-Engine	2 × NVENC (8th Gen) 1 × NVDEC (5th Gen)						?	1 × NVENC (8th Gen) 1 × NVDEC (5th Gen)
TDP	450 Watt	425 Watt	320 Watt		285 Watt		225 Watt	200 Watt	160 Watt	115 Watt
Marktstart	Okt. 2022	Dez. 2023	Jan. 2024	Nov. 2022	Jan. 2024	Jan. 2023	Jan. 2024	Apr. 2023	Mai 2023	Juni 2023
UVP	1.799 Euro	–	999–1.199 USD	1.329 Euro	799–849 USD	899 Euro	599–649 USD	659 Euro	439 Euro	329 Euro
*Angaben nicht offiziell bestätigt **Produktion wird angeblich zeitnah eingestellt ***Modell nur für den chinesischen Markt

Erwähnenswert ist zudem, dass Nvidia den Base-Takt zwar ein wenig anhebt, den Boost-Takt aber bei 2.520 MHz belässt – und ein Übertakten der GeForce RTX 4090D soll Gerüchten zufolge nicht möglich sein. Darauf deutet auch hin, dass Boardpartner bislang zwar schon zahlreiche Custom-Designs der „neuen“ Grafikkarte vorgestellt haben – die abseits der GPU weitestgehend denen der GeForce RTX 4090 entsprechen –, davon aber keines werkseitig übertaktet ist oder mit OC-Funktionen beworben wird. Offen bleibt derweil, ob Nvidia bei der RTX 4090D vielleicht auch den 73 MB großen L2-Cache und die ROPs beschnitten hat; davon ist aber nicht auszugehen.

Der Preis bleibt gleich, die Gaming-Leistung ähnlich

Benchmarks zur neuen Grafikkarte gibt es noch nicht. Unter Berücksichtigung der vergleichsweise schwachen Skalierung der GeForce RTX 4090 zur RTX 4080 – fast 70 Prozent mehr Kerne bringen selbst in UHD im Durchschnitt nur 33 Prozent mehr FPS – ist allerdings nicht davon auszugehen, dass 9 Prozent weniger Ausführungseinheiten voll auf die Leistung durchschlagen werden. Stattdessen ist damit zu rechnen, dass eine GeForce RTX 4090D in Spielen je nach verbauter CPU gleichwertig oder nur wenig schwächer abschneiden wird als eine „normale“ RTX 4090. Dass der Preis für chinesische Kunden laut Nvidia unverändert bleiben soll, mag daher nicht verwundern.

CB-Funk Podcast #153: Core Ultra 300, 9850X3D und Sparen mit Single-Channel-RAM mit Fabian und Jan-Frederik