Nvidia Blackwell: RTX 5000 mit bis zu 512 Bit zwischen Fantasie und Wirklichkeit
Der für die von ihm verbreiteten Nvidia-Gaming-GPU-Gerüchte bekannte X-Nutzer kopite7kimi sieht bisher keine Hinweise darauf, dass Nvidia die Blackwell-GPUs der RTX-5000-Generation mit einem breiteren Speicherinterface als den aktuellen 384 Bit der AD102-GPU ausstatten wird. Auch darunter soll es „nicht sehr anders“ zugehen.
Aktuell keine Hinweise auf 512 Bit
Die Fantasie eines bis zu 512 Bit breiten Interfaces sei ihm zwar noch nicht genommen worden, doch nach aktuellem Kenntnisstand wird es mit der nächsten Generation GeForce RTX bei maximal 384 Bit bleiben.
320 Bit: Bei RTX 4000 nicht genutzt
Dass es darunter „nicht sehr anders“ zugehen wird, lässt für die kleineren GPUs zwar Spielraum für Abweichungen vom aktuellen Schema, was 256 Bit für AD103, 192 Bit für AD104 und 128 Bit für AD106 sowie AD107 bedeutet, handfeste Details liefern kann kopite7kimi aber noch nicht – kein Wunder, dürfte Nvidia selbst doch noch keine finale Entscheidung zur konkreten Konfiguration der GPUs, die wiederum feststehen sollten, getroffen haben. Prominent von Nvidia genutzt wurde in der RTX-3000-Generation beispielsweise auch 320 Bit im Falle der GeForce RTX 3080.
Käme für RTX 5000 weiterhin GDDR6(X) zum Einsatz, würden unveränderte Speicherinterfaces bedeuten, dass auch die Speicherkapazitäten nicht angepasst werden könnten – denn ein oder zwei (per „Clamp Shell“ angebundene) Speichermodule müssten weiterhin über ein 32 Bit breites Interface an die GPU angeschlossen werden und GDDR6(X)-Module sind maximal 2 GB groß. Derzeit nutzt Nvidia nur bei der GeForce RTX 4060 Ti 16 GB den Clamp-Shell-Ansatz, der sofort zu einer Verdopplung der Speicherkapazität führt, von der portfolioweit jedoch nicht auszugehen ist.
Mit GDDR7 sind ab 2025 trotzdem höhere Kapazitäten drin
Beim kürzlich verabschiedeten GDDR7, dessen Einsatz für GeForce RTX 5000 gesichert ist, sollen ab 2025 allerdings auch 3 GB große Speicherchips verfügbar sein. Damit würden sich an unverändert breiten Speicher-Interfaces um 50 Prozent höhere Kapazitäten ergeben.
RTX 4090 | RTX 4080 Super | RTX 4080 | RTX 4070 Ti Super | RTX 4070 Ti | RTX 4070 Super | RTX 4070 | RTX 4060 Ti | RTX 4060 | |
---|---|---|---|---|---|---|---|---|---|
Architektur | Ada Lovelace | ||||||||
GPU | AD102 | AD103 | AD104 | AD106 | AD107 | ||||
Fertigung | TSMC 4N | ||||||||
Transistoren | 76,3 Mrd. | 45,9 Mrd. | 35,8 Mrd. | 22,9 Mrd. | 18,9 Mrd. | ||||
Chipgröße | 609 mm² | 379 mm² | 295 mm² | 188 mm² | 159 mm² | ||||
SM | 128 | 80 | 76 | 66 | 60 | 56 | 46 | 34 | 24 |
FP32-ALUs | 16.384 | 10.240 | 9.728 | 8.448 | 7.680 | 7.168 | 5.888 | 4.352 | 3.072 |
RT-Kerne | 128, 3rd Gen | 80, 3rd Gen | 76, 3rd Gen | 66, 3rd Gen | 60, 3rd Gen | 56, 3rd Gen | 46, 3nd Gen | 34, 3nd Gen | 24, 3rd Gen |
KI-Kerne | 512, 4th Gen | 320, 4th Gen | 304, 4th Gen | 264, 4th Gen | 240, 4th Gen | 224, 4th Gen | 184, 4th Gen | 136, 4th Gen | 96, 4th Gen |
Base-Takt | 2.230 MHz | 2.295 MHz | 2.210 MHz | 2.340 MHz | 2.310 MHz | 1.980 MHz | 1.920 MHz | 2.310 MHz | 1.830 MHz |
Boost-Takt | 2.520 MHz | 2.550 MHz | 2.510 MHz | 2.610 MHz | 2.610 MHz | 2.475 MHz | 2.535 MHz | 2.460 MHz | |
FP32-Leistung | 82,6 TFLOPS | 52,2 TFLOPS | 48,8 TFLOPS | 44,1 TFLOPS | 40,1 TFLOPS | 35,5 TFLOPS | 29,1 TFLOPS | 22,1 TFLOPS | 15,1 TFLOPS |
FP16-Leistung | 82,6 TFLOPS | 52,2 TFLOPS | 48,8 TFLOPS | 44,1 TFLOPS | 40,1 TFLOPS | 35,5 TFLOPS | 29,1 TFLOPS | 22,1 TFLOPS | 15,1 TFLOPS |
FP16-Leistung über Tensor | 330 TFLOPS | 209 TFLOPS | 195 TFLOPS | 176 TFLOPS | 160 TFLOPS | 142 TFLOPS | 117 TFLOPS | 88 TFLOPS | 61 TFLOPS |
Textureinheiten | 512 | 320 | 304 | 264 | 240 | 224 | 184 | 136 | 96 |
ROPs | 176 | 112 | 96 | 80 | 64 | 48 | |||
L2-Cache | 73.728 KB | 65.536 KB | 49.152 KB | 36.864 KB | 32.768 KB | 24.576 KB | |||
Speicher | 24 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 8 GB GDDR6 | |||||
-durchsatz | 21 Gbps | 23 Gbps | 22,4 Gbps | 21 Gbps | 18 Gbps | 17 Gbps | |||
-interface | 384 Bit | 256 Bit | 192 Bit | 128 Bit | |||||
-bandbreite | 1.008 GB/s | 736 GB/s | 717 GB/s | 672 GB/s | 504 GB/s | 288 GB/s | 272 GB/s | ||
Slot-Anbindung | PCIe 4.0 ×16 | PCIe 4.0 ×8 | |||||||
Video-Engine | 2 × NVENC (8th Gen) 1 × NVDEC (5th Gen) |
1 × NVENC (8th Gen) 1 × NVDEC (5th Gen) |
|||||||
TDP | 450 Watt | 320 Watt | 285 Watt | 220 Watt | 200 Watt | 160 Watt | 115 Watt |
Vor zwei Tagen verbannte kopite7kimi Gaming-Blackwell mit 512 Bit breitem Speicherinterface ins Reich der Fantasie, nun soll diese Fantasie doch der Wirklichkeit entsprechen: Der große Chip für GeForce RTX „GB202“ soll doch über ein 512 Bit breites Speicherinterface verfügen. Zudem ist von Speicherchips mit 28 Gbit/s die Rede. Das würde eine sehr hohe Speicherbandbreite von knapp 1,8 TB/s bedeuten.
Analog der teils im Tagesrythmus widersprüchliche Mutmaßungen hervorbringenden Gerüchteküche im Vorfeld zu GeForce RTX 4000 im Jahr 2022 dürfte es auch in diesem Jahr nicht leicht sein, Gerüchte mit Substanz zum richtigen Zeitpunkt aufzugreifen. ComputerBase wird versuchen nicht jedem Informationshappen nachzujagen, aber nichtdestoweniger über die Geschehnisse in der Gerüchteküche zu berichten.