Chismon schrieb:
Die in Aussicht gestellte Leistungsverdoppelung und neu strukturierte Architektur bei nVidias RTX 5000er dGPUs, laesst - auch wenn die Karten wohl erst gegen Ende 2024 erscheinen duerften - aktuelle, sehr teure Ada Lovelace dGPUs als nur noch eingeschraenkt lohnend erscheinen.
Die Leistungsverdopplung kommt fast sicher nur in Raytracing / Pathtracing Scenarien mit nochmal verbessertem DLSS.
Was TSMC zum Node sagt, von Wikipedia:
TSMC has stated that its 3 nm FinFET chips will reduce power consumption by 25-30% at the same speed, increase speed by 10-15% at the same amount of power and increase transistor density by about 33% compared to its previous 5 nm FinFET chips.
Das ist nicht nahezu genug um in Rasterization die Performance zu verdoppeln.
Bei einer Ziel-Geschwindigkeit von 3GHz wäre das 20% Mehrleistung dadurch (gegenüber dem aktuellen offiziellen Boost bei 2,5GHz) - und das wäre auch mit durch höhere Leistungsaufnahme erkauft, dann sind wir bei >500W TDP.
Durch eine um 33% höhere Transistordichte können wir vielleicht 33% mehr ALUs erwarten - vielleicht 50%, falls sich nvidia nochmal zu einem >700mm² Monster Die entscheidet. Völlig abstrus ist das nicht, zuletzt hatten wir 754mm² bei der RTX 2080. Die 3000er und 4000er Chips waren beide 'nur' knapp über 600mm².
Aber bestenfalls haben wir 20% mehr Takt und 50% mehr ALUs. Theoretisch also die 1,8-fache Rechenleistung - bei Faktor 2 sind wir da nicht.
Dazu kommt, dass insbesondere mehr ALUs alles andere als perfekt skalieren.
Beispiel zur Skalierung:
Die RTX 4090 hat 16384 ALUs, die 4070Ti hat 7680 - also Faktor 2,13. Im Durchschnitts-Takt bei 4K ist die 4070 Ti nur 50MHz über der 4090, das sind rund 2% Unterschied. Auch Taktbereinigt ist die rohe Rechenleistung der 4090 mehr als doppelt so hoch wie die der 4070 Ti.
Ich lade dich ein, mir einen Test zu suchen, in dem die 4090 eine mehr als 80% höhere Rasterizer-Performance zeigen kann gegenüber der 4070 Ti.
Rechnerisch: 1,5 [mehr ALUs] * (1,8/2,13) [Tatsächliche höhere Performance vs höhere Rechenleistung, best-case] = 1,27 [Performance-Gewinn durch mehr ALUs bei riesigem >700mm² Die]
1,27 * 1,2 [Takt-Plus] = 1,55 [Zu erwartende maximale mehr-Performance im Rasterizer]
Soll heißen: Wenn die RTX 5090 auch nur 60% Performance-Gewinn gegenüber der RTX 4090 schafft, staun ich einen Brocken. Ich rechne eher mit 50% besserer Rasterizer-Performance... bei 600W TDP.
Im Vergleich: Die 4090 schafft ggü der 3090 vielleicht 75% mehr Performance bei 52% mehr ALUs und 40~45% höherem Takt weil nvidia beim Sprung von Samsung 8nm auf TSMC 4nm die Taktschraube enorm hochdrehen konnte. Das wird bei 4nm auf 3nm nicht möglich sein.
Mach dich also mal mental darauf bereit, dass die RTX 5090 dich enttäuschen wird...