Das einige sich vorstellen das ein chip in einer generation mal eben komplett Redesignt werden kann irrt
Nvidia chips sind auf maximalen profit mit maximale Performance design und ein chipdesign braucht seine 2-3 Jahre von Planung bis Produktion.
Derzeit in Planung gx100 für gpu ab 2026 die in n2p node kommen unklar wofür, n2x würde als release eher zutreffen da kostengünstiger für Konsumenten gpu's
nvidia hat zwei Wege um neue Generationen zu gehen
rtx50 wird definitiv n4x mit nen quasi ada refresh da aber mehr als nur gpc Anpassung und rt core Verbesserung sein wird tippe ich auf nen Wechsel auf gddd7 die dann mit 16-24gbit chips bestückt werden
Das bedeutet man kann das Si kürzen und somit effektiv chipfläche einsparen insbesondere in low end gpu sinnvoll darunter leidet aber die Bandbreite
Diese gen steht so gut wie sicher was danach kommt (rtx60) ist noch offen
Der eine Weg wäre dem hopper design nachzugehen und die chipfläche zu vergrößern aber auf gaa mit n2x zu warten (halbierte chipfläche) was dann spätestens den Takt bei 3,1-3,2ghz ermöglicht.
Der andere Weg wäre das ada design der sm zu behalten und lediglich die chipfläche weiter zu verkleinern und stumpf den Takt anheben was dann bis zu 4,0ghz gehen kann.
Amd indes bei 4,5ghz sofern kein anderes design kommt.
aus marketing Sicht wäre da 4,0ghz attraktiver würde aber eine stagnation bedeuten da die rt core zu wenig alu haben und an der rt menge gesteigert werden müsste was größere chips bedeutet
Rt cores Skalieren die Leistung nicht per Takt. Sondern per Anzahl und ipc.
Ein ad106er chip hat aktuell physisch 48sm =48rt core aktiv davon nur 34rt (9sm per gpc), 36rt sind der voll Ausbau
Die nächste gen gb206 wird nur 32 rt haben dafür steigt die Leistung der bvh strahlen und soll vermutlich per ai die Leistung verbessern.
man geht sofort in denoising bevor überhaupt das dxr greift
Vorteil die dxr perf könnte sich um nen Drittel steigern per rt core
Nachteil das denoising wird nicht fehlerfrei sein
Wie ich darauf komme nun dlss3,5 was erstmalig dem ray reconstruction vorgestellt oder anders denoising bevor die tensor cores überhaupt was denoisen.
Das ist die software basis für die nächste gpu gen die das in hardware forcieren wird darum die etwa 33% perf Zuwachs
Das bedingt aber zwingend als standard bei dxr dlss3,5 und höher.
Der Ursprungs Gedanke ist was den bei ampere vs ada sich an dxr perf verbessert hat
gehe ich nach rt core und Takt wird schnell klar das ampere (rtx30) bessere rt core Leistung hat als ada (rtx40) was nicht sein kann.
Demzufolge skalieren die rt core nicht mit dem Takt.
bleibt der weg nur über software um dann mehr rt cores für ne kleine sku zu vermeiden.
rtx3060 hat physisch 48rt core aktiv nur 28 auch weil samsung node sehr schlecht ist das mehr als 30sm nicht aktiv sein konnten. Demzufolge pro gpc nur noch 7sm aktiv von 12sm
rtx4060ti ada hat auch 48rt cores aber nur 34 aktiv das aber gewollt, da die chipdichte bei mehr aktiven cores den Takt massiv gesenkt hätte. Womit pro gpc 9sm aktiv sind von 12sm
rtx5060ti gb206 blackwell wird nur 32rt cores haben aber auch 30 aktiv 15sm per gpc von 16sm
so würde das bedeuten das die rtx5060ti genauso schnell wäre in dxr wie die rtx4060ti mit den paar kleinen Anpassungen vom rt core ohne dem hardware beschleunigten ai chip code.
Wie am ende die marketing Abteilung agiert bei den Sku Planungen ist noch unklar da vieles von amd Reaktion mit rdna4 abhängt
Ob die arch gefixt wird und ob amd die möglichen 3,2 bis 3,55ghz erreicht was denkbar ist.
Die rtx50 Serie ist fixed und wird auch früher kommen als viele denken sogar komplett innerhalb von 2 Monaten.
Das wann ist noch offen ich gehe von Ende q3 2024 aus gamescom und ab okt 2024 mit den high end Modellen.
amd wird dieses mal keine high end gpu Mitte 2024 präsentieren das maxed wird ab q2 2024 die rx8600 und rx8700 gen ähnlich wie 2019 mit rdna
Wohl wissend das dies nicht günstig wird
rx8600 350$ 12gb 14,8tf (entspricht der rtx3070)
rx8600xt 400$ 12gb 17tf (entspricht der rx6800)
rx8700 550$ 18gb 28tf (entspricht der rtx3090ti)
rx8700xt 600$ 18gb 30tf (entspricht der rx7900gre)
Nvidia wird darauf reagieren mit gb206 2gpc (32sm) und gb205 4gpc (64sm)
mit rtx5060ti 30sm ~16tf 12gb 400$
und mit rtx5070 60sm 32tf 18gb 650$
Ein neues halo Produkt sehe ich auch als Titan kommen unklar ob gb203 oder nur ad102 142sm es wird.
Die alternative wäre die preise zu senken der rtx4060ti 16gb auf 349$ und rtx4070 auf 449$ oder nen refresh der rtx4060ti mit 36sm und 22gbps gddr6x ab 400$ und rtx4070 mit gddr6 18gbps statt gddr6x 21gbps
letztere geisterte schon in Gerüchten rum für 499$
Ich bin mit der aktuellen Lage gar nicht zufrieden die rtx4060ti einzige option derzeit, hat die zu wenig Bandbreite. Weswegen die um 25% eingebremst wird
Die rtx4070 ist zu teuer
Die rx7700xt verbraucht zu viel Strom und in dxr was mir wichtig ist, ist sie zu langsam
Meine rtx3060 geht langsam die puste aus. Zwar ist pathtraycing nicht Bedingung das es läuft sollte aber min bei 30fps sein. Auch wenn mit dlss q 1080p
Derzeit rtx3060
24 fps( tw3 dxr update) 13fps (cp2077 path) und 9fps (alan wake 2 nativ dlaa)
Mit dlss perf in 2 spielen nutzbar das letzte keine chance
Darum wäre ne rtx5060 26sm denkbar ideal wäre aber die rtx5060ti mit 30sm die ziemlich sicher ist das diese so kommt.
Specs schätze ich auf 96bit Si gddr7 32gbps 16gbit und 12gb 30sm aktiv 3,1ghz 32 rop
ergibt maximal +76% vs rtx3060 mit + 6% Bandbreite und gleiche giga pixel etwa 99gpixel wie die rtx3060
Rein logisch wäre ansonsten die neue Aufteilung gb207 gb206 gb205 was in 1 gpc 2 gpc und 4 gpc ansonsten kein Sinn ergeben würde.
Bisher war das 07 2gpc, 06 4gpc, 04 6gpc, 03 8gpc, 02 12 gpc und das seit 2020 mit ga107- ga102 an