So nachdem ich mal mir die whitepaper genauer verglichen habe. habe ich endlich ungefähr raus was nvidia bei den architekturen geändert hat
ada ist im Grunde eine Weiterentwicklung aber primär beim takt und cache aufbau für besseres DXr leistung .
dabei ist atkt wo die gpu profitiert vs ampere
In einen sm sind 64 fp32 2fp64 32int32 und diese Können nativ entweder 16fp32 wenn 16 int32 rechnen oder 32fp32 die aber explizit angesprochen werden müssen. Sprich dx12 Anweisung am treiber das maxed an zeit die in fp32 draus erreicht werden kann sind 36% .
Das ist seit turing 2018 so
Daraus folgt folgende Formel für ne rtx4070 46*82*2*2,8=21,3tf bis maximal 21,3+ 16/100*36*82*2,8=21,9tf
das entspricht einer rtx3080 12gb
Diese hat 70*82*2*1,88=21,5 bis 22,4tf vs einer rtx3070 die bei etwa 14,1 bis 14,7tf liegt sind das maxed 48-51%
Der abstand stimmt sofern der preis nicht die 499$ übertrifft
Das problem was ich sehe ist aber der verbrauch 250w sind zu viel
eher sehe ich hier 200w als maxed an außer man puscht das auf 3,0ghz dann sehe ich sogar die rtx3080 ti in Bedrängnis.
Aber zu welchen preis.
Meine Wunschkonfig wären eher 2,3ghz und 46sm mit maxed 170w was machbar wäre.
Da sehe ich leider aber die rtx4060 mitn ad106 und ebenfalls mit 2,8-3,0ghz Takt die etwa 180w zieht bei nur 8gb vram
Das wird zum problem werden selbst in FHD da sind die 8gb echt knapp mit dxr.
So wie es aussieht ist mein Fazit vor 6 Monaten mittlerweile bestätigt ada wird nix und blackwell wirds richten für mich.
Diese reise wäre deutlicher geworden wenn ich manch stellen im whitepaper gelesen hätte. Der text ist was verwirrend geschrieben.
Da ada whitepaper keine Erwähnung der sm Leistung in raster aufweisen man geht sofort auf dxr los.
nehme ich an das ada quasi alles übernommen hat was turing und ampere hatten.
tuirng = 1 sm 64 fp32 +36% von 32 int32 in fp32
ampere 1 sm 80 fp32 +36% von 16 int32 in fp32
ada identisch bei mehr Takt.
Die fp64 können von haus aus 2 fp32 aber das ist unklar ich nehme das mal an die differenzen sind aber gering.
Mit dieser Logik passen meine Ergebnisse in meine test vs pascal wie auf Eimer.
pascal hat glücklicherweise nur 128 fp32 pro sm und somit klar die Architektur mit einer 1-1 Formel.
das ist vergleichsweise genau wie die Ur tesla Architektur von 2006 mit dem g80 chip
Daher sind folgende abstände
ich nehme als vergleich die echte Einstiegbereich 60er klasse
beginn gtx1060
gtx1060 ~4,91tf das weiß ich genau
rtx2060 6gb 6,95tf also +41%
rtx3060 12gb 9,27tf +88% oder +33% vs rtx2060
rtx4060 8gb ~13,1tf oder +168% oder +42% vs rtx3060
Das upgrade lohnt sich in meine Augen nicht min wäre die rtx4070 angebracht aber das hängt jetzt primär vom angepeilten verbrauch und Preis ab.
Blackwell wird nochmal an Takt sowie sm Aufbau nochmal gleich bleiben
Mein verdacht wäre das blackwell die letzte arch wird mit monolithen
Und wir erstmal eine sm Steigerung bei 60er klasse bekommen auf maxed 36sm da blackwell 18sm pro gpc wird bisher sind es 12sm pro gpc
also von vermutlich 3,0ghz und 36sm dann maxed 18,2tf bei 180w in 3nm
Der chip wird etwa 100mm² sein der waferpreis soll etwa 22k$ sein das passt so gut zusammen.
ada wird sich lohnen für mich aber nur dann wenn ich auf den verbrauch absehe.
Das man nur auf 46sm statt den möglichen 52-56sm geht bedauere ich.
Das einzige was nvidia zu mehr sm aktiv leiten würde wäre amd rx7600xt bei 3,0ghz und 3072 alu aktiv=18,4tf und nur 349$.
Wenn das kommt wars das mit 46sm und 2,8-3,0ghz =22,3tf 499$.
Der Vollausbau n33 mit 4096 und 3,0ghz wäre bei 24,7tf und entsprechend gleich wie rx6900xt für 499$ dagegen kommt die rtx4070 nicht an.
Da müssen mehr sm aktiv sein darum sehe ich da eher 52 oder 56sm aktiv dann passt auch der verbrauch wieder.
Je weniger sm aktiv desto geringer der verbrauch etwa 10% bei 50% weniger sm aktiv
aus vermuteten maxed verbrauch von 225w nur noch 198w
Darum machen die 285w und 250w tbp kaum bis keinen Sinn bzw es ist das OC maxed.
Was dann etwa +26% entspräche.
Preise können sich aber über Nacht ändern. Die Sku allerdings sind weit vorher geplant worden
Was ich weiß ist 46sm 52sm und 60sm diese sku gibt es.
Offen ist nur welchen Namen diese bekommen und zum welchen preis. Wie öfters angemerkt es liegt aktuell an amd.
Der großabgriff geht ab der ces bei laptops mit n33 und desktop n33 los
amd sieht die Rezession und hat klar gemacht mit der rx7900 series das der Preiskampf kommt. Das war für mich unerwartet Aber willkommen
ideal für mich wäre n33 7600xt 349$ 8gb 18,4tf und rx7700xt 24,5tf 8gb 499$ ideal
Gut möglich das amd sogar auf 16gb gehen könnte.
Was anhand des gddr6 18gbs chip möglich ist (derzeit 6$ pro 16gbit chip) das zwingt nvidia ad104 in die rtx4060 zu setzen und den Takt auf 2,3ghz zu beschränken ~17-17,8tf 399$.
Darum machen 52sm bei 3ghz und eine Preisdeckel bei 499$ sinn ~26tf
Das entspräche einer rtx3090 und wäre ein würdiger Nachfolger der rtx3070 als rtx4070
Sku sind ein wenig flexibel lediglich der verbrauch macht mir sorgen.
Die knapp 170w meiner rtx3060 sind schon suboptimal.
ich hab mal meine vcore bei maxed load geprüft das waren 1,1v ada macht bei 1,1v etwa 2,8ghz-3,0ghz
Demzufolge bei nur 2,3ghz maxed 1,07v 130-160w
Das wäre ideal