In den letzten tagen häufen sich die Gerüchte und einer ist schon aufgefallen das es gelogen ist.
Das letzte was ich las waren die 20192 tse point durchaus denkbar sind
Aber 3ghz ist simple gesagt Unsinn.
ich selber hab sogar ne Seite gefunden wo die rtx4090 4080ti rtx4080 4070 in etwa 30 spielen getestet wurden.
Auffallend ist aber das die Seite ihre benches immer dann aktualisiert wenn neue nvidia gen kommt.
Zuvor war die Seite bei Spielen nur bis 2020 drin jetzt 6 neue bis 2022
Man siehe
https://www.gpucheck.com/games
https://www.gpucheck.com/game/forza-horizon-5
Die werte sind glaubhaft.
Im schnitt bei etwa +50% was den Schluss naheliegt das die Annahmen von +90% völliger Blödsinn ist.
Derweil könnet es so sein das die rtx4090 den ad103 cut bei 86sm ist
Aber am ende zählt nur eins was schafft amd.
Den daran wird sich high end messen müssen wenn nvidia meint das amd mit dem mcm nur 60% gpu load pro wgp hinbekommt was dann bei 48wgp=12288 alu dann nur noch 3,0ghz=44tf wäre
Aber weil eben die vermuteten 42tf bis 61tf könnte es so sein das selbst in 4k ein cpu limit herrscht.
Was denkbar wäre.
Aber ich denke nicht das amd mcm Ansatz soviel von den alu Auslastung einbüßt wegen dem 2,5d Fertigung und der latenz die zwangsläufig zwischen mcd und chip herrscht. Daher nehme ich eher an das amd bei etwa 75% auslasten kann.
Wenn blöd läuft sind es nur 50%
nvidai springt nur so hoch wie amd an Konkurrenz ist und will dies überbieten.
Man sehe sich hopper an was echte fp32 werte hat 128fp32 auf 1,8ghz bei 128sm =reale 58tf
Diese arch wird der ada gen ähneln
Glaubhaft wäre 128alu fp32, keine fp64, 64 int32, rt core, 4 tensor core und SFU übernimmt die fp64 arbeiten
Das wäre das optimum. =86tf bei 2,6ghz
Nachteil dessen wäre aber fp32 zu fp64 1-64
Damit lassen sich keine Quadros bauen
Daher gehe ich von 96fp32 + 32fp64 aus wo die fp64 deaktiviert sind bei geforce und höher Takten und die sfu übernimmt die fp64 Arbeit. Dann hätte ne quadro 2,0ghz 66tf fp32 und 18,0tf an fp64
Solche Anpassungen bei nen chip kann man machen.
Ampere war schon von der yield her so schlecht das man die fp64 aktiv gelassen hat darum der umstand von 64+24 alu die fp32 rechnen.
Die mär vom int32 und fp32 hybriden ist geplatzt. Den dafür muss das in software angesteuert werden.
Und genau das ist gescheitert bei der turing gen. Weswegen auch eine rtx2080 so schnell ist wie ne gtx1080ti
Das würde ich gerne beweisen aber mangels gpu's
Ich sehe es so wenn ada überraschenderweise eine vernünftige sku hat bspw rtx4060 46sm 10-12gb vram 420€ bei 170w tbp.
Werde ich vergleiche machen zwischen,
ada ad104 /rtx4060/ti maxed bezahle ich 480€ wenn die 150-170w tbp erreicht werden was machbar ist mit 52-48sm.
ampere ga106 /rtx3060 12288mb derzeit genutzt.
Turing gtx1650 laptop oder mx450 sind identische chips einmal 1024alu oder 869alu. ~1,2-1,6ghz laptop abhängig. Den kaufe ich noch.
pascal gp106 /gtx1060 6192mb
kepler gk104 /gtx760 aktuell verliehen 2048mb
fermi gf104 /gtx460 1024mb
tesla (nur retro kram) 9800gtx+ und ja die läuft noch. 512mb
Auflösung 1080p
maxed settings (außer vram reicht nicht aus. Konsequenz Texturen herabsetzen)
Msaa und co schalte ich aus optischen gründen aus. auch Bewegungsunschärfe
ich mags scharf auch wenn ecken zu sehen sind
Den gp110 wird schwer da kaum noch ganze gtx1080ti geben wird. Wegen mining
Aktuell sieht es eher so aus das der vergleich rtx3060 gtx1650/mx450 gtx1060 wird.
Später dazu rtx4060/ti mit 46-52sm und hoffentlich 2,3ghz was der sweetspot ist für ada.
Das aber hängt von amd n33 chip ab und wie amd diese preislich gestalten wird.
Achja am 20.9.22 sehe wir ne titan und Quadro die rtx4090 wird kommen aber vermutlich als teaser.
ich wäre überrascht wenn nvidia wirklich rtx4090 und 4080ti vorstellen würde.
Aber sämtliche leaks sind murks die preise können nicht stimmen oder sie beziehe sich auf die titan
Daher sehe ich die preise als Platzhalter.