syfsyn
Admiral
- Registriert
- Nov. 2010
- Beiträge
- 8.209
Sinn und Unsinn von high end gpu
Sinn nun es zeigt was man erreichen kann
Unsinn der enorme strombedarf ist nicht Akzeptabel.
meine ideale gpu für 2023 2024 sofern machbar ansonsten 2025
Nvidia
rtx40/5060
46sm zu je 12 oder 18 shader 88 operationen pro sm (das geht aus dem whitepaper von ga102 hervor 64fp32 und 24fp64) etwa 2,2ghz und 12gb vram mit maximal 130w tbp
In 4nm theoretisch umsetzbar praktisch nein da nvidia hier auf 2,4ghz prügeln wird.
das wären reale 17,8tf oder 19,0tf
Dies wäre vs meiner rtx3060 +110%
Aber daraus wird nix Eher ist die rtx4060 36sm und bei etwa 170w mit maximal 15,0tf also +66%
Und leider nur 8gb vram
Daher wird es die rtx4060ti nachfolger werden die kommende wird etwa 225w fressen
backwell nächste gen dann etwa 48-60sm bei 2,2ghz und 150w was realistisch ist.
Das bedingt aber 3nm ansonsten wird das nix.
dabei sind 48*88*2*2,2 =18,5tf bis 23,2tf
betonung liegt hier bei auf 151w bis 185w
bei doppelter leistung gb106 vs ampere ga106
Insgsmat verkleinert nvidia die chips ans maximum bis zu 50% dafür gibt man die effizienz auf von möglichen 30% bleiben nur noch 10% daher zweifle ich daran das man mehr las 2,0ghz erreicht
Das erklärt auch den absurden verbrauch des ad102
Bliebe die frage welchen Sn es hat mehr leistung anhand von meh strombedarf zu erreichen.
Den eins ist sicher aktuelle cpu werden kaum 40tf und mehr stemmen können. in 4k wohlgemerkt
Mit dxr vielleicht aber ohne?
Ob intels refresh raptor lake schon die ipc Steigerung erreicht um das auszulasten bin gespannt
amd zen4 wird sicher nahe dran kommen man geht derzeit von +30% aus.
was dann 358 cb15 wäre
Intel derweil 350 cb15 mit der Taktkeule
Aber wie man an 5800x3d sieht zählt nicht nur ipc sondern auch cache
Die cpu derweil die gpu n31 mit 12228 bei 2,6ghz 95% load erreicht in 4k 63tf
Das wäre ein Realistiche Prognose ziel sind aber 2,9-3,1ghz = 70-75tf
nvidia kann da nicht mithalten und versucht zumindest beim n32 anzukommen 8096*2*3,2=51tf
daher zweifle ich daran das amd den n31 am desktop bringen wird. Und wenn ist es halo Produkt das man als gpu ab 4000€ kaufen kann.
Es macht keinen Sinn so auf die tf zu hauen und dabei 450-600w zu verbraten
Annahme 600w tbp ad102 = 144sm 0,9 vrm -24w 48sm=dann 172w+ 12w=184w*1,15 wegen Takt /0,9 =235w fürn ad104 als rtx4060 ti
das mal 0,8 bei 3nm =188w als rtx4060ti mit 16,7-18,5tf +85% vs meiner gpu
das wäre derselbe sprung wie von der gtx1060 zur rtx3060
Dann lieber den chip mit 2 gpc (18sm pro gpc) mit 36sm und dann 2,4ghz =140w 15,6tf vs meiner dann +67%
Ergeben dann die perfekten Nachfolger meiner gpu.
und nebenbei neues Netzteil ist auch vonnöten
Aktuell stellt sich die frage des aufrüsten nicht den die ps5 und xsx derzeit genau meine gpu spec entsprechen mit leichten Vorteilen der ps5 in direct storage und nen hauch schneller
Die xsx wird nicht den standard darstellen bei game designs bis 2024
Einzig dxr Leistung fehlt mir was aber ich will wenn neue gpu dann sparsamer etwa 140w für 20tf wären ideal.
nur hat nvidia auf dichte gesetzt anstatt Effizienz
Das kann nur eine Grund haben waferpreise wenn es blöd läuft erreicht trotz 5nm nvidia nur 1,8-2,0ghz
Dabei muss gesgt werden das der node sprung diesmal nicht slo doll wird wie einst 28 auf 16nm
daher gehe ich davon aus das man 1,7-2,0ghz erreicht
Wirtschaftlich macht es kein Sinn abseits des high end so auf die Taktttube zu drücken.
bso ad106 32-36sm wobei 32 eher real sind 11,2tf-12,6tf ergo +39%
Das rechtfertig kein upgrade. Es steht und fällt mit der wärmedichte den diese scheint sehr hoch zu sein
hopper 832mm² 144smn 350w tbp (+-0% vs ga100) ad102 606mm² 144sm 600w tbp-55% vs ga102 375w tbp
resultiert in hohe wärmedichte.
Wenn man den preis eines 5nm wafer sieht weiß man warum 16500$ yield bis zu 50% bei 606mm²
Samsung 8nm 6000$ aber ne yield von nur 20% beim ga102 628mm²
Für mich macht das kein sinn so eine gpu ins system zu setzen wo alleine die gpu ein netzteil bis zu 1200w benötigt.
Die einstiges ada werden bei 180w bis 235w sein als rtx4060 und rtx4060 ti
Nen hauch Zuviel für mich
preise nun rechnen wir mal 151mm² alle kosten dann bei etwa 289€ ad106 rtx4060 etwa 12,6-13,9tf +39-+52%
Ad104 dann als rtx4060ti 389€ für 16,9-18,5tf +85%-102%
Das wäre umsetzbar aber bei 235w und meine erste wahl wnn mir der stombedarf egal wäre
Folglich warte ich auf backwell mit dann bis zu 20% effizienter und hoffentlich in mcm das wird deutlich mehr Takt ermöglichen 235*0,8=188w für dann etwa 19,4tf
Das würde auch zu den neuen pcie5 standard passen 300w möglich 375w insgesamt fürn ad104 chip
hab gerade mal hopper sm struktur gesehen wenn das zutrifft und nvidia die fp64 beibehält in einen sm sind 144shader pro sm (hopper hat 192shader pro sm) das katapultiert die leistung enorm das aber ist rein geraten wäre aber möglich
Dies wäre eine Verdoppelung der fp32 in ada +48 fp64 somit wäre nur bei 2,0ghz etwa 85tf drin
Das ändert alles ist aber eher unwahrscheinlich
und wie vermutet hat nvida die int32 reduziert von 64 auf 48 und die fp64 auf 48 erhöht
Es kann sein das paar einheiten pro sm deaktiviert sind bsp 32 fp64 statt 48
ergeben dann bei etwa 2,0ghz 69tf
Dann wäre nvidia Angabe zu 128 fp32 pro sm wieder korrekt.
Man wird sehen was am ende herauskommt.
Meine Prognose hier ist definitiv pessimistisch anhand des hopper arch erkennbar ist.
Den ada lehnt sich eher danach.
Was mir nur sauer aufstößt ist der enorme strombedarf fürn Einstiegschip ad 106 180w
da tut sich nix vs ga106 was ich schon als arg ineffektiv erachte
Wenn letzter zutrifft wäre das ja beim ad106 15,9-17,5tf möglich also dann +71-91% vs ga106
Da könnte ich schwach werden. nur erwarte ich die gpu erst q1 2023
Eher wird aber die obere Prognose zutreffen
Sinn nun es zeigt was man erreichen kann
Unsinn der enorme strombedarf ist nicht Akzeptabel.
meine ideale gpu für 2023 2024 sofern machbar ansonsten 2025
Nvidia
rtx40/5060
46sm zu je 12 oder 18 shader 88 operationen pro sm (das geht aus dem whitepaper von ga102 hervor 64fp32 und 24fp64) etwa 2,2ghz und 12gb vram mit maximal 130w tbp
In 4nm theoretisch umsetzbar praktisch nein da nvidia hier auf 2,4ghz prügeln wird.
das wären reale 17,8tf oder 19,0tf
Dies wäre vs meiner rtx3060 +110%
Aber daraus wird nix Eher ist die rtx4060 36sm und bei etwa 170w mit maximal 15,0tf also +66%
Und leider nur 8gb vram
Daher wird es die rtx4060ti nachfolger werden die kommende wird etwa 225w fressen
backwell nächste gen dann etwa 48-60sm bei 2,2ghz und 150w was realistisch ist.
Das bedingt aber 3nm ansonsten wird das nix.
dabei sind 48*88*2*2,2 =18,5tf bis 23,2tf
betonung liegt hier bei auf 151w bis 185w
bei doppelter leistung gb106 vs ampere ga106
Insgsmat verkleinert nvidia die chips ans maximum bis zu 50% dafür gibt man die effizienz auf von möglichen 30% bleiben nur noch 10% daher zweifle ich daran das man mehr las 2,0ghz erreicht
Das erklärt auch den absurden verbrauch des ad102
Bliebe die frage welchen Sn es hat mehr leistung anhand von meh strombedarf zu erreichen.
Den eins ist sicher aktuelle cpu werden kaum 40tf und mehr stemmen können. in 4k wohlgemerkt
Mit dxr vielleicht aber ohne?
Ob intels refresh raptor lake schon die ipc Steigerung erreicht um das auszulasten bin gespannt
amd zen4 wird sicher nahe dran kommen man geht derzeit von +30% aus.
was dann 358 cb15 wäre
Intel derweil 350 cb15 mit der Taktkeule
Aber wie man an 5800x3d sieht zählt nicht nur ipc sondern auch cache
Die cpu derweil die gpu n31 mit 12228 bei 2,6ghz 95% load erreicht in 4k 63tf
Das wäre ein Realistiche Prognose ziel sind aber 2,9-3,1ghz = 70-75tf
nvidia kann da nicht mithalten und versucht zumindest beim n32 anzukommen 8096*2*3,2=51tf
daher zweifle ich daran das amd den n31 am desktop bringen wird. Und wenn ist es halo Produkt das man als gpu ab 4000€ kaufen kann.
Es macht keinen Sinn so auf die tf zu hauen und dabei 450-600w zu verbraten
Annahme 600w tbp ad102 = 144sm 0,9 vrm -24w 48sm=dann 172w+ 12w=184w*1,15 wegen Takt /0,9 =235w fürn ad104 als rtx4060 ti
das mal 0,8 bei 3nm =188w als rtx4060ti mit 16,7-18,5tf +85% vs meiner gpu
das wäre derselbe sprung wie von der gtx1060 zur rtx3060
Dann lieber den chip mit 2 gpc (18sm pro gpc) mit 36sm und dann 2,4ghz =140w 15,6tf vs meiner dann +67%
Ergeben dann die perfekten Nachfolger meiner gpu.
und nebenbei neues Netzteil ist auch vonnöten
Aktuell stellt sich die frage des aufrüsten nicht den die ps5 und xsx derzeit genau meine gpu spec entsprechen mit leichten Vorteilen der ps5 in direct storage und nen hauch schneller
Die xsx wird nicht den standard darstellen bei game designs bis 2024
Einzig dxr Leistung fehlt mir was aber ich will wenn neue gpu dann sparsamer etwa 140w für 20tf wären ideal.
nur hat nvidia auf dichte gesetzt anstatt Effizienz
Das kann nur eine Grund haben waferpreise wenn es blöd läuft erreicht trotz 5nm nvidia nur 1,8-2,0ghz
Dabei muss gesgt werden das der node sprung diesmal nicht slo doll wird wie einst 28 auf 16nm
daher gehe ich davon aus das man 1,7-2,0ghz erreicht
Wirtschaftlich macht es kein Sinn abseits des high end so auf die Taktttube zu drücken.
bso ad106 32-36sm wobei 32 eher real sind 11,2tf-12,6tf ergo +39%
Das rechtfertig kein upgrade. Es steht und fällt mit der wärmedichte den diese scheint sehr hoch zu sein
hopper 832mm² 144smn 350w tbp (+-0% vs ga100) ad102 606mm² 144sm 600w tbp-55% vs ga102 375w tbp
resultiert in hohe wärmedichte.
Wenn man den preis eines 5nm wafer sieht weiß man warum 16500$ yield bis zu 50% bei 606mm²
Samsung 8nm 6000$ aber ne yield von nur 20% beim ga102 628mm²
Für mich macht das kein sinn so eine gpu ins system zu setzen wo alleine die gpu ein netzteil bis zu 1200w benötigt.
Die einstiges ada werden bei 180w bis 235w sein als rtx4060 und rtx4060 ti
Nen hauch Zuviel für mich
preise nun rechnen wir mal 151mm² alle kosten dann bei etwa 289€ ad106 rtx4060 etwa 12,6-13,9tf +39-+52%
Ad104 dann als rtx4060ti 389€ für 16,9-18,5tf +85%-102%
Das wäre umsetzbar aber bei 235w und meine erste wahl wnn mir der stombedarf egal wäre
Folglich warte ich auf backwell mit dann bis zu 20% effizienter und hoffentlich in mcm das wird deutlich mehr Takt ermöglichen 235*0,8=188w für dann etwa 19,4tf
Das würde auch zu den neuen pcie5 standard passen 300w möglich 375w insgesamt fürn ad104 chip
hab gerade mal hopper sm struktur gesehen wenn das zutrifft und nvidia die fp64 beibehält in einen sm sind 144shader pro sm (hopper hat 192shader pro sm) das katapultiert die leistung enorm das aber ist rein geraten wäre aber möglich
Dies wäre eine Verdoppelung der fp32 in ada +48 fp64 somit wäre nur bei 2,0ghz etwa 85tf drin
Das ändert alles ist aber eher unwahrscheinlich
und wie vermutet hat nvida die int32 reduziert von 64 auf 48 und die fp64 auf 48 erhöht
Es kann sein das paar einheiten pro sm deaktiviert sind bsp 32 fp64 statt 48
ergeben dann bei etwa 2,0ghz 69tf
Dann wäre nvidia Angabe zu 128 fp32 pro sm wieder korrekt.
Man wird sehen was am ende herauskommt.
Meine Prognose hier ist definitiv pessimistisch anhand des hopper arch erkennbar ist.
Den ada lehnt sich eher danach.
Was mir nur sauer aufstößt ist der enorme strombedarf fürn Einstiegschip ad 106 180w
da tut sich nix vs ga106 was ich schon als arg ineffektiv erachte
Wenn letzter zutrifft wäre das ja beim ad106 15,9-17,5tf möglich also dann +71-91% vs ga106
Da könnte ich schwach werden. nur erwarte ich die gpu erst q1 2023
Eher wird aber die obere Prognose zutreffen