Fangen wir mal an
Amd Rdna4 soll also keinen high end chips mehr bringen was logisch unsinnig iost außer man hat keine kapazitäten in n3 das wäre bedingung für n3 oder man fixed lediglch mit n4p die simd32 einheit damit navi3 auch endlich dessen gedachten Takt erreicht n4p sol 11% perf bringen 3,2*1,11 = 3,55ghz
N3 hat +15% vs n5 aber ist +42% denser bei vermutlich 4,0ghz
Da muss n4p aber ordentlich billiger sein also um die 12000$ damit sich das rechnet
nach meinen formeln würde ein high end chip mit 120cu amd etwa 75$ kosten und das ist mit chiplets und substrat Kombination.
Ein mid class 96cu etwa 60$ und low end 40$
Die Hauptursache ist das die chips um 32% kleiner werden und der node nur 18000$ kostet
Daher macht die aussage kein Sinn nur den mid class zu beringen mit 96cu und auf n4p
Die dichte steigt auf +13% bei n4p das aber egalisiert sich da man diese Fläche für den fix braucht.
Aus derzeit 300mm² wird aktuell mit fix 330mm² und da wäre min ein waferpreis unter 12000$ erforderlich um dieselben kosten wie in n3 zu haben.
Das man nvidia high end nicht erreicht ist klar plant nvidia doch blackwell wovon ich nur zu 50% ausgehe wäre man mit diesen design bei 216sm verkauf ab 204sm bei quadro und consumer bei nen 144sm gb103 chip dabei. chip kostet um die 150$
Und erreicht nur mit dem kleineren gb103 etwa 86tf amd maxed 69tf
ich nehme aber an das man ne sku mit 142sm 85tf und eine sku mit 76tf plant
Da amd nicht mithalten kann.
Das mehrfache gcd in den mcm kommt erst mit rdna5 in n2 und dann geht es ab.
N2x bietet nochmal die option mit gaa die dichte zu verdoppeln aber das kommt erst 2027 in sample und 2028 in Produktion zu spät für nvidia blackwell Nachfolger und amd rdna5 die schon 2027 und 2026 kommen
zu dem Zeitpunkt ist aber n2p in Serie das schon +25% Takt bringt und 15% Dichte
low end sehe ich ab 2027 amd 2026 bei 30tf das entspricht der rtx4070ti bzw rx7900xt
Die ps5 pro q4 2024 hat 20tf
Daher nehem ich an das rtx50 ab 20tf beginnt das könnte der gb106 sein mit 36sm bei 2,5ghz nicht wundern die arch ändert sich darum ist das schneller. Der chip ist aber teuer ab 44$ darum zweifle ich daran das nvidia das machen wird es kann sein das man high end und low end trennt in n3 und n4p bringt aber das der waferpreis drastisch billiger ist.
Nviida gewinnt maximal 25% dichte und 15% takt bei n3 auf np4 nur 13% dichte bei maxed +11% Takt
2,8*1,11= 3,1ghz wären bei gleichen sku wie bisher 34 46 60= 18-32tf
ad116
34sm 60er class 40$ 18tf
ad114
46sm 70er class 64$ 25tf
60sm 70er ti 86$ 30tf
Das aber zu vermarkten wird schwierig
vs neuen design
gb106
36sm 60er class 44$ 21tf
gb104
46sm 70er class 81$ 27,6tf
60sm 70er ti class 104$ 36tf
Es kann sein das blackwell bessere sm ausbeute bringt also mehr aktiv bleiben pro gpc nur 1-2sm deaktiviert wäre das maxed 72-4 =68sm und 36-2 = 34sm
Aktuell werden etwa 3sm pro gpc deaktiviert darum hat ada potenziell 48sm des ad106 nur 34 aktiv
68*2*120*2,5=40,8tf fürn rtx5080
Der gb103 mit 8 gpc 144sm würde dann etwa 128sm aktiv haben mit 76tf als rtx5090
Ein gpc soll 18sm haben bei blackwell.
ada ampere hat 12sm per gpc