Die wgp sind nur ne neue bezeichung und beschreiben das zusammenlegen der cu in gruppen ist wie bei nvidia aufteilung
nvidia hat je gpc 5 tpc mit 10 sm ein tpc hat 2sm und ein sm hat 128 fp16/32 einheiten
Wovon 64fp32 nativ sind und 64fp16 mit software auf fp32 zu 50% ausgelstet wetrden können
amd n31 wird
so aussehen
https://www.3dcenter.org/dateien/abbildungen/RDNA3-MultiChip-Ansaetze-Moeglichkeiten-5.png
wir wissen das n31 15360shader hat
ein wgp müsste demnach 15360/80/2(chiplets)=96 shader sein
Die leistungs einschätzung bleibt aber gleich
Ich sehe da kein inf cache dann hat n31 und n32 quasi ein 512bit si
Das könnte die speicherbandbreiten problem fasst aufheben
512*21/8=1344gb/s
Und da der n32 das si nicht beschneidet könnte das passen
Das aber ist total unterschiedlich zum n33 chip
https://www.3dcenter.org/dateien/abbildungen/RDNA3-MultiChip-Ansaetze-Moeglichkeiten-1.png
Das Bild ist was verwirrend ich gehe davon aus das dies 4 varianten sind zu eine design
Und man wohl n33 eine refresh n22 darstellt
Wo entweder 4 gcd mit je 10cu an 4*64mb inf cache oder 8x32mb verwendet
das erklärt auch die verwirrung meinerseits mit cu und wgp
Am ende sind es n33 40*64=2560, bei n31 160*96=15360 und bei n32 120*96=11520
also hat ein wgp 96shader
Und n33 ist rdna2 näher als gedacht was ein refresh von n22 infrage stellt. Dder n34 dürfte dann auch dem n33 folgen in 6nm mit vermutlich 2gcd und 20cu
das würde mehr sinn machen als rdna2 in 6nm zu machen
Diese infos hab ich gerade erst entdeckt ist wohl an mir vorbeigegeangen ich bin ehger in nviida drin.
da ich deren technik schon besser einschätzen kann
Nvidia müsste schon arg dumm anstellen um mit 5nm nicht die effizienzkrone zu bekommen.
amd rdna3 archtektur verbesserungen werden spannend ein 512bit si war mir nicht klar
das ändert einiges
am ende kommt es auf mcm an geht es ohne latenz oder nicht.