duskstalker
Admiral
- Registriert
- Jan. 2012
- Beiträge
- 7.958
Volker schrieb:HBM ist eine sehr gute Technologie, aber beim Design-Prozess haben sie halt damals irgendwie gedacht, das wird schon passen. 2 Mal. Ob der Fokus, es mit HBM umzusetzen, am Ende auf GCN abgefärbt hat oder umgekehrt, ist wohl das Henne-Ei-Problem
die GCN architektur gibts bei amd schon seit der HD 7000er serie und jede weitere iteration von GCN war eher ein kleines designupdate als eine neue architektur - d.h. der grundsätzliche aufbau von GCN blieb bis zur radeon 7 weitestgehend bestehen. sieht man auch daran, dass fiji und vega quasi die selbe IPC haben.
GCN ist auf viele parellele operationen ausgelegt. die einheiten sind in größere gruppen eingeteilt und optimalerweise sind die gruppen mit tasks gefüllt wenn der nächste taktzyklus kommt. GCN ist ein bus mit 50 sitzplätzen. jetzt ist das natürlich nicht sonderlich flexibel und je geringer die auslastung ist, desto ineffizienter ist die architektur. entweder laufen einheiten leer oder halb voll oder warten.
takt und speicherbandbreite sind bei GCN trumpf.
vega war viel schneller als fiji, und das kommt hauptsächlich aus dem takt. hbm verbraucht wenig strom, also mehr powerbudget für den core, und hbm hat viel speicherbandbreite. hbm ist der perfekte speicher für GCN, aber GCN ist nicht die perfekte architektur für gaming, weil gaming workloads einfach nicht so geregelt ablaufen, als dass man GCN noch anständig auslasten könnte.
das perfekte beispiel ist die radeon 7 - die karte hat die selbe architektur, nur 60 CUs, aber mehr takt und bandbreite als v64 und ist signifikant schneller - aber auch hier sieht man: RDNA 1 ist in niedrigen auflösungen verhältnismäßig viel schneller - in 4k kann sich die radeon 7 wieder weiter von der 5700 XT absetzen. das ist einfach der effizienzvorteil von RDNA vs GCN, weil die einheiten in RDNA granularer eingeteilt sind und RDNA 1 in niedrigen auflösungen schon gut ausgelastet und weniger gewartet wird. der 5700 XT geht in höheren auflösungen die puste aus, während die radeon 7 sich gerade erst so langsam richtig optimaler auslastung annährt.
das selbe sieht man jetzt auch bei nvidia ampere - die fetten chips haben immer ein auslastungsproblem.
das letzte mal, dass "GCN" gut funktioniert hat, war in hawaii und polaris. hawaii hatte ein 512bit GDDR5 memory system - und polaris ist nur 36 CUs groß. je kleiner der chip, desto besser lassen sich die GCN einheiten auslasten.
bei der chipfläche von polaris hätte man auch eher gtx 1070 performance erwarten müssen - aber das geht gerade noch so in ordnung. und hawaii hat gezeigt, dass ein fettes memorysystem ein muss ist.
HBM war die lösung zum GCN problem - meiner meinung nach. ein henne-ei-problem sehe ich hier nicht.
Zuletzt bearbeitet: