Raucherdackel!, wir reden aneinander vorbei, ich rede von der SW Unterstützung die auf der Idee basiert parallel abarbeitbare Aufgabe an die GPU zu verlagern die dort schneller abgearbeitet werden können, wo es sich aber nicht lohnt diese auf eine Graka auszulagern, wenn sie zu klein sind und die Übertragung der Daten und Befehle auf die Graka den Zeitvorteil auffressen würde und dazu brauchte man damals diese enge Integration von CPU und GPU, eben um nicht so viel Zeit zu verlieren wenn man mal etwas auf der GPU berechnen lassen will. Dies war die Fusion Idee,
diese Präsentation zeigt diese auch deutlich was der Unterschied ist und HSA braucht eine Softwareunterstützung die es erst spät gab und die auch schon längst wieder eingestellt wurde, deshalb:
Raucherdackel! schrieb:
Da hat sich also seit über 5 Jahren nichts mehr getan.
Raucherdackel! schrieb:
rst hat AMD viel zu lange gebraucht um überhaupt eine SW Unterstützung anzubieten
Falsch. Erste APU war der E-350. der lief von Anfang an problemlos, auch unter Linux.
Die lief als CPU und mit iGPU, aber es gab eben keine SW Unterstützung für
die eigentlich Fusion Idee wie sie 2006 bei der Übernahme von ATI vorgestellt wurde, die ist nämlich:
Llano nicht nur eine CPU und eine GPU die zwar auf einem Die stecken, wo aber der entscheidende Teil des Konzeptes dort nicht verwirklicht wurde, sondern der kam erst mit Kaveri:
Erst ab den Kaveri APUs wurde die Kohärenz im Speicher gewährleistet, damit war die eigentliche Fusion Idee dann erst wirklich realisiert, nämlich mehr als eine CPU und eine GPU zu haben, die zwar bei den APUs immer schon auf den gleichen Speicher zugegriffen haben, aber jeder hatte vor Kaveri einen festen Bereich des RAMs den nur sie verwaltetet hat. Daten mussten also von RAM Bereich der CPU über die CPU zur GPU und von der auf ihren RAM Bereich geschrieben werden, genau wie es bei einer GPU auf einer dedizierten Graka der Fall ist, um dann von der GPU verarbeitet zu werden, was eben gegenüber der Verarbeitung auf einer solchen dedizierten Graka kaum noch Latenzvorteile bietet. Erst mit Kaveri wurde dies geändert und erst damit konnte man das Umsetzen was mal der Grund für die ganzen APUs war:
Raven Ridge bietet genau dieses Feature nicht mehr, AMD hat die ganze Entwicklung in diese Richtung nämlich wieder eingestellt.
Raucherdackel! schrieb:
und bauen heute wie damals nur APUs mit eher schwacher CPU
Falsch. R5 2400G deklassiert geradezu gleichteure Intel CPUs, weil 4C/8T.
Es geht nicht um gleichteure CPUs, sondern um die absolute Leistung der CPUs und da bietet AMD auch reine CPU mit doppelt so vielen Kernen für den gleichen Sockel an, von den TR ganz zu schweigen. Die Idee hinter Fusion die mit HSA2.0 (die Level der HSA davor hat auch NVidia, nennt sich da CUDA) bei Kaveri erstmalig umgesetzt wurde war, dass man einfach nicht endlos die Taktraten steigern kann und auch die IPC Steigerungen umso schwerer werden, je weiter man damit vorankommt. Der Ausweg um noch mehr Performance von der CPU zu bekommen ist es also mehr Daten mit einem Befehl abarbeiten zu können und dies ist ja auch was SSE2, AVX, AVX2 und nun AVX-512 machen. Aber die Idee bei AMD war, dass man ja mit einer GPU noch viel, viel mehr Recheneinheit hat als man in an Kernen in eine CPU packen kann und daher diese nimmt, statt den CPUs solche fetten, parallelen Einheiten wie die AVX512 es heute sind, einzubauen. Das gab es damals schon und wurde auch damals schon mit dedizierten Grakas gemacht, nur hat das eben den Nachteil der Latenz bei der Übertragung von Daten und Programmcode auf die GPU, weshalb es sich nur lohnt wenn man viele Berechnungen auf eine große Menge an Daten ausführt, eine kleine Aufgaben hat die CPU selbst erledigt bevor die Ergebnisse von der Graka zurückgekommen sind. Daher braucht man eine enge Integration der beiden mit HUMA, dem gemeinsamen Zugriff auf die gleichen RAM Bereiche, was aber wegen der Caches die CPUs und GPUs haben, nicht so einfach ist, dafür aber eben die Zeit extrem verkürzt und es möglich macht das die GPU auch bei kleinen Aufgaben, also solchen wo nur wenige Berechnungen auf den Daten erfolgen, dann schneller als die CPU ist, eben weil keine Daten zwischen beiden hin und her geschoben werden müssen, da beide auf die gleichen RAM Adressen zugreifen können. Das macht die GPU dann zu einer superbreiten AVX Einheit:
Lies auch mal
dies hier, wenn dich die ganze Geschichte wirklich interessiert.
Raucherdackel! schrieb:
wobei die Raven Ridge meine ich die Fusion Lösung gar nicht mehr unterstützen.
Gratulation, wieder falsch. Rate mal, wie bei Piledriver APUs die Verbindung zwischen CPU und GPU aufgebaut ist.
Dann zeige mal wo steht das Raven Ridge HUMA hat. AMD hat dies aufgegeben und Raven Ridge ist einfach nur wieder eine APU mit einer CPU und einer integrierten GPU, die aber eben nicht HSA 2.0 kann.