Nai
Lt. Commander
- Registriert
- Aug. 2012
- Beiträge
- 1.578
Der HBM-Speicher hat an sich mit dem Speichermanagement nichts zu tun. Das bestimmt der Treiber und teilweise die GPU selbst (wie du im nächsten Satz auch geschrieben hast?).Und jetzt nehme man HBM-Speicher der die Größe des für Streaming verwendeten Speicherpools dynamisch bestimmen kann (Treiberseitige Zuweisung wie ja auch bisher)
Das ergibt keinen Sinn. Denn falls die Addressen nicht interleaved auf die einzelnen Kanäle abgebildet werden hat man immer die Geforce 970 Problematik.und mit einem eigenen Takt betreiben kann, unabhängig von dem Speicher der für den restlichen Renderprozesse benutzt wird
Der Satz ergibt keinerlei Sinn. Wie kann ein Datenverkehr "zu berechnen" sein?Es muss nicht der gesamte zu berechneden Datenverkehr auf einen gemeinsamen Zyklus in Wavefronts zusammen gefasst werden, oder eben es werden kleinere Wavefronts gebildet die dadurch Latenz und Effizienz des Speichers verbessern in Anwendungen.
Des Weiteren ist der Begriff Wavefront hier vollkommen fehl am Platz. Der Begriff Wavefront bezeichnet bei AMD eine Gruppe von GPU-Threads die per SIMD/SIMT alle Befehle gemeinsam abarbeiten. Eine Wavefront ist bei AMD momentan 64 Threads groß. Die Größe einer Wavefront beeinflusst dabei wie viel Kontroll-Hardware die GPU benötigt (je kleiner die Wavefronts umso mehr). Allerdings geht bei kleineren Wavefronts auch weniger Performance durch mangelnde Datenparallelität verloren. Die Threads einer Wavefront arbeiten Speicherzugriffe ebenfalls gemeinsam ab. Dabei werden Speicherzugriffe einer Wavefront zusammengefasst, so dass die angeforderten Daten nicht mehrmals übertragen werden müssen. Das Zusammenfassen geschieht allerdings schon auf L1-Ebene, dh wenn mehrere Threads einer Wavefront bei der selben L1-Cache-Line einen Miss verursachen, wird sie nur einmal aus dem L2-Cache angefordert. Deshalb kommen beim L2-Cache nur noch L1-Misse an, der dann wiederum bei L2-Misse den DRAM abfrägt. Ergo haben Wavefronts an sich nichts mit den Speicherzugriffen auf dem DRAM zu tun.
Wie gut das Speichermanagment beziehungsweise Paging funktioniert ist primär davon abhängig, wie gut die enstprechende Engine, API, GPU oder der Treiber das implementiert und wie schnell die PCI-E Bandbreite ist. Es ist nicht (oder nur sehr wenig) davon abhängig welche Speichertechnologie für den GPU-DRAM letztendlich verwendet wird. Oder würdest du dir schnelleren CPU-DRAM kaufen, wenn die CPU anfängt Daten auf die Festplatte zu thrashen?Eventuell ändert sich nichts an FPS, doch mit Sicherheit hat man mehr Frames in denen höhere Texturen zum Einsatz kommen - wird nur schwierig dies in Benchmarks zu testen oder darzustellen.
Ein weiterer Satz ohne Sinn. . . .MIt HBM wird diesen Streamingeffekten und separaten Verarbeitungsgeschwindigkeiten unterschiedlicher GPU Einheiten entgegen gearbeitet
Zuletzt bearbeitet: