AMD Radeon: Vega-GPU mit neuen Shadern, höherer IPC und HBM2
2/3Details über „mehr als 200 neue Features“
AMD spricht bei Vega von „mehr als 200 neuen Features“, ohne jedes einzelne im Details zu benennen geschweige denn zu erläutern. Aber eine Hand voll wesentliche Änderungen hat der Hersteller in den USA zumindest umrissen.
HBM2 und eine neue Speicherhierarchie
Nachdem Fiji die erste GPU mit der neuen Speichertechnologie HBM gewesen ist, feiert auf Vega deren erste Ausbaustufe HBM2 ihre Premiere.
Speicherkapazität in Theorie und Praxis
Die gezeigte Vega-GPU verfügt über zwei Stacks (Stapel) HBM2. Die Spezifikationen von HBM2 lassen damit Speichergrößen von vier Gigabyte bis hinauf zu 16 Gigabyte zu, denn ein Stapel ist bei HBM2 entweder 1, 2, 4 oder 8 GB groß. Bei Vega kommen 8 und 16 GB Speicher in Frage.
Die professionellen Grafikkarten mit Vega dürften über 16 verfügen, offizielle Aussagen gibt es hierzu aber ebenso wenig wie zum Speicherausbau bei Vega für Spieler. In den USA lief in einem Demo-System ein Modell mit zwei mal 4 GB HBM2, ob das der finale Stand ist, oder es auch Grafikkarten mit 16 GB geben wird, bleibt offen.
Halbiertes Speicherinterface, doppelter Speichertakt
AMD hat bereits während eines Interviews im Dezember verraten, dass Vega wie Fiji auf eine Speicherbandbreite von 512 Gigabyte pro Sekunde zurückgreift. Weil jeder Stapel HBM 2 unverändert über ein 1.024 Bit breites Interface verfügt, muss der Speichertakt damit bei 1.000 MHz liegen, um dieselbe Bandbreite zu erreichen wie vier Stapel HBM mit 500 MHz Takt bei Fiji.
AMD bewirbt den Einsatz von HBM2 gegenüber klassischem GDDR5-Speicher erneut mit einem um 50 Prozent geringeren Platzbedarf, der wie bei Fiji sehr kompakte Platinen möglich machen soll. Die Energieeffizienz soll inklusive Speichercontroller um den Faktor 5 besser bei HBM2 im Vergleich zu GDDR5 sein. Ob Samsung oder Hynix den Speicher liefern werden, auch das bleibt Anfang Januar noch offen.
Ein Schlagwort für den Speicher ist der Speicher selbst
AMD spricht bei Vega von einer „völlig neuen Speicherhierarchie“, „High Bandwith Cache“ und „High Bandwith Cache Controller“ als Neuerungen. Der High Bandwith Cache ist dabei allerdings mit HBM2 gleichzusetzen. Hinter dem High Bandwith Cache Controller verbirgt sich hingegen nicht der Controller nur für den Speicher der Grafikkarte an sich, sondern die Möglichkeit, Speicher systemweit zu adressieren, was für professionelle Software zum Beispiel im HPC- und Render-Bereich wichtig ist. Dazu zählt auch ein eventuell vorhandener Netzwerkspeicher.
Vega kann über den neuen Controller auf einen 512 Terabyte großen Virtual Address Space zugreifen, da dieser wie bei Nvidia GP100 nun 49 Bit anstatt 48 Bit groß sein kann – genauso wie Nvidias GP100. Auch die Wege, auf denen adressierter Speicher zur Berechnung in der GPU bereitgestellt wird, soll der neue Controller besser beeinflussen können.
Als ein Einsatzszenario für den High Bandwith Cache Controller nennt AMD allerdings auch den Speicherverbrauch in Spielen. Auch Spiele adressieren teils deutlich mehr Speicher als eigentlich benötigt wird. Durch den neuen Controller soll es für den Entwickler einfacher werden, wirklich nur den Speicher zu belegen, der gerade benötigt wird. Allerdings muss die Engine darauf angepasst werden.
Pro Takt mehr als doppelt so viele Polygone
Wenn viele Polygone auf dem Bildschirm zu sehen sind, soll Vega deutlich schneller arbeiten können als bisherige GCN-GPUs. AMD spricht von einem mehr als verdoppelten Geometriedurchsatz pro Takt bei Vega gegenüber einer Radeon R9 Fury X mit Fiji-GPU. Das soll durch eine neue programmierbare Geometry-Pipeline ermöglicht werden. Vegas vier Geometry-Engines können damit pro Takt maximal elf Polygone berechnen – die Primzahl lässt aufhorchen, wurde von AMD aber nicht genauer erläutert. Fiji kann mit vier Geometry-Engines maximal nur vier Polygone pro Takt fertig stellen. Der Faktor liegt also bei 2,6.
Vega erweitert die klassische Geometrie-Pipeline
In der klassischen Pipeline arbeitet zunächst der Vertex- und dann der Geometry-Shader, der die Ergebnisse dann an den Speicher weitergibt. Alternativ kann Geometrie aber auch mit Hilfe von Compute Shadern berechnet werden. Vega bietet in der Pipeline nun einen neuen Primitive Shader an, der dieselben, flexibleren Zugriffe ermöglicht wie ein Compute Shader. Dadurch soll der im Primitive Shader zu berechnende Thread genauso schnell „starten“ können wie der Compute Shader, was deutlich schneller als in einer klassischen Geometrie-Pipeline möglich ist.
Neben dem Peak-Durchsatz soll auch die generelle Effizienz der Geometrie-Pipeline auf Vega deutlich gestiegen sein. So soll ein „Intelligend Work Distributor“, der die Rechenaufgaben an die Geometry-, Compute- und die Pixel-Engine verteilt, bei vielen Geometrieberechnungen erheblich effektiver arbeiten als jetzt. Dadurch soll die Auslastung der GPU in entsprechenden Szenen deutlich höher ausfallen, ein großes Probleme der GPUs von AMD der letzten Jahre.