AMD „Kaveri“: Architektur-Änderungen im Überblick

Michael Günsch
93 Kommentare

Noch im Laufe des Jahres will AMD die „Kaveri“-APU herausbringen. Dabei sollen nicht nur die „Steamroller“-Kerne Premiere feiern, sondern auch HSA wird erstmals unterstützt. Neben kleinen offiziellen Informationshappen ist eine Vielzahl an inoffiziellen Daten im Netz zu finden, die einen Vergleich mit dem Vorgänger ermöglichen.

Der für seine Analysen und Übersichten bekannte japanische Tech-Journalist Goto Hiroshi Shigeru (Hiroshige Goto) hat die bisher bekannten Änderungen informativ dargelegt.

Die „Kaveri“-APU wird bekanntlich erstmals im 28-nm-Bulk-Prozess bei Globalfoundries gefertigt, während die Vorgänger „Richland“, „Trinity“ und „Llano“ beim selben Auftragsfertiger im 32-nm-SOI-Verfahren hergestellt werden. CPU-seitig basiert „Kaveri“ zwar grundlegend auf der „Bulldozer“-Architektur im Modulaufbau, allerdings kommt die nach „Piledriver“ zweite überarbeitete Version namens „Steamroller“ zum Einsatz. Wie AMD bereits im August 2012 enthüllt hatte, geht der Hersteller dabei einen Schritt weg von geteilten Ressourcen in Richtung einer stärkeren Single-Thread-Leistung – letztere gilt als einer der großen Schwachpunkte von Bulldozer.

Steamroller vs. Bulldozer
Steamroller vs. Bulldozer (Bild: pc.watch.impress.co.jp)

Die obere Grafik verdeutlicht, dass ein Teil der vormals geteilten Ressourcen innerhalb eines Moduls wieder dediziert für einzelne Threads zur Verfügung steht; Decoder- und Dispatch-Einheiten sind in einem Modul nun zweifach vorhanden, was zusammen mit einer überarbeiteten Sprungvorhersage für eine höhere Leistung sorgen soll. Im vergangenen Sommer hatte AMD erneut von einer Leistungssteigerung durch Design-Verbesserungen um bis zu 15 Prozent pro Watt gegenüber Piledriver gesprochen.

Auf Seiten der integrierten GPU folgt auf VLIW5 (Llano) und VLIW4 (Trinity/Richland) nun die bei dedizierten Radeon-Grafikkarten schon vor Jahren eingeführte Graphics-Core-Next-Architektur (GCN), die ihr APU-Debüt in den Low-Power-Chips „Temash“ und „Kabini“ jüngst feierte. Mit bis zu 512 Stream-Prozessoren wird die Zahl der Shader-Einheiten deutlich erhöht. Im Rahmen der Präsentation einer neuen Server-Roadmap hatte AMD vor einigen Wochen die Anzahl von bis zu 512 Stream-Prozessoren für „Kaveri“ anhand des für Anfang 2014 geplanten Server-Pendants „Berlin“ bestätigt. Dort war zudem von einer Rechenleistung von 700 GFLOPS für eine Berlin-APU mit 35 Watt die Rede, 4Gamer verglich dies mit einer Radeon HD 7750 mit der gleichen Shader-Anzahl, die bei 800 MHz GPU-Takt 819 GFLOPS liefert. Den unterschiedlichen Aufbau der Grafikeinheit von Kaveri im Vergleich zu den Vorgängern verdeutlichen folgende Skizzen.

Vergleich der GPU-Architekturen
Vergleich der GPU-Architekturen (Bild: pc.watch.impress.co.jp)
GPU-Vergleich: Llano, Trinity und Kaveri
GPU-Vergleich: Llano, Trinity und Kaveri (Bild: pc.watch.impress.co.jp)

Schließlich gibt Hiroshige Goto noch eine Schätzung für die noch nicht offiziell genannte Die-Fläche von Kaveri mit vier Steamroller-Kernen ab. Diese soll insgesamt (CPU + GPU) unter 240 mm² liegen und damit etwas kleiner als eine APU auf Bulldozer-Basis ausfallen. Intels „Haswell“ mit vier Kernen und dem Vollausbau der integrierten Grafikeinheit „Iris Pro“ alias GT3e soll hingegen auf über 260 mm² kommen. Mit der weit verbreiteten GT2-Grafik fällt ein „Haswell“-Quad-Core-Chip mit 177 mm² aber wiederum erheblich kleiner aus.

Chipgrößenvergleich
Chipgrößenvergleich (Bild: pc.watch.impress.co.jp)
Kaveri-Die
Kaveri-Die

Eine der interessantesten Neuerungen bei Kaveri ist aber ohne Zweifel die erstmalige Unterstützung für sogenannte HSA-optimierte Anwendungen. Hinter HSA verbirgt sich die Heterogenous System Architecture, deren Ziel es ist, das Zusammenspiel von CPU, GPU und Software so zu verbessern, dass insbesondere das Rechenpotenzial von Grafikchips für allgemeinere Aufgaben besser genutzt werden kann. Hierbei soll die Technik hUMA helfen. hUMA steht für „Heterogeneous Uniform Memory Access“ und soll einen Speicher schaffen, auf den sowohl CPU als auch GPU mit denselben Fähigkeiten zugreifen und auch Daten direkt miteinander austauschen können. Diese Technik wird AMD ebenfalls mit Kaveri einführen. Doch auch die Spielkonsolen Xbox One und PlayStation 4 werden einen Speicher bieten, den sich CPU und GPU von AMD teilen.

Am Ende bleibt abzuwarten, inwieweit sich all diese Verbesserungen und Neuerungen in spürbarer Leistungssteigerung äußern werden.

AMDs „Steamroller“