AMD Bulldozer im Test: Ein schwarzer Mittwoch

 6/25
Volker Rißka
1.958 Kommentare

Architektur

Module statt Kerne

Die wohl wichtigste Neuerung bei „Bulldozer“ sind die grundlegende Architektur und die Einführung von Modulen statt einzelnen Kernen. In einem Modul teilen sich zwei Integer-Kerne die zur weiteren Bearbeitung notwendigen Einheiten. Dies hat einen sehr großen Vorteil, wenn es um die flächenmäßige Größe geht. Denn mit dem Konzept, das AMD „Core Multithreading“ (CMT) tauft, schafft man mit lediglich 12 Prozent mehr Fläche aus einem Single-Core-Modul eines, das zwei Threads bereitstellt, die im Bereich der Leistung nahe an ein klassisches Dual-Core-Design heranreichen sollen.

Fläche für zweiten Kern
Fläche für zweiten Kern

Doch durch die Teilung der Ressourcen neben dem Integer-Kern ist ein Modul kein klassischer Dual-Core-Prozessor mehr, so wie er seit der Einführung gesehen wird. Auch wenn AMD die neuen Prozessoren als Modelle mit acht Kernen vermarktet, werden wir in unseren Diagrammen die Darstellung „4M/8T“ benutzen, was für vier Module und acht daraus resultierende Threads steht, was fernab des Marketings in jedem Fall korrekt ist. AMD spricht davon, dass ein Modul in der Regel 180 Prozent der Leistung eines einzelnen Kerns bereitstellen kann, gut 20 Prozent der Leistung sollen laut Hersteller durch die geteilten Einheiten verloren gehen.

Bulldozer-Architektur
Bulldozer-Architektur

Die Modul-Bauweise hat aber nicht nur Vorteile. AMD erklärte vorab, dass ein Zwei-Modul-Design bei Anwendungen, die lediglich zwei Kerne auslasten, immer wieder unterschiedliche Ergebnisse zutage fördert. Denn je nachdem, wie das Betriebssystem die Ressourcen verteilt, arbeitet die ganze Zeit ein Modul mit geteilten Ressourcen, oder eben beide Module, in denen dann jeweils ein Kern alle Ressourcen bekommt. Unterschiede von drei, vier Prozent allein bei so einer Dual-Core-Anwendung sind keine Seltenheit. Dies ist analog auch beim Vier-Modul-Design der Fall, bei dem lediglich vier reale Kerne unterstützt werden. Hier können die Unterschiede am Ende noch drastischer ausfallen.

Doch auch an einer anderen Stelle hat AMD zu kämpfen: Windows 7. Dieses lässt gern die Zuteilung der Kerne immer und immer wieder wechseln, weshalb „Bulldozer“ beispielsweise seinen Turbo nie voll ausspielen kann. Dieses Problem haben jedoch auch schon ältere Prozessoren, auch beim Phenom II X6 springen die Auslastungen nur so von Kern zu Kern, der maximale Turbo ist fast nie verfügbar. Erst nach manueller Zuweisung, in dem man beispielsweise Prime mit drei Tasks startet und Windows explizit darauf hinweist, für Prime genau nur drei Kerne zu nutzen, arbeitet der Turbo stabil am Maximum.

Bildvergleich: 3 Threads mit Prime im Normalfall 3 Threads festen Kernen zugewiesen
Bildvergleich: Unterschied bei einem Phenom II X6 (oben) und FX-8150 (unten) mit Prime-Belastung bei der Hälfte der Kerne im Normalfall und nach strikter manueller Zuweisung

Abhilfe soll da unter anderem das neue Windows 8 schaffen, das die Kerne cleverer zuweisen kann und folglich den Turbo maximal nutzen könnte. Erste Benchmarks, die AMD in dem Bereich mit der Developer-Preview getätigt hat, sollen dies zeigen.

Bulldozer und Windows 8
Bulldozer und Windows 8

Davon würden jedoch auch diverse andere Prozessoren mit mehreren Kernen und einem Turbo profitieren – wie unser Beispiel mit dem Phenom II X6 gezeigt hat –, so dass man die finale Version von Windows 8 und den exakten Vergleich von mehreren Prozessoren abwarten muss. Dann dürfte sich herausstellen, was die Überarbeitung des Schedulers am Ende für Vorteile bei welchen Prozessoren bringt.