AMDs Bulldozer im Detail: Turbo, CMT und Windows 8 im Fokus

 4/5
Wolfgang Andermahr
245 Kommentare

CMT und einzelne Kerne

Mit Bulldozer hat AMD eine völlig überarbeitete CPU-Architektur und damit das „Modul-Konzept“ eingeführt, das ein Kompromiss aus Anzahl der vorhandenen Rechenkerne und Die-Größe darstellt. So kann der FX-8150 zum Beispiel acht Threads verarbeiten, hat aber nur vier vollständige CPU-Kerne. Das Feature hat AMD auf den Namen CMT, Core Multithreading, getauft.

Denn jeder Kern ist in ein so genanntes Modul integriert, welches wiederum einen weiteren Kern beinhaltet, der aber nicht vollständig ist. So sind die wichtigsten Komponenten wie zum Beispiel die Integer-Einheit doppelt vorhanden, während weniger oft benutzte Einheiten wie die „Floating-Point“-Einheit nur ein Mal verbaut ist. Im besten Fall ist der FX-8150 also genauso schnell wie ein richtiger Acht-Kern-Prozessor, im ungünstigsten Fall, der aber unwahrscheinlich ist, nur so flott wie eine Vier-Kern-CPU. Die Wahrheit liegt, wie so oft, irgendwo dazwischen.

Eine Beta-BIOS-Version des „Asus-Crosshair-V“-Mainboards lässt es zu, nicht nur komplette Module, sondern auch einzelne Threads innerhalb eines Moduls abzuschalten. Darum wollen wir uns die Performance des FX-8150 einmal genauer anschauen, wenn komplette Module oder einzelne Threads abgeschaltet werden. Mit ersterem lassen sich die kleineren AMD-CPUs simulieren. Letzteres dagegen erlaubt zwei Untersuchungen: In wie weit unterscheidet sich der „halbe“ Acht-Kern-Prozessor von einer richtigen Vier-Kern-CPU und, was durchaus interessanter ist, in wie weit Bulldozer an dem „Komponenten-Sharing“ leidet.

Leistung in niedrigen Auflösungen

Rating CMT – Niedrigste Auflösung
    • FX-8150 @ 4M/8T
      100,0
    • FX-8150 @ 4M/4T
      99,7
    • FX-8150 @ 3M/6T
      97,3
    • FX-8150 @ 2M/4T
      91,9
    • FX-8150 @ 1M/2T
      64,9
Einheit: Prozent, Arithmetisches Mittel

Leistung in 1.680x1.050

Rating CMT – 1680x1050
    • FX-8150 @ 4M/8T
      100,0
    • FX-8150 @ 3M/6T
      99,0
    • FX-8150 @ 4M/4T
      98,6
    • FX-8150 @ 2M/4T
      94,9
    • FX-8150 @ 1M/2T
      73,8
Einheit: Prozent, Arithmetisches Mittel

In Spielen ist AMDs CMT-Konzept derzeit eher weniger gut aufgehoben, da moderne 3D-Engines schlicht und ergreifend nur in den seltensten Fällen mehr als vier Threads auslasten können. Und das hat zur Folge, dass es nur einen messbaren Unterschied macht, ob der FX-8150 mit vier Modulen, vier Modulen ohne CMT oder drei Modulen arbeitet – unabhängig von der genutzten Auflösung, die Differenzen liegen unter fünf Prozent.

Bei nur noch zwei Modulen ist die Performance dann spürbar schlechter. So arbeitet der vollständig aktivierte Prozessor in niedrigen Auflösungen neun Prozent schneller, unter 1.680x1.050 sind es noch fünf Prozent. Mit nur einem Modul bricht die Performance vollends ein: 35 Prozent der ursprünglichen Performance gehen in niedrigen Auflösungen verloren und 26 Prozent in 1.680x1.050.

Deutlich interessanter ist ein Blick auf die einzelnen Spiele. In vielen gibt es kaum einen Unterschied zwischen den einzelnen Konfigurationen. Manche zeigen dagegen, dass das Modul-Konzept auch in Spielen reibungslos funktionieren kann: Battlefield: Bad Company 2 sowie Lost Planet 2 sind solche Fälle.

So kommt der FX-8150 mit zwei Modulen (vier Threads) zum Beispiel in Battlefield auf knapp 99 Frames per Second, während die Variante mit vier Modulen ohne CMT (vier Threads) mit 103 FPS kaum schneller ist. In dem Fall stellen die geteilten Bauteile (Stichwort Floating-Point-Unit) also kein Problem dar. Mit drei Modulen (sechs Threads) steigt die Leistung auf 113 Bilder pro Sekunde an, mit vier Modulen (acht Threads) sind es dann fast 124 FPS.

Genauso gibt es aber die Möglichkeit, dass die geteilten Komponenten den Bulldozer ausbremsen. Ein gutes Beispiel dafür ist Stalker – Call of Pripyat, das immer gleich schnell rendert, unabhängig davon, ob zwei, drei oder vier Module arbeiten. Wird CMT jedoch abgeschaltet, arbeitet die Version mit vier Modulen und nur noch vier Threads plötzlich zehn Prozent schneller! Nicht optimierte Spiele können mit dem theoretisch schnelleren CMT also schlechter laufen als ohne CMT.