Zum Zweiten: Mehr von „Bobcat“ und „Bulldozer“
Nachdem AMD bereits vorab einige Infos zu „Bobcat“ und „Bulldozer“ bekannt gegeben hatte, es sich dabei aber größtenteils um die bekannten Dinge handelte, ist nach Abschluss der „Hot Chips“-Präsentation das Originalmaterial verfügbar. Und dieses bietet teilweise deutlich mehr Details.
Als erstes erklärte AMD noch einmal, was es mit dem Moduldesign auf sich hat. Grundlage dafür ist das Prinzip eines klassischen Zwei-Kern-Prozessors, der sich die CMP-Technik (Core Multi Processing) zu Nutze macht. AMD hat sich dieses Designs bedient, dabei aber einige Bereiche, wie den Floating-Point-Scheduler für die Gleitkommaberechnung und den L2-Cache zusammen gekürzt. Heraus kommt am Ende ein kleines Modul, das aber durch die gemeinsame Nutzung der zwei Integer-Kerne von L2-Cache und FP-Scheduler nicht an die Performance eines klassischen Zwei-Kern-Prozessors heran kommen kann. Single-Threaded-Anwendungen werden alle Ressourcen, also der komplette L2-Cache in Größe von 2 MByte und FP-Scheduler, im Modul zur Verfügung stehen, so dass dort quasi kein Unterschied zu einer bisherigen Single-Threaded-Anwendung bemerkbar sein wird.
Multi-Threaded-Anwendungen müssen, je nach Anforderung an die CPU, aber mit entsprechenden Einbußen rechnen, da die Aufgaben verteilt werden und nicht die Ressourcen zur Verfügung stehen, die bei einem klassischen Zwei-Kern-Design vorhanden wären. Der L1-Daten-Cache pro Integer-Kern bleibt mit jeweils 16 KByte natürlich erhalten, die 64 KByte L1-Cache für Instruktionen werden im Modul aufgeteilt. AMD selbst bestätigt mit einer erwarteten durchschnittlichen Performance von 80 Prozent des gesamten Moduls gegenüber eines reinen Dual-Core-Designs die bisher in den Gerüchten gehandelten Werte.
Wie bereits in der letzten News erwähnt, wird AMD dadurch aber massiv Kosten einsparen. Denn ein zweiter Integer-Kern nimmt nur etwa zwölf Prozent mehr Platz in dem kompletten „Bulldozer“-Modul ein. Bezieht man dies auf die Basis des gesamten Chips (inklusive L3-Cache & Co.), sind es am Ende lediglich fünf Prozent, die aber eben für eine deutlich höhere Leistung gegenüber einem Prozessor mit lediglich einem Kern sorgen können. Dafür wird im Desktop-Bereich aber ein neuer Sockel AM3+ fällig, in den aktuellen Sockel AM3 werden keine „Bulldozer“-Produkte passen. Bisherige AM3-CPUs sollen umgekehrt jedoch im Sockel AM3+ laufen. Für den Server-Bereich sollen hingegen bestehende Sockel und Chipsätze genutzt werden können, dies hatte AMD selbst bereits vor wenigen Wochen publiziert. Was es mit den neuen Sockeln und dazu passenden Chipsätzen auf sich hat, will AMD später bekannt geben.
In den Ausführungen im Rahmen seines Vortrags bestätigte Mike Butler von AMD die weiteren Informationen. Demnach gibt es die zusätzlichen Instruktionen SSE4.1 und 4.2, die bisher Intel vorbehalten waren. Auch „AVX“ als wichtige Neuerung ist mit von der Partie. Zu den „AES“-Instruktionen, welche Intel seit diesem Jahr unterstützt, hat AMD offiziell bisher kein Wort verloren – John Fruehe bestätigt die Unterstützung in seinem Blog aber. Hinsichtlich der Effizienz steht neben dem bekannten „Clock Gating“ auch das „Power Gating“ im Fokus, mit dem sich einzelne Bereiche nicht nur weit heruntertakten, sondern auch komplett abschalten lassen, um so Strom zu sparen. Im Gegenzug gibt es, wie bereits berichtet, einen verbesserten Turbo, der die wenigen Kerne, die manchmal nur von Nöten sind, stärker als bisher beschleunigen kann. Das Gesamtpaket „Bulldozer“ soll letztendlich dafür Sorge tragen, dass die Performance pro Watt und pro genutzter Chip-Fläche deutlich ansteigt.
Genau an dieser Stelle setzt auch „Bobcat“ als CPU der ersten „Fusion“-APUs an: Die Leistung pro Watt und der dazu benötigten Chipfläche wird deutlich ansteigen. Bei „Bobcat“ ist es aber nicht primär die Performance, die sich verbessert, sondern der Energiebedarf. Auch der kleine Prozessor wird das „Power Gating“ und den Stromsparmodus „C6“ unterstützen, zudem wurde das „Clock Gating“ nochmals optimiert. Die genannten „Sub 1 Watt“ darf man aber nicht zu wörtlich nehmen, denn „Bobcat“ wird nie als einzelne CPU verkauft. „Ontario“ auf Basis des „Bobcat“ wird vermutlich bis zu zwei dieser Kerne vereinen und zusätzlich mit weiteren Bauteilen wie Speichercontroller und Grafikkern eine TDP bilden, die deutlich über dem Wert von einem Watt liegt. Aktuelle CPUs aus eigenem Hause dürfte man aber nach wie vor unterbieten.
Das Komplettpaket soll so die erneut bestätigten 90 Prozent der Performance einer aktuellen AMD-Mainstream-Notebook-CPU bieten. Dank den ersten technischen Daten, die einen L1-Cache von 2x 32 KByte sowie einen L2-Cache von 512 KByte pro Kern darlegen, dürfte ein bisheriger Athlon II in etwa den Maßstab für die Prozessor-Performance eines „Ontario“ darstellen. Dabei spielen aber weitere unbekannte Größen wie Takt und Stromverbrauch eine Rolle, so dass auch dies nur eine vage Schätzung bleibt.
Ein Video von AMD fasst die wichtigsten Informationen zu „Bobcat“ und „Bulldozer“ in englischer Sprache zusammen: