ob bulldozer oder jaguar ist egal, beides hat pro kern eine 128bit FPU...
...was aber völlig belanglos ist, da Bulldozer
a) zwei FMA-Pipes hat, Jaguar sich dagegen eher am K10-Modell mit getrennten FADD/FMUL-Pipes orientiert
b) viel höhere FPU-Latenzen hat
c) pro Kern im Idealfall bis zu vier Befehle pro Takt decodieren und abarbeiten kann, statt nur zwei (solange der andere Kern im Modul gerade zum Beispiel auf den RAM wartet) und damit gewisse Codesequenzen, seien sie auch noch so kurz, schneller abarbeiten können. Beispiel aus dem Real Life (besonders in Schleifen) wären zwei parallele FPU-Instruktionen, ein Integer-Add/Sub und ein Jump.
d) ein völlig anderes Cache-Layout hat als Jaguar. Das vom Bulldozer ist grob gesagt grottig, das von Jaguar ist naturgemäß recht klein.
e) die potentere Out of Order-Engine hat
f) einen Dual Channel-Speichercontroller hat. RAM spielt bei Cinebench zwar nur eine kleine, aber doch eine Rolle.
g) die Sprungvorhersage anders arbeitet
h) und und und.
Jaguar ist im Endeffekt IPC-mäßig etwas schwächer aufgestellt als Bulldozer (bzw. zumindest Piledriver), obwohl letzterer nun wirklich mehr als genug offensichtliche Designschwächen hat, im Cinebench R11.5 erreicht Jaguar grob das Niveau eines gleich taktenden K8 mit 64bit-FPU.
Dass Software aus dem Intel-Compiler und mit Intel-Bibliotheken das vorhandene Potential aber nicht voll ausschöpft, kommt ja nur erschwerend dazu (Auch wenn der Intel-Compiler für
alle CPUs die Leistungskrone für sich beanspruchen dürfte).
Das Layout von Jaguar ist
hier sehr detailliert beschrieben, falls es jemanden interessiert.