News Offizielle Details zu „Bobcat“ und „Bulldozer“ von AMD

der Intel Atom hat noch reichlich Taktreserven, die Intel für Desktops mit höherer TDP sofort aktivieren könnte.
Ich denke da statt der aktuellen 1,6GHz für den Dualcore an 3,2GHz. Somit wäre Intel sofort wieder gleichauf mit Bobcat, und muss nur ein wenig an der Taktschraube drehen.
Trotzdem ist an Bobcat wohl nichts falsch, denn er belebt den Markt und zwigt Intel zu faireren Preisen für seine Mini-CPU.

@Holt:
die IPC wird für einen einzelnen Thread je Modul (ein Kern aktiv), verglichen mit K10.5 ja wohl besser sein,
nur wenn beide Kerne eines Modules arbeiten, hat der zweite gewisse Leistungseinbußen weil sich die Kerne wohl doch ein wenig gegenseitig blockieren beim Ressourcenzugriff.
Insofern ist ein Verglich mit dem PhenomII kompliziert, zumal die neuen CPUs ja wohl auch mehr Kerne haben werden. (4 Module = 8 Kerne). Also ist wohl auch immer fast die doppelte Roh-Leistung zu erwarten. Hoffentlich wird zukünftige Software noch besser multithreaded sein und mit den vielen Kernen auch etwas anzufangen wissen.
 
Zuletzt bearbeitet:
@HITCHER_I: du glaubst ja wohl nicht dass ein atom mit 3,2GHz noch eine schöne TDP hätte. dann wäre Bobcat wegen der Akkulaufzeit schon attraktiver als der Atom ;)
Und ich glaub selbst dann hätte der Atom Probleme, da der Bobcat einen Out-of-Order Architektur hat, was doch schon einiges ausmacht.
 
Ralf555 schrieb:
Die siehst du in verschiedenen Spielen. Der Link bringt nichts, kannst gerne gleich 2560er Benches bringen. Beweist leider gar nichts. Zumal timedemos oder saves geringer Auslastung das Bild leicht verfälschen können. Kannst dir gerne mal Spiele ansehen wo CPU Leistung gefragt ist: Supreme Commander, GTA4, Flight Simulator usw. Leider macht sich kaum jemand die Mühe solche Spiele ordentlich zu testen.
Du meinst sowas hier?



Oh, dann ist ja der AMD sogar deutlich schneller, wenn CPU Performance gefragt ist. Danke für den Hinweis.
Geht es schon wieder mit Rosinenpickerei los? Spiele können eine CPU nicht annähernd auslasten wie Anwendungen, die nicht so von GPU und I/O abhängig sind. Also bitte höre mit diesen Märchen auf von wegen "wo CPU Leistung gefragt ist". Das ist alles mehr als relativ. :rolleyes:


y33H@ schrieb:
Weil es extrem zeitaufwendig ist, x CPUs neu zu testen.
GPU-Limit :rolleyes: Die Lücke sieht man ohne GPU-Limit wunderbar, siehe beispielsweise Starcraft II.

Darauf habe ich jetzt nur gewartet. Rosinenpickerei ohne Verstand und Sachwissen. Es gibt kein "ohne GPU-Limit". Die GPU ist IMMER (!) ein limitierender Faktor. Begreif das doch endlich mal. Das Verhältnis zwischen CPU, GPU und I/O ändert sich lediglich bei verschiedenen Settings. Das ist die Kernproblematik. Deshalb beeinflusst keine Komponente die Ergebnisse plötzliche nicht mehr. Zudem ist dein buntes Bildchen ohne einen Auslastungsnachweis der CPU völlig wertlos. Was willst du denn damit beweisen? Dass ein i7 mehr Power für zukünftige Spiele hat? Tolle Sache, wo das Spiel doch gerade mal vernünftig Last für 2 Kerne erzeugen kann. Bei diesen Settings spielt auch niemand. Erst recht, wenn man eine GTX 480 im Rechner hat. Der Test ist einfach weltfremd. Und wenn ich dich nochmal daran erinnern darf, was du zitiert hast ("das einzig wichtige ist nur die Rohleistung die am Ende bei heraus kommt"). :rolleyes:
Und jetzt tue uns bitte den Gefallen und erspare uns deinen erneuten Spam. Das ist hier nicht das Thema. Deine falschen Behauptungen hast du schon oft genug in anderen Threads kolportiert. In Spielen bei praxisnahen Einstellungen gibt es im Schnitt kaum Unterschiede zwischen AMD und Intel. Ausnahmen bestätigen bekanntlich nur die Regel. Eine "gigantische Lücke" ist maximal Wunschdenken. Finde dich damit ab. Das Thema ist Bobcat und Bulldozer. Also beschränke dich bitte auf diesen Sachverhalt.
 
Zuletzt bearbeitet von einem Moderator:
So wie das aussieht könnte in eineinhalb Jahren in meinem Rechner ein Bulldozer Northern Island beackern :D.
 
bernd n schrieb:
So wie das aussieht könnte in eineinhalb Jahren in meinem Rechner ein Bulldozer Northern Island beackern :D.

Sieht bei mir ähnlich aus. Hoffe inständig, die neue Plattform wird nicht soooo viel teurer. :)
 
Bin auch dabei !
Hab noch einen x2 4800+ Sockel 939.
Der hat mir immer treu gedient, als nächstes kommt ein Bulldozer !!!
 
Nicht nur laut Volker, sondern vor allem laut AMD selbst.
 
"Prozessorgeflüster " in der c't 19/2010:
http://www.heise.de/ct/artikel/Prozessorgefluester-1064662.html
Performancevergleich Magny-Cours (12 Kern) vs. Interlagos (8 Modul/16 Kern)
SpecInt
Integer Performance: +70% bei 33% mehr Integer Kernen. (12 vs. 16)
FPU Performance: +30% bei 33% weniger FPU Einheiten. (12 vs. 8)

Auch scheint die FPU nicht auf den Level 1 Cache zuzugreifen (FPU-Bypass)

Das Frontend wirkt etwas schwach dimensioniert, bietet etwa nur vier x86-Decoder (Fast Path) für das gesamte Modul – so viele hat Nehalem für einen Kern alleine, wenn auch hier die Decoder gleich zwei logische Kerne zu füttern haben. Der aktuelle AMD K10 weist pro Kern immerhin drei schnelle Decoder auf. Mit seinen 8 Modulen – also je nach Sichtweise 8 bis16 Kernen – soll der Bulldozer-Serverchip Interlagos rund 70 Prozent mehr Integer-Performance (SPECint) als der 12-Kerner Magny-Cours erzielen, das sieht demnach nicht wirklich nach einem „verhungernden“ Frontend aus. Neben dem dicken Interlagos mit bis zu 8 MByte L3-Cache für alle Module auf dem Chip will AMD halb so große Chips für Server (Valencia) und High-End-Desktop-PCs (Zambezi) herausbringen.

Für Gleitkommaberechnungen hat Interlagos im Vergleich zu Magny-Cours zwar ein Drittel weniger Rechenkerne zu bieten, dennoch soll bei ihm dank AVX und FMA und besserer Speicheranbindung die SPECfp-Rechenleistung um ein Drittel höher liegen. Dabei sind die FPUs noch nicht einmal an dem kleinen L1-Cache angeschlossen. Einen L1-Bypass für die FPUs, den hatte Intels wenig erfolgreicher Itanium auch – hoffentlich ist das kein schlechtes Omen …
 
70% mehr bei 33% mehr Integer-Kernen sind ein großer Sprung (grob Nehalem-Niveau!), die FPU sieht überzeugend aus. Sollte das so weiter gehen, wird Bulldozer wohl zumindest im Server-Markt mit SB mithalten können - Desktop aber nicht.
 
Wie kommst du zu der Einschränkung dass Server: ja und Desktop: nein?
Erklärst du das bitte mal ohne Spiele?
 
Im Servermarkt muss der Durchsatz stimmen und das stimmt wohl beim Buldozer.

Im Desktopmarkt muss die Single-Thread-Performance stimmen und wie die das mit zwei Integer-Alus vs. drei Integerallus pro Thread bei Intel schaffen wollen, ist zumindest bis zum Release von Buldozer ein großes Geheimnis und darf durchaus angezweifelt werden, dass das so schaffbar ist.^^

https://www.computerbase.de/forum/t...bcat-und-bulldozer.777498/page-8#post-8376199

https://www.computerbase.de/forum/t...bcat-und-bulldozer.777498/page-9#post-8377526
 
Zuletzt bearbeitet:
@ Complication

silent-efficiency hat's schon angedeutet, Desktop ist noch viel mit Single- und Dualthreaded und hier ist Intel seit dem Core 2 weit in Front und Sandy Bridge legt die Latte noch höher und noch mal einen verbesserten Turbo oben drauf. Bulldozer muss also nicht nur bei extremem Multithreading gut sein, sondern auch darunter.
 
http://www.xtremesystems.org/forums/showthread.php?p=4525800#post4525800
So with some frequency scaling a Zambezi core will be about 126% faster than a core running in a 2.3GHz MC without turbo. This would equal a 5.2GHz PhII core.
http://citavia.blog.de/
For example the integer scheduler became a unified scheduler. So instructions are no more bound to a certain ALU/AGU but can be send to any unit if it is available. Well, more on that later.

Another interesting task will be to go through all the speculations and check, which turned out to be true and which didn't and why. You'll also remember the 4 ALU / 3 AGU / 4 FP op thing found in the Open64 compiler source code. And there was also this "accelerate mode" mentioned in a GCC mailing list posting. To me it seems it's still not clear how exactly the Bulldozer units work together, how their clock frequencies are related (e.g. are they all the same or different) etc. AMD didn't publish a pipeline diagram for Bulldozer as they did for Bobcat - surely for a reason.

Wenn +70% bei 33% mehr Kernen ist das durchaus eine höhere Integer Singelthread Performance als bisher angenommen wurde.
Wenn +30% bei -33% FPU Einheiten ist auch hier eine deutlich höhere Singelthread Performance als bisher angenommen.

Bisher ging ja jeder von +50% bei +33% Kernen aus, weil die FPU und Integer Performance grob in die Performance Rechnung eingingen. Jeder hat die 16 Integer Einheiten als Masstab genommen und dabei ausser acht gelassen dass es nur 8 FPU Einheiten sind.
Durch die Aufdröselung der Integer und FPU Performance wird deutlich dass die Singlethread Performance genau das ist was am meisten gesteigert wird beim Bulldozer

Integer:
Magny-Cours: 100% mit 12 Integer Kernen
Bulldozer: 170% mit 16 Integer Kernen =>

FPU:
Magny-Cours: 100% mit 12 FPU Einheiten
Bulldozer: 130% mit 8 FPU Einheiten =>
 
Das klingt gut, wobei 12 zu 16 bei +70% pro Kern wieder anders aussieht. Ich bin echt gespannt :D
 
Durch die Aufdröselung der Integer und FPU Performance wird deutlich dass die Singlethread Performance genau das ist was am meisten gesteigert wird beim Bulldozer

Also für den Laien (also mich^^) heißt das: mehr IPC?
 
Wie auch immer du das nennen willst, es wird nun spekuliert dass der Singlethread ca. einer Performance des Phenom II bei 5,2 GHz entsprechen könnte - aber wie gesagt: höchst Spekulativ. IPC ist eine absolut unwichtige Kennzahl, da diese nur einen Teilaspekt der Single Thread Performance beschreibt.
http://de.wikipedia.org/wiki/Instructions_per_cycle
Dieser Wert dient als Maßstab für die Effizienz einer Architektur, weil das Produkt aus IPC und Taktfrequenz die Anzahl der pro Sekunde ausgeführten Befehle (Instruktionen pro Sekunde) ergibt. So kann ein Prozessor mit IPC=1 und f=500 MHz theoretisch genauso viele Befehle ausführen wie ein zweiter mit IPC=0.5 und f=1000 MHz. Allerdings schränken Faktoren wie das Pipelining die Vergleichbarkeit erheblich ein.

http://de.wikipedia.org/wiki/Pipeline_(Prozessor)
Statt eines gesamten Befehls wird während eines Taktzyklus des Prozessors nur jeweils eine Teilaufgabe abgearbeitet, allerdings werden die verschiedenen Teilaufgaben mehrerer Befehle dabei gleichzeitig bearbeitet. Da diese Teilaufgaben einfacher (und somit schneller) sind als die Abarbeitung des gesamten Befehls am Stück, kann durch Pipelining die Taktfrequenz des Mikroprozessors gesteigert werden. Insgesamt benötigt ein einzelner Befehl nun mehrere Takte zur Ausführung, da aber durch die quasi parallele Bearbeitung mehrerer Befehle in jedem Zyklus ein Befehl „fertiggestellt“ wird, wird der Gesamtdurchsatz durch dieses Verfahren erhöht.

Bestes passende Beispiel: Bobcat hat eine Out-of-order Architektur während ein Atom eine In-Order Architektur hat.
befehlspipeline-png.199958


Nur um das klar zu stellen - hier werden nciht mehrere Kerne dargestellt, sondern das verarbeiten der Befehlssätze innerhalb eines Kerns.
 

Anhänge

  • Befehlspipeline.PNG
    Befehlspipeline.PNG
    7,7 KB · Aufrufe: 633
Zuletzt bearbeitet:
Kann man daraus ableiten, dass die FPUs intern mit doppelten Takt laufen?
 
Zurück
Oben