News Erste Performanceangaben von AMD zu „Bulldozer“

Naja das mit Kernen muss man im Zusammenhang sehen.
3/4 Kerner haben auch 33% Unterschied und dennoch ist der 3 Kerner nicht viel langsamer, als 4 Kerner.
Natürlich ist das eher Anwendungsabhängig.

Naja ich wart am liebsten ab, bis die rauskommen und mach mir selbst ein Bild.
Hoffe, dass AMD wieder den Sprung wie damals mit Athlon 64 schafft.
 
@ Schaffe89

Stimmt, daran hab ich jetzt wieder nicht gedacht :-) Das würde den 16Kerner zwar auch nicht schneller machen aber würde für den 8 Kerner ganz schön fett Leistung (pro Kern) bedeuten wenn dieser deutlich schneller laufen kann. Was bei ähnlicher Verlustleistung anzunehmen wäre. Turbo Modus auch nicht zu vergessen.

Interessant ist noch ein anderer Gedanke....wenn sich massiv parallel arbeitende Software dann langsam wirklich durchsetzt, dann können wir genau das machen, wo wir früher jeden gehänselt haben wenn ers getan hat: Einfach die GHZ aller Kerne zusammenrechnen ;)
 
@Athlonscout
Ich sehe Bulldozer recht optimistisch entgegen. Nur ihn ohne wirkliche Daten aufgrund dieser News als Revolution zu feiern, fand ich recht absurd.
 
Erst einmal abwarten und sehen, was echte Vergleiche von Bulldozer bringen.
Intel wird sicher nicht nur mit acht Kernen + SMT aufwarten, da wird es sicher auch mehr Kerne + SMT geben.
Bis wir dann Desktop-Modelle sehen, vergeht noch etwas Zeit.
 
bensen schrieb:
@Athlonscout
Ich sehe Bulldozer recht optimistisch entgegen. Nur ihn ohne wirkliche Daten aufgrund dieser News als Revolution zu feiern, fand ich recht absurd.

Ich hatte halt nicht mit einer IPC Steigerung pro Kern gerechnet.

Gespannt darf man sein, wie sich ein Modul in SingleCore Anwendungen verhält.
 
Jetzt habe ich nochmal rumgekramt und doch noch eine Performance-Zahl in nem älteren Artikel gefunden.

According to AMD's roadmaps, Zambezi will use either 4 or 8 Bulldozer cores (that's 2 or 4 modules). The quad-core Zambezi should have roughly 10 - 35% better integer performance than a similarly clocked quad-core Phenom II. An eight-core Zambezi will be a threaded monster.

In dem Artikel steht (auf der ersten Seite), dass der zweite Integer-Kern im Modul +50% Die-Fläche kostet. Das ist meines Wissens nach schon häufiger dementiert worden, die richtige Zahl soll bei 5% liegen, was auch den ganzen Witz bei Bulldozer ausmacht: doppelte Leistung für 5% mehr Fläche (bei manchen Anwendungen zumindest).
 
Eventuell liegt der Fokus von AMD auch weniger in mehr Leistung pro Takt, sondern in einer ganz anderen Richtung.
Möglich, dass man Intel mit mehr Kernen und Effizients angreift, welche deutlich billiger zu produzieren sind, da kleineres Die.
 
Versteh ich das jetzt richtig, dass ein bulldozer Kern eine mischung aus 2 kleineren Kernen ist ?
 
Ein Bulldozermodul besteht aus 2 integercores, die sich die FPU teilen.

Sieh es als eine Art optimierten Dualcore ;)
 
Versteh ich das jetzt richtig, dass ein bulldozer Kern eine mischung aus 2 kleineren Kernen ist ?

Das ist das was ich auch nicht so ganz verstehe. Bulldozer ist ja modular aufgebaut mit je zwei Kernen pro Modul, also bei nem 8 Kerner = 4 Module, soweit klar.
Allerdings steht im Sammelthread vom Luxx, dass jeder Kern eines Moduls wiederum aus zwei Teilkernen besteht, die dann wie Hyperthreading auf Hardwareebene funktionieren (CMT).

Hat also dann jedes Modul doch eigentlich vier Teilkerne?
 
Zuletzt bearbeitet:
Allerdings steht im Sammelthread vom Luxx, dass jeder Kern eines Moduls wiederum aus zwei Teilkernen

Nö, ist ein Missverständnis - da wird versucht einen Intel Core mit HT (=2 Kerne SMT) mit AMDs Modulen (=2 int. Kerne + 2 FPU -> CMT) zu vergleichen.
Die verlinkte Grafik gibt die Realität wieder: jedes MODUL hat 2 Kerne, meldet sich beim Betriebsystem mit 2 Kernen an, mehr nicht.

"Bulldozer module": Two cores in a single unit
 
Was man nicht vergessen sollte ist, dass hier direkt zwei Produkte verglichen werden. Marktingstrategie hin oder her.
Sollte im Mittel wirklich ca. 50% mehr Leistung rauspringen, ist es doch unterheblich wie diese erreicht werden. Ob nun durch erhöhtes Multithreading oder wie auch immer.

Solange die Rechenleistung/Watt steigt ist doch alles im Grünen. Die Architektur schaut interessant aus und bietet ähnlich der Phenom-Architektur viel Potential. Wenn nun noch die Probleme auf Technologieebene in den Griff bekommen werden wird dies sicherlich ein gutes Produkt. Ób nun auf dem selben Niveau wie Intel im Topbereich oder nciht ist doch in 90% der Fälle unerheblich. Hauptsache der Kunde bekommt das was er will.

Zudem sollte man beachten das AMD sowohl weiterhin auf SOI als nun auch auf high-K setzt. In Verbindung mit einem Size-Shrink bedeutet dies eine erhebliche reduzierung der Leckströme und der parasitären Induktivitäten und Kapazitäten.
Zumindest ist auf dem Papier eine Menge Potential in der Technologieebene. Weit mehr als bei Intel. Hoffentlich bekommt AMD das auch umgesetzt.
 
Ich finde, dass in der News nicht ausreichend betont wird, dass es in dem Blogeintrag ausschließlich um Server geht ("Server-Mensch", wie hier ja schon gesagt wurde).

Das bedeutet für das Performance-Beispiel, dass die 33% mehr Kerne (ich gehe davon aus, dass damit Kerne und nicht BD-Module ("Zwillingskerne") gemeint sind) auch so nicht automatisch 33% mehr Leistung bringen, denn wir reden hier von einer CPU! Auch mehr Takt bringt meistens nur unterproportional mehr Leistung.
Fair wäre es, wenn die 33% mehr an Kernen vom Magny Cours aus gesehen zur Hälfte skalieren, d. h. gut 15% höhere Leistung sind "selbstverständlich". Das hängt jetzt natürlich massiv von der Software ab, allerdings wird die Parallelisierung eher zunehmen. Also sagen wir von den "bis zu 50% mehr" bleibt die Hälfte, nach Angleichung der Kernzahl also 10%. Das lässt allerdings noch keine Aussagen über die Takteffizienz zu, da wir hier über eine CPU-Größe von 12-16 Kernen reden und natürlich alles sehr spekulativ ist (aber hey, ich zwinge euch nicht dazu, das hier zu lesen! :D)

Um das zu verdeutlichen, muss man sich vor Augen führen, dass AMD Module verwendet, d. h. schon die Skalierung der zwei Kerne innerhalb eines Moduls ist unbekannt. Sie liegt vermutlich irgendwo zwischen zwei "ganzen" Kernen und Intels HT. Ziel sind kompakte und skalierbare Multicore-CPUs.
Folgt man dem Gedanken jetzt weiter, sind nicht nur viele Kerne möglich, sondern auch Modelle mit weniger (z. B. 2 und 4 Module mit 4 und 8 Kernen), die dann relativ kompakt und folglich energiesparend ausfallend können. Was das jetzt für die Singlethreaded-Leistung bedeutet, kann jeder mal selbst überlegen (Stichwort: Taktfrequenz hochdrehen).

Wie gesagt alle noch Spekulation :)
 
Zuletzt bearbeitet:
@ Sunnyvale

Hmm, dann is das aber sehr unglücklich formuliert, denn dort steht ja:

Und jeder einzelne Kern auf einem Modul hat intern 2 weitere Kerne, die es dem Kern erlauben, mehr als einen Thread zu nutzen, ähnlich wie Intels SMT, nur mit dem Unterschied, dass jeder Bulldozer Kern jeden Thread mit eigens reservierter Hardware verarbeiten darf und so die Verarbeitung schneller ausführen kann.

Was für mich heißt: 1 Modul = 2 Kerne = 4 CMT Kerne
 
Zuletzt bearbeitet:
Ja, steht da in einem anonymen Forum von unbekannten Autor und diese "exklusive" Information war noch nirgendwo anders zu lesen. ;)
AMD hat selbst vor kurzem geäußert, weiterhin mit "echten" Kernen zu arbeiten.
Sollten tatsächlich virtuelle Kerne im Spiel sein, müssten die doch irgendwie dem Betriebsystem bekannt gemacht werden, wie sollen die sonst genutzt werden?

Wie gesagt, meiner Meinung nach ist da irgendwas in der Übersetzung schief gegangen.
Auch der Rest des Textes ist auch nicht in allen Belangen vollkommen schlüssig.

und letztlich waren die Q9000er noch schneller bei gleichem Takt
Diese Aussage würde ich etwas vorsichtiger dosieren.
Ja, der einzelne Kern ist pro Takt schneller.
ABER: schau mal auf Benchmarks / Anwendungen, die von Multithreading profitieren - der Skalierungsfaktor bei AMD ist deutlich besser, so dass die Phenoms gerade in einigen "anspruchsvollen" Szenarien am Ende mindestens aufholen.
 
Zuletzt bearbeitet:
Naja wär ja nich virtuell, sondern auf Hardwareebene, da die Kerne bei CMT real existieren.

Aber hast ja recht, ist alles nur spekulativ.
 
Damit wäre ich mal ganz vorsichtig. Ich denke, bei Intel gibt es Pläne in der Schublade, da kann AMD nur von träumen
Intel hat bisher noch keine SOI-Produkte zeigen können. Über die Vorteile von SOI brauch ich aber denke ich kaum weiter ausholen. Besonders im Zusammenhang mit einem Struktur-Shrink.

Ausserdem nicht vergessen, dass die AMD- oder nun GF-Prozesse sind keine reine Eigenentwicklung von AMD/GF sind, sondern in Zusammenarbeit mit IBM entstanden sind.
Intel ist wesentlich konservativer auf der Technologieebene und wagt weniger Experimente. Allerdings haben sie den 32nm-half-node als erste gewagt. Daher der augenblickliche Vorteil.

Dennoch ist das aktuelle Portfolio von AMD/GF sehr atraktiv und interessant. Ob nun die Umsetzung ebenfalls was taugt, dass wird man natürlich erst noch sehen.
 
Zuletzt bearbeitet: (ein "k" wurder verschluckt, was den Sinn doch deutlich verfälscht hat ;))
Wenn auf der Hauptseite stünde, bei AMD sind die Entwicklungslabore abgebrannt, dann würden Einige das hier auch noch abfeiern nach dem Motto "AMD macht Intel jetzt richtig Feuer".

Aus Privatanwendersicht und ganz besonders für Spieler kündigt sich da ein mächtiger Flopp an und das wäre wahrlich schlecht für uns alle. Was wir dringend benötigen ist eine möglichst hohe IPC bei großer Taktfreudigkeit. Mehr Kerne in der Breite sind im professionellen Bereich natürlich leicht auszulasten, aber uns nutzt das Nichts oder glaubt wer an Spiele, die mal eben auf 8 oder 16 Kerne skalieren und sich ganz von der Single-Thread-Leistung abkoppeln?

Zambezi braucht mindestens die IPC eines Lynnfield um die alte K10-Architektur würdig abzulösen oder müsste eben entsprechend höhere Taktraten mitmachen (>4Ghz). Ersteres glaube ich nach diesem AMD-Blogeintrag eher nicht mehr, letzteres wird man sehen, aber nicht vergessen, dass GF mit dem Prozess ebenso Neuland betritt, wie AMD mit der Architektur.
 
Killermuecke schrieb:
Jetzt habe ich nochmal rumgekramt und doch noch eine Performance-Zahl in nem älteren Artikel gefunden.



In dem Artikel steht (auf der ersten Seite), dass der zweite Integer-Kern im Modul +50% Die-Fläche kostet. Das ist meines Wissens nach schon häufiger dementiert worden, die richtige Zahl soll bei 5% liegen, was auch den ganzen Witz bei Bulldozer ausmacht: doppelte Leistung für 5% mehr Fläche (bei manchen Anwendungen zumindest).

Die Angabe "50%" erscheint sinnvoll, sind es doch die ALUs, die auf dem Die in aller Regel den größten Platz beanspruchen - mal von Caches (Speicherzellenfelder) abgesehen. Bei iNtels "SMT" heißt es, daß mit 5% mehr Platzanspruch auf einem Die zwei logische ALUs abgebildet werden können. Wie die eher wenig aussagenden Bildchen, die AMD bereits zur Architektur-Skizze des Bulldozers in Umaluf gebracht hat, verraten, spart der Chiphersteller viel Platz damit ein, den L2-Cache pro Modul einmal einzubauen - wie den L3-Cache teilen sich die Kerne diesen und es bleibt abzuwarten, wie das Design en Detail aussieht. 5% Platzanspruch ist zu wenig, 50% aber vielleicht zuviel, aber das weiß ich nicht genau.


Athlonscout schrieb:
Ich hatte halt nicht mit einer IPC Steigerung pro Kern gerechnet.

Gespannt darf man sein, wie sich ein Modul in SingleCore Anwendungen verhält.


AMD hat die FPU intelligenterweise 'halbiert', zumindest suggerieren das die bisher veröffentlichten Diagramm. Je eine 128 Bit breite ausführende Einheit bilden eine FPU. Eventuell können so die beiden Kerne eines Moduls besser ausgelastet werden. Aber soweit ich weiß, hängt das auch stark davon ab, wie gut die 'Scheduler' sind. Irritierend erscheint mir, daß sowohl die Pipelines als auch der L2-Cache pro Modul quasi das gesamte Rechenwerk umspannen. Hier könnte es unter Umständen zu Engpässen kommen, die ähnlich wie seinerzeit bei Intels SMT/HT zu Leistungsabfall bei FPU-lastigen Anwendungen führte. Allerdings könnte ich mir auch sehr gut vorstellen, daß eben dieses Design zu einem wesentlich besseren FPU-Durchsatz führen könnte - was ich sehr begrüße, denn weder Intels FPU-Krampf noch das AMDsche Athlon-Relikt sind irgendwie besonders hervorragend. Auf Intels Kernen schaltet man bei wissenschaftlichem Rechnen besser das SMT komplett ab, wie ehedem beim P4 kann man damit in den meisten Fällen bis zu 15% mehr Leistung bei rechenlastigen Aufgaben aus einem Kern holen.
Der Teufel steckt aber wie immer im Detail. Zum einen entscheidet ein geschickter Datenfluß die Leistung einer CPU/FPU, andererseits ist auch die Detailpflege wichtig. So war jüngst auf heise.de zu lesen, daß auf den Intel-kompatiblen Pseudo-64Bit CPUs 64Bit Fließkommaarithmetik in der Regel zwei bis drei Male mehr Taktzyklen benötigt, als die 32 bittigen Pendants. Generell sind seit der Core-i7 Architektur viele Instruktionen um ein bis zwei Taktzyklen flotter als auf dem AMDschen Silizium. Bei 'Westmere' hat man dies noch weiter optimieren können. Allerdings muß man hierzu anmerken, daß AMD seit über drei Jahren ein betagtes Design zur Anwendung bringt und Intel erst vor kurzer Zeit in diesem speziellen Punkt überholen konnte.
 
Auf gut deutsch: AMD wird weiterhin bereits vor längerem abgesetzten Produkten der Konkurrenz dramatisch unterlegen sein.

Bulldozer wird dann also lediglich eine Möglichkeit für AMD darstellen, die Taktraten erhöhen zu können und dabei mit der Leistungsaufnahme nicht durch die Decke zu schießen. Auch ein Fortschritt, aber doch ein bisschen schmal in Anbetracht dessen, wie sehr sich AMD mit diesem ominösen "Bulldozer" brüstet (obwohl... AMD ist ja nicht gerade bekannt dafür, ein kleines Mundwerk zu haben).
 
Zurück
Oben