News AMD: „Llano“ kommt vor „Bulldozer“ in den Handel

Nur weiß keiner, ab alle Llano auch die gleiche Grafik haben. Wer sagt denn, dass Llano mit zwei Kernen nicht eher so eine Grafik in Richtung "Zacate" bekommt, während es da auch nur bei den größeren CPUs auch größere Grafik gibt? Sabine für Notebooks wird sicher nicht immer auf die volle Ausbaustufe setzen, da würde ich drauf wetten.
 
Vidy_Z schrieb:
Wenn du wissen wilst wo es mit Llano hingeht, dann ist es vielleicht keine schlechte Idee zu wissen wo er her kommt. ...

Dazu musst du nun aber nicht die Intel Geschichte auspacken, sondern einfach nur etwas auf einen aktuellen Athlon II drauflegen. Deine Intel Erzählungen bringen nichts um die Leistung von Llano einzuschätzen.
 
Vidy_Z schrieb:
Schwierig, da der Core II ja nicht viel mehr als eine desktopfähige Variante des Core darstellt.
Das ist nicht richtig. Core 2 (Core Architektur, Merom) war tatsächlich der architektonische Nachfolger des Core (Yonah). Das hatte mit "desktopfähig" nichts zu tun. Core war im Grunde nicht viel mehr als ein doppelter Pentium-M, dem man einen shared L2 spendierte. Erst mit Core 2 wurde dann auch die Architektur grundlegend weiterentwickelt, zB von 3-fach auf 4-fach superskalar, eine 128-bit FPU, x86-64 Support, usw. Zwischen Core und Core 2 lagen im Schnitt etwa 20% bei gleichem Takt. So wie eben auch zwischen K8 und K10. Wobei das je nach Cachebestückung variiert. Der Desktop Ableger von Merom hiess Conroe.

Vidy_Z schrieb:
ich tippe aber eher auf den Zeitraum, in dem Intels Mobilprozessorentwicklungsteam in Israel den Pentium M zum Core weiterentwickelte.
Da tippst du falsch. Wie gesagt, Core (Yonah) ist nicht viel mehr als ein doppelter Pentium-M. Diese sind pro Takt vergleichbar mit K8 bzw dem Dual Core K8. Der Unterschied war, dass Pentium-M und Core lediglich im Mobilbereich eingesetzt wurden und dementsprechend mit niedrigerem Takt liefen. Dennoch hatte AMD zu diesem Zeitpunkt immer noch die überlegene Architektur insgesamt. Was sich vor allem darin begründete, dass man x86-64 unterstützte. Das konnten Pentium-M und Core nicht. Der Sprung von Intel kam erst mit Core 2 (Merom).

Vidy_Z schrieb:
Große Sprünge waren in jedem Fall:
486 > Integration der Gleitkommaeinheit, eines Risc-Befehlssatzes sowie First-Level-Caches in die CPU
Nx586 > Integration eines vollständigen Risc Kerns, einer Übersetzungseinheit und eines Second-Level-Caches in die CPU
K6 > Sprungvorhersage und Out-of-Order-Execution
K7 > Mehrkernarchitektur und 64bit Befehlssatz
P4 > Hyperthreading
Pentium M > die Innovation war es, die Philosophie die hinter der Netburst Architektur steht ins Gegenteil zu verkeren(Das muss man sich erst mal trauen!).
Core > Abschaltung nicht verwendeter Prozessoreinheiten zur Laufzeit, Taktanpassung
Core II Quad > „auf ein Die schmeißen“ zweier Core II Duo CPUs
Fusion > Verschmelzen von CPU und GPU
Bobcat > gnadenloses minimalisieren der K8, K7(?) Architektur auf den kleinst möglichen Nenner
Bulldozer > Zusammenfügen zweier Kerne via Modul-Architektur
Nun ja, so viel hiervon ist keine wirklich technische Neuerung. Vieles davon ist geklaut, zB das SMT des P4, kam bei anderen ISAs ausser x86 schon zum Einsatz oder ist ein eher inkrementeller Schritt. Ausserdem hast du Fehler in deiner Aufzählung. Multicore und x86-64 gab es erst mit dem K8.

Wirklich technische Neuerungen sehe ich bei:
- OoO (IBM POWER)
- SMT (DEC Alpha)
- CISC/RISC Hybrid (Intel Pentium Pro)
- Leistungsregulierung (AMD PowerNow, Intel SpeedStep)
- AMD64 (64-bit ISA mit Abwärtskompatibilität)
- integrierter MC/Northbridge (DEC Alpha, AMD K8)
- CMT (Sun Rock, AMD Bulldozer)
- Fusion

Vidy_Z schrieb:
Die Änderungen die der K10 brachte sind einfach nicht radikal genug um sich in diese Liste einzureihen.
Die des Core 2 dann allerdings genauso wenig. Ausserdem ist eine solche Betrachtung relativ. Immerhin war der K10 das erste monolithische x86 Quad-Core Design. Auch die Cache Hierarchie war eine grundlegende Neuerung (auch wenn es L3 schon davor gab).

Vidy_Z schrieb:
Der Phenom war eher die Um Ordnung schon vorhandener Ressourcen, weshalb die immer wieder betonte einzig wahre weil „native“ Umsetzung eines 4 Core Designs, die zudem eine halbe Ewigkeit auf sich warten ließ um obrndrein viel zu heis zu werden, bei weitem nicht den erhofften Erfolg brachte.
Was heisst zu heiss? Agena wurde nicht heisser als Kentsfield. Und das, obwohl bei Agena die Northbridge integriert war.

Vidy_Z schrieb:
Man könnte es auch so sehen: AMDs Innovative Phase begann mit der Übernahme von NexGen und endete mit der Verabschiedung von Dirk Meyer. Danach beschränkte sich die Firma fast ausschließlich darauf, den größten (wirtschaftlichen) Nutzen aus den Ideen der Vergangenheit zu ziehen, während der ehemalige Vorsprung alsbald aufgebraucht war.
Eher nicht. Ganz im Gegenteil. Nach K8/K9 hatte AMD ein extrem ehrgeiziges Vorhaben, den ursprünglichen K10. Dieser war zur damaligen Zeit jedoch nicht sinnvoll umsetzbar. Aus den Ideen von damals wurde dann Bulldozer. Um mittelfristig trotzdem etwas neu auf den Markt werfen zu können, entwickelte man K8 weiter, womit auch einige Grundlagen für Bulldozer bereits geschaffen wurden. Insgesamt war das K10 Design dennoch relativ gut. Was nicht passte, war schlichtweg der 65 nm Prozess, der auf K8 und hohe Yields ausgelegt war und nicht auf Performance, wie es für K10 notwendig gewesen wäre.

Vidy_Z schrieb:
Llano hat den unangenehmen Beigeschmack der Taktleistungsunterlegenheit gegenüber Sandy Bridge.
Sehe ich überhaupt nicht so. Llano ist ein Mainstream Chip. Der muss keine Rekorde aufstellen. Ausserdem zählt am Ende wie immer Performance/Watt/Preis. Kein Endverbraucher kann mit Taktleistung etwas anfangen. Llano sehe ich vielmehr als optimalen Mainstream Multimedia Chip. Der revolutionäre Schritt liegt nicht bei der CPU, sondern der Verschmelzung aus CPU und GPU. Sandy Bridge wird hier technisch weniger bieten können.


stoneeh schrieb:
locker 2, 3 jahre zu spät. na ja, was solls. hauptsache irgendwann kommt er. glaube aber nicht dass AMD jemals wieder intel signifikant die performance krone abkaufen kann
Wenn du mit niemals jetzt meinst, dann liegst du richtig. :lol: Magny-Cours ist der derzeit schnellste x86 Chip, speziell wenn es um HPC geht. Die Performancekrone ist zudem irrelevant. Das interessiert nur Freaks wie hier. Was zählt sind vor allem wirtschaftliche Aspekte und attraktive Gesamtpakete.
 
y33H@ schrieb:
Für Office, Surfen und Co. erachte ich mehr CPU-Power als sinnvoll, Videos und Flash kann die HD-GMA nach aktuellem Stand ebenfalls.
Auch wenn die Browser der Zukunft vermehrt auf die GPU setzen? Aber klar, so einen Sandy Bridge braucht man auch unbedingt zum surfen, denn mit einem Nehalem ist man da ja 0,00000001sek langsamer unterwegs.
Und wie definiert man Gleichgewicht? Ich hab doch tatsächlich noch in der PC Games 06/2010 einen Artikel gelesen, der hieß "Das große Aufrüst-Special", da war so eine komische Tabelle, wo mehrere Prozessoren und Grafikkarten gelistet waren. Da stand doch tatsächlich, wann der Prozessor limitiert und wann die Graka bzw. welche Graka und welcher Prozessor optimal zueinander passen.

Um also nochmal zu deiner Frage mit dem Gleichgewicht zurück zu kommen: Ich würde sagen, das perfekte Gleichgewicht hat man, wenn man in dieser Tabelle den Prozessor raussucht und dann die Graka und dann schaut, wo sich die Zeile und die Spalte trifft und wann dann dort "Optimal" zu lesen ist, dann hat man ein (nahezu) perfektes Gleichgewicht.
Zufrieden mit der Antwort? Jetzt kannst du dir ja mal Gedanken darüber machen, welcher Prozzi in dieser Tabelle, wenn man CPU- und GPU-Part getrennt voneinander vergleichen würde, eher bei "Optimal" liegt: Llano oder SB?

Btw. täuscht es mich, oder warst du nicht sogar auch auf der Doppelseite zu sehen gewesen?

@Volker
Ich muss dir absolut recht geben. Die Llanos für Notebooks werden bestimmt nicht so potent werden, wie die Desktop Ableger. Trotzdem können sie ja immer noch ein gutes Gleichgewicht haben (wie ich das meine, hab ich ja weiter oben erklärt).
 
Es ist auch gut so, wenn es da eine Lösung gibt mit weniger Grafik. Ich will gar keine Kombilösung mit Grafik auf Niveau einer HD 5450 oder mehr, die aber dann bei CPU-Leistung abkackt und über meinen 3 Jahre alten Core 2 Duo nicht hinauskommt. Mit meinem Notebook arbeite ich, die Grafik spielt da mehr als nur die zweite Geige. Ich hoffe inständig, dass man eben auch die arbeitenden Leute denkt, denn zu viel Fokus auf Grafik ist da einfach nur sinnlose Verschwendung. Aber ich denke mal da kann AMD auch 1+1 zusammenzählen, denn sowas wie ne HD 4250 jetzt in den Chipsätzen reicht locker. Und das wird es auch 2011. Also Zacate-Grafik und mehr Kerne von Llano .. das wäre mal richtig interessant.
 
Man sollte doch mittlerweile mitbekommen haben, dass GPU nicht nur Grafik ist. -> GPGPU ;) Das ist auch so eine Sache, wo ich Llano im Vorteil sehe. ZB wird die GPU in Llano DirectX 11 unterstützten, also ebenfalls DirectCompute. Sandy Bridge wird lediglich DirectX 10.1 Support besitzen.

Ich sehe eigentlich nicht, dass der Mainstream Markt in Zukunft noch grossartig CPU Performance benötigt. Anspruchsvollere Aufgaben können von verschiedensten "Coprozessoren" erledigt werden, wie spezielle En-/Dekoder Hardware oder GPU Streamprozessoren. Für den Rest (Browser, E-Mail, Office, ...) sollte selbst ein Dual-Core Bobcat für angenehmes Arbeiten ausreichend sein.

Wer sich einen Performance Prozessor wie einen 4-Kern Sandy Bridge (+SMT) holt, hat eher anspruchsvollere Sachen vor, wie neuere Spiele. Und da ist eine GPU auf HD 5450 Niveau schlichtweg unterdimensioniert.
 
@gruffi
der ursprüngliche K10 ist Bulldozer @45nm, erklär mal einiges genauer was du mit ursprünglichen K10 meinst? eine unabhängige Architektur nach K7/8 aber kein BD ?
 
Bulldozer @ 45 nm war Bulldozer @ 45 nm. ;) Der ursprüngliche K10 war etwas anderes. Und ja, dieser hatte mit K8 und dessen Weiterentwicklung nichts zu tun. Wie viel er mit Bulldozer noch zu tun hat, kann ich nicht sagen. IIRC hat Andy Glew da mal ein bisschen aus dem Nähkästchen geplaudert. Für mehr Infos sollte man sich mal in den entsprechenden Newsgroups umschauen.
 
evtl. ein Design wie Nehalem mit 4x2 fach & kleine Taktraten / hohe IPC? schade das AMD das verworfen hat, vielleicht wäre das besser geworden als BD es später wird...
 
Nein, so ein Design wie Nehalem sollte es zum Glück nicht werden. So aufgebläht hätte ich mir das auch nicht gewünscht. AMD hat mit Istanbul dieses Level auch erreicht. Und Stagnation ist Rückschritt. ;)

Ich habe mal etwas von 16-fach beim ursprünglichen K10 gelesen. Inwiefern das stimmt, keine Ahnung. Vielleicht eine Kombination aus DEC Alpha und CMT? Es sollte anscheinend ein ziemliches Monster werden. IIRC hatte das der Inquirer mal geschrieben. Ich kann auf die Schnelle dazu zwar nichts mehr finden, Charlie schreibt aber hier, dass es davor anscheinend auch noch einen 8-fach K9 geben sollte.

Wie auch immer. Ich denke, Bulldozer ist da insgesamt die bessere Lösung. Der sollte bezüglich Effizienz alles bisherige in der x86 Welt in den Schatten stellen. Hohe IPC ist kein Gewinn, wenn dadurch die Effizienz leidet. Wobei man davon ausgehen kann, dass Bulldozer eine höhere IPC als K10.5 hat. Ob es für Sandy Bridge reicht, wird man sehen. Ich persönlich habe aber kein Problem damit, wenn es zB 10% weniger IPC sind, der Takt bei gleicher Leistungsaufnahme aber 20-30% höher liegt.
 
@ Lonely Shepherd

Ich habe lieber etwas mehr CPU-Leistung und eine GPU, die für alles reicht. Ich nutze privat ein X100e mit Turion X2 Neo L625 und HD 3200 und bin CPU-seitig an sich zufrieden. Hatte vorher einen Atom (ja, das habe ich mir angetan) samt einer GMA. Und wenn der Atom schon übelst ***** war, dann war es die GMA erst recht. Der von gruffi angesprochene OpenCL-Part bei Llano ist halt fein. Für's Surfen braucht's freilich keinen SB, ich denke, Llano ist für Mobile im unteren Preis- wie Leistungssegment exzellent - wer mehr will, muss für SB tief(er) in die Tasche greifen. Und ich mache mir nach wie vor (große) Sorgen um die Treiber der GMA ...

EDIT
Dass BD bei gleicher Leistungsaufnahme 20-30% höher taktet und so die vermutlich geringere IPC überkompensiert, wäre schön - aber ich kann es mir einfach nicht vorstellen. SB ist aus Performance/Watt ein großer Schritt, der Bulldozer muss wirklich der zweite "Hammer" werden. Hoffen wir, er wird es. Intel war lange genug in Front und hat ab der oberen Mittelklasse die Preise diktiert.
 
Zuletzt bearbeitet:
Mit Grafik hab ich keine Sorgen, da brauch ich auch nix, aber zwei (alte) Kerne bringen mich hier und da um. Ich hätte gern stromsparend vier Kerne, vielleicht reichen auch schon Threads, im Notebook. Damit kann man auch richtig arbeiten. Aber den Kram mit realen Kernen kann man ja nicht bezahlen oder hat dann ein fettes Monster an Notebook, dass Strom frisst wie Hölle. Also warten wir auf nächstes Jahr und sehen uns dann die Optionen an. 12 oder 13,3 Zoll mit vier Kernen und nice Stromverbrauch im bezahlbarem Rahmen wär mal awesome! Ich hoffe auf Sabine! Bitte Frau, tu es!

Zu Bulldozer: Es gibt überhaupt nix festes. Kann mir keinen Reim auf die Performance machen. Und da es ja noch fast nen Jahr hin ist, haben wir noch vieeeel Zeit zu spekulieren.
 
y33H@ schrieb:
Dass BD bei gleicher Leistungsaufnahme 20-30% höher taktet und so die vermutlich geringere IPC überkompensiert, wäre schön - aber ich kann es mir einfach nicht vorstellen.
Es geht nur überraschenderweise nicht darum, was du dir vorstellen kannst. Ich sagte das ja nicht grundlos. ;) Lies dir Dresdenboys Blog durch. Dort spricht er u.a. auch über das FO4 Design, welches anscheinend von 22 auf 17 Gates geändert wurde. Und damit könnte man genau das erreichen, nämlich 20-30% höherer Takt bei gleicher Leistungsaufnahme und nur minimal weniger IPC (5%). Folgendes dazu von Mitch Alsup:
> > When I left, BD was supposed to be 20-25% faster frequency wise, and
> > lose a little architectural figure (5%-ish) of merit due to the
> > microarchitecture. The surprising thing was the lack of mention of
> > frequency in the market-droid-ing.

> That's a lot of frequency! Is that gain from process shrink (even just
> optimization for the process)?

BD was to use a 12-gate pipeline, while Athlon used a 16-gate pipe and
Opteron used a 17-gate pipe. {Add 5 more gates for FLOP, jitter and
Skew to arrive at actual cycle time.} Process shrink is on top of his.
{K9 was to use an 8-gate pipeline.}
Mit den sonstigen Verbesserungen der Architektur sollte sich dieser IPC Nachteil aber mehr als ausgleichen und noch einiges hinzukommen. Der höhere Takt bleibt aber. Mit der besseren Fertigung, die zusätzlich Takt ermöglicht, sollte die Singlethread Performance daher signifikant steigen.


y33H@ schrieb:
SB ist aus Performance/Watt ein großer Schritt
Verglichen mit was? Netburst? Ja, da gebe ich dir Recht. Verglichen mit dem Vorgänger, Westmere, ist es bei gleicher Anzahl an Kernen und logischen Prozessoren ein eher überschaubarer Schritt. Vielleicht mal abgesehen von AVX. Bulldozer hingegen sollte in der Tat ein grosser Schritt im Vergleich zum Vorgänger, K10.5, werden, weil hier wesentlich mehr Neuerungen zum Tragen kommen (komplett neuer Kern, 32 nm, High-K, Power-Gating, Clock-Grid, usw).
 
@gruffi: war ein sehr interessantes gespräch, wieder eine Menge dazugewonnen. Es geht ja nur noch um die Auslegung, die Informationen stimmen ziemlich überein.

@BD
Beim Spekulieren steht man aber so ziemlich orientierungslos da, weil sich in der neuartigen Organisation der CPU Kerne so wenig Bezüge zu bereits bekannten Architekturen finden lassen. Ein weiteres Rätsel geben mir die Gleitkommaeinheiten auf. Für Render- Video- und Mathematiksoftwareanwender zunächst einmal erschreckend, hat sich die FP Anzahl nun also halbiert. Wettmachen soll das deren Breite von 256bit und die Möglichkeit eine FP Einheit wiederum in zwei 128bit Einheiten aufzusplitten. Ist das zum Render nun gut, ist es schlecht, macht es keinen Unterschied und, können nicht parallelisierende Anwendung im Besonderen aus der breiten Gleitkommaeinheit profitieren? Ebenso spannend: Wie wird der BD in Zukunft um weitere Kerne erweitert? Anstatt noch mehr Module auf einem die unterzubringen, könnten auch die einzellnen Module um jeweilige Kerne vergrößert werden. Bekannter Maßen würde dadurch die Chipfläche nur geringfügig ansteigen.
 
Die Anzahl der FPUs hat sich bei Bulldozer nicht halbiert. Jeder Kern hat seine eigene 128-bit FPU, so wie auch schon beim K10. Neu ist, dass es FMACs sind und einem Kern, wenn benötigt, auch zwei dieser 128-bit FMACs zur Verfügung stehen können. Und das soll alles äusserst dynamisch pro Takt funktionieren. Das ermöglicht theoretisch doppelt so viel FP Performance pro Takt und pro Kern.
 
Vidy_Z schrieb:
Wie wird der BD in Zukunft um weitere Kerne erweitert? Anstatt noch mehr Module auf einem die unterzubringen, könnten auch die einzellnen Module um jeweilige Kerne vergrößert werden. Bekannter Maßen würde dadurch die Chipfläche nur geringfügig ansteigen.

Ein Bulldozer Modul in 32nm hat 2 Cluster/integer Cores

AMD wird bei Bulldozer Version 2 oder Version 3 mit sicherheit das Modul um 3 oder 4 Cluster erweitern, dazu kommt noch mehr IPC pro Modul, dann hätte ein Modul 3 oder 4 Kerne ;)

Die AVX Einheiten wird AMD bestimmt auch mit 2x256 Bit erweitern, BD2 & BD3 werden weiter ausgebaut, mehr Cluster & mehr IPC pro Modul.
 
Zuletzt bearbeitet:
"Mit Sicherheit" würde ich nicht sagen. Es wäre aber zumindest ein logischer Schritt, mehr Integer Cluster pro Modul zu verbauen, da diese eben nur 12% an Fläche kosten, aber für über 80% des Codes zuständig sind.
 
Zurück
Oben