News AMDs „Steamroller“-Architektur und der kleine Schwenk zurück

Unnu schrieb:
Naja, warum Märchen?
Unbestritten ist, dass der Bulli wohl eher auf die Server zielt(e); Dass der Desktop-Markt rückläufig ist, und dass AMD die Zukunft in der APU sieht.
Das bedeutet, dass sogar AMD selbst das Spektrum für "reine" Desktop CPUs einschränkt.
Bulldozer ist es genausowenig, wie es Ive-Bridge ist, weil keine Architektur optimale Effizienz-Spitzen in Server & Desktop und Notebook-Markt gleichzeitig erreichen. Sichtbar ist es bei Intel nicht, wenn Intel momentan eine viel bessere Fertigung hat, die diese Architektur in jedem Marktsekment gut aussehen lässt.

In Grafikmarkt kann man es besser sehen, wie sich die Effizienten in Games ändern, wenn eine GPU-Die nur für Gaming optimiert wird ("Performance-GPU") oder für Gaming und Profi-GPU ("High-End"). Schließlich benutzen beide die selbe Fertigung.

Und nur weil AMD APU macht, heißt es nicht, dass sie sich vom Gaming-PC_Markt distanzieren. Vorallem hat Intel selber in allen Desktop Quad-Core eine iGPU drinnen.
Es wurde einfach damals falsch verstanden, dass AMD in Zukunft in der CPU-IP-Entwicklung HSA mitberücksichtigt. Da glaubten einige und das ziemlich lange, dass AMD aufhört generell die CPU-IP zu entwickeln oder die CPU-IP zu 100% in Richtigung APU (was immer das bedeutet) zu entwickeln.

Genauso wurde früher behauptet, dass AMD keine High-End-Grafikkarten mehr macht und sich somit etwas aus dem Grafikkarten-Markt zurückzieht. Weil AMD seit kurzem langfristig eine Grafikkarten-Generation (=1 Jahr) die Performance-Krone der Single-GPU-Karten besitzt und GK110 erst im Refresh-Jahr kommt, wurde dieses Märchen entgültig widerlegt.
Damals hatte es auch viele falsch verstanden, dass man die Performance-Krone über einen neuen Weg bzw. Richtgung erreichen will. Und dieser hieß Effizienz und schneller Umstieg auf neuer Fertigung.

So wie es schon angesprochen hat.
AMD hat in den letzten paar Jahren/Quartale begonnen, Bulldozer in einen automatischen Desgin stand Handerzeugten Desgin herzustellen. Zwar bringt das am Anfang einige Nachteile und kompensiert einige Technik-Fortschritte, aber später kann AMD eben schneller entwickeln. Denn neue CPU-Techniken/Features können mit dem automatischen Verfahren viel schneller einbauen werden, wodurch sie mehr Entwicklungsschritte machen können, was höhere Effizienz/Performance-Steigerungen bedeutet.

Also man muss sehr vorsichtig mit Aussagen & Co sein.
Ein Ende des alten CPU-Performance-Kampf im Gaming-PC-Markt kann vieles heißen.
- keine Big-CPUs-Dies herzustellen (bisher nicht geschehen)
- Berücksichtigung von HSA bzw. APUs
- automatische Desgin-Entwicklung anstatt per Hand
--- um die Entwicklungszyklen zu reduzieren
--- oder die Entwicklungssprünge zu erhöhen
 
Digitimes erwähnt mit 3 Worten dass Excavator 2015 kommt. Anandtech mit 3 Worten dass Excavator 2014 kommt. Und woher weißt du dass Digitimes recht hat?

Wie kommst du auf 10% Mehrleistung bei Haswell und 10% mehr Verbrauch? Intel spricht von mindestens 10% IPC. Die höhere TDP kommt wohl nur von dem stärkeren Grafikpart.
Woher kommen deine Angaben für Broadwell?
 
Fishlike schrieb:
Oracle woher weißt du, dass Excavator revolutionär wird? HSA ist momentan noch eine schöne Sache auf dem Papier. Vor Ende nächstes Jahr kann man darüber wohl keine begründeten Vermutungen anstellen.
[...]
Auf Anandtech steht übrigens, dass Excavator 2014 kommt, mit automatisch entworfener FPU, die dadurch kleiner und effizienter wird, aber eine geringere Maximalfrequenz haben wird.
HSA ist auch in der Realität mega cool, bloß werden sich die Vorteile aufgrund der Software in Grenzen halten. HSA ist bisher auch noch zu unflexibel. Je nach Anwendungsgebiet kann man mal eine stärkere, mal eine schwächere CPU/GPU brauchen. Und eine APU muss sich trotzt der Vorteile alle Komponenten auf einem DIE teilen, womit keine Performance-Gefilden von 300 mm² und 400 mm² CPU/GPU möglich sind, da man wohl auch bei einer APU ungern über 400mm² hinaus gehen will.
Also sowohl Kaveri, als auch der Nachfolger werden meines Erachtens sehr interessant sein.
Mit Kaveri steht die erste HSA nahe Plattform an und mit dem Nachfolger für das Jahr 2014 die erste vollkommene HSA Plattform. Steht aber alles noch für 2014. Könnte bedeutet entweder mit oder ohne Excavator. Jedenfalls wird bei Excavator schon EDA-Tools im größerem Stil benützt und da steht greater performance, also muss es toll sein. :cool_alt:

Oracle schrieb:
Haswell wird ca. 10% über Ivy liegen, dabei um ca. 10% höhere Leistungaufnahme. Broadwell wird ca. 10-15% über Haswell liegen bei gleicher Leistungsaufnahme. Die Grafikeinheit von Broadwell wird dabei zwischen 25 und 50% stärker als die von Haswell sein, womit man zwischen Trinity und Llano wäre. Dazu kommen dann aber Treiberprobleme und weniger Features.
Also ab hier, hätte ich auch gerne eine Quelle für all diese Zahlen :D
Ich kann nur Sachen lesen wie 10% mehr IPC und vllt. 5% mehr Takt und von 10% mehr Stromverbrauch sehe ich nirgendwo etwas. Ich sehe nur alte TPD-Klassen, wo ich nicht weiß wie viel davon wirklich auf die CPU-Rechenkerne entfallen.
Ich weiß auch nicht woher du die Broadwell Zahlen hast, einfach die Rechnung von Haswell wiederholen?

Fishlike schrieb:
Digitimes erwähnt mit 3 Worten dass Excavator 2015 kommt. Anandtech mit 3 Worten dass Excavator 2014 kommt. Und woher weißt du dass Digitimes recht hat?
Wann hat das Anandtech geschrieben und wann hat das Digitimes geschrieben?
Also ich weiß das Anfangs die Roadmaps natürlich alle 2014 gezeigt haben, bis Digitimes meinte es wird auf das Jahr 2015 verschoben, was ich eig. schon fast blauäugig annehme, da Trinity und Vishera sich verspäten, da GloFo auch ihren Zeitplan nicht einhalten können und das im Grunde in der Industrie kaum jemand schafft. Auch Intel kommt sogar ins Straucheln.
Steamroller wurde jetzt auf H2 2013 verschoben mit Kaveri, die anfangs noch auf H1 verschoben wurden, aber da Trinity nicht aus der Höhle kam, "scheinbar" noch so viele Llano im Lager waren und man wohl noch weitere Probleme hatte, musste man wohl verschieben, um das Profitabilitäts-Fenster zu erhalten. Also Server-Dies von Steamroller könnten 2013 Q4 vom Band laufen und vielleicht sogar erhältlich sein. Das zwingt uns für ungefähr H2 2014 auf eine Excavator APU zu warten und noch mehr für eine mögliche CPU. Jetzt müssen wir noch schauen, wann die 22nm ready sind, um darauf produzieren zu können und ab hier hört meine Weisheit auf :lol:
Ich weiß ehrlich gesagt überhaupt nicht, wann GloFo bereit für 22nm ist und ob es da nicht auch wieder Verschiebungen geben wird. Also 2015 erscheint auf jeden Fall nicht für ausgeschlossen.
 
Zuletzt bearbeitet:
Also Digitimes hat es am 8. Mai geschrieben. Wie lang war das bei Anandtech her. Hmm mal überlegen. Ich glaub das war gestern :D

We won’t see these new libraries and automated designs in Steamroller, but rather its successor in 2014: Excavator.

http://www.anandtech.com/show/6201/amd-details-its-3rd-gen-steamroller-architecture/2

Ob es wirklich so kommt will ich nicht behaupten aber momentan gibt es eben kein richtigen Termin für Excavator.

HSA finde ich auch sehr gut aber momentan gibt es eben noch keine Verwendung davon. Das meinte ich mit meiner Aussage.
 
Diese ganzen Spekulationen über 2014 und 2015:
Selbst die, die es wissen sollten, wissen es nicht. Gehe doch mal in die Chefetage von Intel oder AMD und frage, was 2014 heraus kommt. Mehr als mitleidiges Schulterzucken wird da wohl nicht kommen.
Somit würde ich einfach aufhören darüber zu spekulieren. Bringt eh nichts.

Das automatischen Design, worauf der BD basiert war ja einer der Gründe, warum die CPU nicht wie erwartet performt hat. Manuelles Design wie Intel es macht ist da viel Arbeit und Zeitaufwendiger aber hat auch einige andere Vorteile.

[Stark vereinfacht gesagt]:
Ein automatisches Design heißt ja nicht, das man gar nichts mehr machen muss, sondern dahinter steckt ja eine von Menschen geschriebene Software, die ja auch geändert, optimiert und gepflegt werden muss.
Bei Intel sitzt da jemand der Ahnung davon hat und bastelt fleißig Schaltkreise und Leiterbahnen.
Bei AMD sitzt da jemand der Ahnung davon hat und erklärt dem Programmierer, wie die Software nun geändert werden muss, damit die automatisch das macht, was die machen soll.
Da die ganze Sache doch wohl komplexer ist als Bienenstich zu backen dauert es Jahre, bis so ein automatischer Design zufriedenstellend funktioniert und wird auf Grund von ständiger Optimierung der CPU auch nie wirklich fertig.

Man kann sich natürlich darüber streiten, welcher Weg der richtige ist. Da ich in der Automatisierung arbeite, bevorzuge ich natürlich die Kontrolle über das zu haben, was da gerade entsteht anstatt mich auf eine Software zu verlassen, die etwas eigenes erstellt und ich keinen direkten Einfluss darauf habe.

OT: Hier in Brasilien gibt es keinen Bienenstich. Hätte jetzt aber doch mal wieder gerne einen.:rolleyes:
 
Auch Intel benutzt für einen großen Teil der CPU ein automatisiertes Design. Nur klappt das wohl besser als bei AMD ^^ 1,4Mrd Transistoren von Hand zu setzen wäre doch etwas zu viel Arbeit.
 
Oracle schrieb:
22nm/20nm wird mit Excavator zusmammenkommen. Bei diesem Shrink werden bei GloFo zudem die 3D Transistoren eingeführt werden.
Hast du das aus der Quelle entnommen die ich dir geschickt habe? Unten steht ein Update, wo drauf steht das die FinFET Sache nur eine Machbarkeitsstudie in Kooperation mit ARM ist, Produkte in 22nm mit FinFETs plant man nicht. Ich denke GloFo wird da sich eher an TSMC anlehnen. 2015/16 16nm mit FinFETs?

MikelMolto schrieb:
[1]Diese ganzen Spekulationen über 2014 und 2015:
[...]
Somit würde ich einfach aufhören darüber zu spekulieren. Bringt eh nichts.

[2]Das automatischen Design, worauf der BD basiert war ja einer der Gründe, warum die CPU nicht wie erwartet performt hat. Manuelles Design wie Intel es macht ist da viel Arbeit und Zeitaufwendiger aber hat auch einige andere Vorteile.
[...]
1. Da hast du eig. schon Recht, aber es macht dennoch Spaß oder es ist toll, den Zeitrahmen vorerst vielleicht eingrenzen zu können.
Immer eine Freude, wenn ein Produkt früher released wird oder eine Enttäuschung, falls später ;)

2. Das mit den automatisierten Designs Zweifel ich an. Es gibt auch einige Copy&Paste Aufgaben und weniger Komplexe-Bereiche, wo das routing per Hand und das ganze placement zum Teil einfach nur Zeit und Geld kostet und es Sinn macht, die Software synthetisieren zu lassen. Diese Aussage von dem scheinbar ehemaligen AMD Mitarbeiter der behauptet hat 20% größer und 20% langsamer, war von vornherein zu pauschal und undifferenziert. Übrigens hat sich derweil auch sicherlich bei der Software einiges getan und kritische Bereiche wird man sowieso weiterhin per Hand craften.
Bei Bobcat und Jaguar funktionieren die EDA-Tools scheinbar wunderbar und auch die maschinelle Bibliothek wird in einer Abwandlung von der Grafiksparte wohl seit Jahren für die Optimierung der Packdichte benützt.
 
Zuletzt bearbeitet:
Schwenk zurück ist schön. Aber ist es nicht noch zu wenig?

Eine Decodereinheit pro Integerkern ist super, aber warum verbreitern sie die Integereinheiten nicht wieder auf drei Pipelines, so wie Phenom II pro Kern üblich? Vorher hat die Decodereinheit und der Integercluster limitiert. Jetzt wird halt nur noch der Integercluster limitieren. Hohe Leistung pro Kern ist damit immer noch nicht möglich.
 
@Locuza
Ich denke wie Du es sagst ist es richtig. Eine richtige Balance zwischen automatisiert und manuell ist wohl das angestrebte Ziel und bringt neben Zeit und Kostenersparnis das optimale Produkt.
Hier hat AMD wohl auch nach BD optimiert und aus eigenen Fehlern gelernt.
Naja, so falsch lag der ja mit 20% größer und 20% langsamer auch nicht, wobei die Aussage sicher zu pauschal war.
 
@ MikelMolto

Hehe, also das können wir ja gar nicht sagen. Wir haben weder ein (utopischerweise) full hand craftet Bulldozer noch einen ganz synthetisierten.
Also es sieht eher danach aus, als ob das meiste an der Architektur selber und dem fetten Leakage von GloFo lag und weniger an synthetisierten Stellen oder wäre dann Bulldozer 20% schneller gewesen und im Jahre 2013 raus gekommen?

Ich meine ich sehe das so ähnlich, wie du mit den Spekulationen für 2014 oder 2015, es ist einfach für die Katz ;)
Die Sache ist jetzt so wie sie ist und die Entwicklung sieht eig. eher positiv aus, denn negativ.
Und auch wenn das ganze natürlich schon etwas von einem starken Hauch Marketing hat, die Folie mit der gequetschten FPU sieht doch ganz cool aus.
 
Unendlichkeit schrieb:
Eine Decodereinheit pro Integerkern ist super, aber warum verbreitern sie die Integereinheiten nicht wieder auf drei Pipelines, so wie Phenom II pro Kern üblich? Vorher hat die Decodereinheit und der Integercluster limitiert. Jetzt wird halt nur noch der Integercluster limitieren. Hohe Leistung pro Kern ist damit immer noch nicht möglich.

Woher beziehst du die Information, dass die Integerpipes selbst (auch) ein Problem (Flaschenhals) waren (sind)? Nach dem was ich so gelesen habe, ist dies nicht der Fall. Wenn ich das richtig in Erinnerung habe, krebst BDv1 irgendwo um IPC 1 herum (genauere Werte sind hier völlig irrelvant), was eben bedeutet, dass mit der zweiten Pipe noch mehr als genug Reserven vorhanden sind.
Auch war die Rede davon (schon vor der Einführung von BD), dass Wald- und Wiesencode im Schnitt auch nur eine IPC von 1,5 zulässt.
Bei den Zahlen bin ich mir nicht mehr ganz sicher, aber der Punkt ist eben, dass die Integerpipes viel eher ständig verhungern und nicht mit Daten gefüttert werden, anstatt einen Flaschenhals darzustellen!

LG
 
Jetzt warten wir einfach mal ab. Das hört sich wie Bulldozer News an bis es zum Faildozer kam da waren die Fanboys nicht mehr so laut. Wir alle wissen AMD nimmt es mit Zeitangaben und Performanceangaben nicht so genau. Was ich gerade gelesen habe ist das hier http://www.pcgameshardware.de/CPU-H...igkeitsrennen-vorbei-HSA-die-Zukunft-1021150/. AMD kann nicht mehr mit Intel mithalten.

Und dieser Oracle (Orakel) hätte mal ne Auszeit verdient. Was der hier ablässt geht doch nicht. Stachelt nur auf kein Realitätssinn. Meine Glaskugel sagt Intel Fabs sind die besten. Und es ist im Besitz von INTEL und keinen Arabern.
 
Zuletzt bearbeitet:
Ich denke/vermute AMD gibt den Kampf gegen Intel auf. Kann man verstehen. AMD konzentriert sich auf andere Geschäftsfelder. Aber auch Intel tut das. Die HD Grafik von Intel steigert sich von Jahr zu jahr. AMD ist in der Zwangslage, ganz bestimmt nicht Intel.
 
Eine deutlich gesteigerte Single-Threaded-Leistung bei Steamroller klingt sehr gut.
Leider hilft es den Kunden nicht, die auf den Bulldozer gewartet haben.
Meinen 955-er würde ich gerne ersetzen. Da ist Intel im Moment die einzige Option für mich.
Mit Steamroller würde ich vielleicht wieder auf AMD setzen?
Bis dahin wird aber noch viel Zeit vergehen....
 
Flowerpower77 schrieb:
Was ich gerade gelesen habe ist das hier http://www.pcgameshardware.de/CPU-H...igkeitsrennen-vorbei-HSA-die-Zukunft-1021150/. AMD kann nicht mehr mit Intel mithalten.

Du verstehst ganz einfach die Bedeutung dieser Aussage nicht. Es geht nicht darum, dass AMD klein beigibt und sich vor Intel in der Ecke verkriecht, weil sie das Geschwindigkeitsrennen nicht gewinnen können, sondern es geht darum, dass die jetzt ihren eigenen Weg gehen und sich darauf konzentrieren, ihre Idee einer neuen Architektur durchzusetzen anstatt sich mit Intel ein reines CPU-Wettrennen zu liefern, das auf Dauer nicht zielführend ist.
 
Zuletzt bearbeitet:
Zwischen "Bulldozer" und "Steamroller" ist doch der "Piledriver" angesiedelt?!

Wo ist denn der Test zu Piledriver? An den "Bulldozer" Test hier auf CB kann ich mich gut erinnern, aber nicht an den "Piledriver" Test.

Hab ich was verpasst?
 
Zuletzt bearbeitet:
Nein, hast Du nicht. Die Vishera-Prozessoren sollten laut letzten Gerüchten Anfang Oktober kommen. Also erstmal abwarten...
 
Freddy72 schrieb:
Ich verstehe den Artikeltitel nicht.
Wo schwenkt AMD jetzt zurück?

In der Hinsicht, dass nun wieder zwei Decoder verbaut werden sollen und somit weniger der Ressourcen geteilt werden, also das Modulkonzept in einem Unterpunkt wieder aufgespalten wird.
Zuviel darf man da aber nicht hineininterpretieren, da ja immer noch Fetch, L1I, L2 und die FPU geteilt werden.
 
Zurück
Oben