News AMD „Kaveri“: Architektur-Änderungen im Überblick

[F]L4SH · 5. Juli 2013

Ohne jetzt noch was zum Thema beizutragen muss ich echt mal was los werden:

Respekt pipip!
Es ist schon erstaunlich. Man merkt, dass du AMD (so wie ich) rein subjektiv vorziehst - aber dennoch sind deine Einschätzungen zu den Themen immer subjektiv, relativ neutral und vor allem realistisch betrachtet (so nach dem Motto "Eine 15W Jaguar CPU schlägt locker eine 19W ULV CPU um 50% + all meine Voraussagen in den letzten Jahren waren immer über alle Zweifel erhaben" wer das wohl ist? )

Es liest sich gut und du bist auch immer gut informiert und kannst auch öfter mit informativen Links und Wissensergänzungen aufwarten. Und das alles ohne Fanboy Schönfärberei - bitte weitermachen! Und "alle" anderen ne Scheibe abschneiden

Kein Sarkasmus...

Wie gesagt: man bemerkt die Vorliebe aber ich empfinde es alles als realistisch betrachtet halbwegs neutral und ich habe noch NIE erlebt, dass pipip jemandem mit anderer Meinung pampig kam oder zu "unlauteren" Mitteln wie dem auseinanderreißen von Kontexten oder ähnlichem erlebt.
Diskussionskultur eben.

y33H@ · 5. Juli 2013

Ein Hoch auf Sarkasmus

voll.bio · 5. Juli 2013

Früher orientierte sich die Prozess-Node an der Gate Länge. Das kann man heutzutage nicht mehr so einfach machen, da die Anbindung der Transistoren gröber sein kann. Dazu kommt die Packungsdichte: Bobcat ist vergleichsweise dichter gepackt als ein vergleichbarer Atom. Und mit FinFets fängt das Chaos dann richtig an: Glofo nennt seinen ersten FinFet-Prozess 14XM. Das ist im Grunde ein 20nm Pozess mit FinFets. TSMC nennt seinen 16nm. Glofo ist dabei mit der Angabe noch am ehrlichsten. Intels 22nm entsprechen da eher einem 26nm Prozess.

pipip · 5. Juli 2013

y33H@

Ein Hoch auf Sarkasmus

Selbst wenn, ist es mir doch egal. Ich bin kein Redakteur und abhängig von meiner Leserschaft. Deshalb muss ich mich auch nicht an Meinungen andere orientieren um die Klicks zu bekommen.
Weiteres brauch ich keine Fans, weil ich genug Freunde habe.

voll.bio
Einmal macht man so eine Rechnung und bekommt gleich einen auf den Deckel ^^
Aber ja, nimmt man SoI und Bulk her, dann wird man sehen, dass SoI wesentlich aufwändiger aber auch wesentlich besser gegen Leckströme ist. Besonders interessant wird es ja mit fd-SoI mit den man in 28 nm Quadcores mit hohen Takt zeigen konnte.

http://www.advancedsubstratenews.co...-ericssons-28nm-fd-soi-smartphonetablet-chip/

http://www.youtube.com/watch?v=S_wMzAEajO0

Somit ich erwarte mir bei 28nm in erste Linie eine bessere Ausbeute bei den APUs und eventuell günstigere Fertigung. Mit 32nm SoI würde der Chip wohl wachsen.

Das wichtig interessante an fd-SoI soll ja die Fähigkeit sein, die Transisoten so zu konfigurieren, sodass sie je nach Bedarf für Performance oder Low-Power genutzt werden sollen.
Weites sollten die Chips auch kühler laufen als im Vergleich Bulk.
Ich bin schon gespannt, wenn die ersten 20 nm fd-SoI kommen und dann deren Overclocking-Performance zeigen.
http://youtu.be/S_wMzAEajO0?t=5m37s

Ebenso können die gleichen Werkzeuge wie für Bulk angewendet werden und ist wesentlich einfacher als FinFet-Technologie zu produzieren und soll gegenüber ein 20 nm Bulk wesentlich günstiger ausfallen.

Das AMD sagt, 2015 könnten sie mit Intel wieder in Augehöhe sein wundert mich ja nicht. Intel wird nur einen Haswell Refresh in 22nm liefern, und AMD könnte vllt mit 22 nm fd SoI endlich den Rückschritt in Fertigungstechnik aufholen.

Überlegt euch doch mal. Ein A10 6700 ist ineffizienter als der i3, wobei CPU technisch wohl kaum bemerkbar machen wird. Gemittelt ist der A10 6700 vllt 10% langsamer.
In 22 nm finfet würde ein solcher Prozessor dann aber nicht mehr so schlecht gegenüber der Konkurrenz legen. Wie würde ein mancher den A10 6700 einstufen, wenn der Verbrauch der gleiche wär, wie der Intel i3 Gegenpart ?

Matzegr · 5. Juli 2013

voll.bio schrieb:
Früher orientierte sich die Prozess-Node an der Gate Länge.

Da gabs noch nen Kaiser als technology node = gate length war

Bis 1995 (350nm) passte es, danach lag man mit der gate length deutlich unterm technology node z.B. war bei 130nm die gate length nur 60nm. Beim 65 und 45nm Node lag man jeweils bei 35nm gate length.

Mittlerweile liegt Intel drüber, beim 22nm node hat man ~25nm gate length.

tm0975 · 5. Juli 2013

Kunkka schrieb:
Ich hoffe auf einen ansatzweise starken 3,5-4GHz 2 Moduler mit einer GPU im Bereich HD 7790.

genau meine meinung. richland + 25% über alles und die welt ist ok. mein trinity läuft ja schon in richland-spezifikation und ich bin sehr zufrieden damit.

y33H@ · 5. Juli 2013

pipip schrieb:
Selbst wenn, ist es mir doch egal. Ich bin kein Redakteur und abhängig von meiner Leserschaft. Deshalb muss ich mich auch nicht an Meinungen andere orientieren um die Klicks zu bekommen. Weiteres brauch ich keine Fans, weil ich genug Freunde habe.

Dafür gehst du aber brav drauf ein, verteilst diffamierende Seitenhiebe und betonst, du hättest Freunde - genau so zeigt man, dass es einem egal ist ...

Almalexia · 5. Juli 2013

Ich hoffe halt, das sie mit Kaveri den Durchbruch schaffen. Intel hat schon zu lange die Nase vorn.

Endlich mal gescheite AMD-Notebooks.

Alles gute für AMD

Kdr · 5. Juli 2013

@y33H@: wie war das mit Diffamieren? DU bist selbst nicht besser(ich auch nicht).
Ohne Wertung jetzt über Posts von pipip.

White_Eagle · 5. Juli 2013

Ich dachte immer die Desktop-Richland-APUs basieren schon auf Steamroller und Kaveri wäre nur eine bessere Fertigungstechnologie?

So ähnlich, vergleichbar wie bei Intel, auf Top folgt Flop usw., äh... Hip und Hop oder Trick und Track,
oder wie hieß das nochmal?

Also so ne Art optimierter Refresh?

pipip · 5. Juli 2013

White_Eagle
Ne Richland APU ist mehr oder weniger ein neues Stepping mit besseren/aggressiveren Turbo und offizielle DDR3 2133 Unterstützung.
Der Chip basiert also noch auf Piledriver und VLIW4 wie im Trinity.

Piledriver selbst war beim Buldozer FX ebenso ein Stepping. Somit Richland wäre die dritte Generation im gleichen 32nm SoI Prozess.
AMD hat ja beim Phenom II nicht viel anders gemacht, nur dass man ULK eingeführt hat und somit einen Phenom II x6 einführen konnte.

Kaveri bringt aber Steamroller mit GCN (2.0 ?) mit sich. Weiteres soll dieses Mal HSA Einzug finden. Somit könnte man Kaveri eigentlich als erste richtige APU bezeichnen.

y33H@
Genauso wie du nichts dafür kannst, dass dein Witz nicht angekommen ist, kann ich nichts dafür wie mein Statement angekommen ist.
Aber hey :

Ein Hoch auf Sarkasmus

White_Eagle · 5. Juli 2013

OK, thx pipip,
ich bin ja gespannt was Steamroller für den Desktop so reißt, ob da ein Wechsel vom FX 6300 lohnt.
(alles leicht verworren, Systembezeichnungen, Stepping/Fertigungstechnologien u. dann noch Unterschied zw. APU u. CPU...)

LoRDxRaVeN · 5. Juli 2013

Zumindest in seiner ersten Inkarnation, wird "Steamroller für den Desktop" an einen FX-6300 tendenziell eher nicht herankommen. Denn das wird in Form von Kaveri sein und da dieser nur mit maximal 2 Modulen angekündigt ist, wäre es schon eine große Überraschung, wenn dieser einen 3-Moduler, der nochdazu die gesamte TDP für den CPU-Part verwenden kann, überflügeln könnte. In Teilgebieten kann es aber durchaus anderes aussehen, da es nicht unwahrscheinlich ist, dass ein Steamroller-Modul in der Singlethreadperformance nennenswert gegenüber einen Piledriver-Modul zulegen kann.

Und ein FX-Steamroller, also mit bis zu vier (oder gar mehr) Modulen, ist nach wie vor nicht angekündigt...

LG

White_Eagle · 5. Juli 2013

LoRDxRaVeN schrieb:
...
Und ein FX-Steamroller, also mit bis zu vier (oder gar mehr) Modulen, ist nach wie vor nicht angekündigt...LG

Das wär aber zu blöd, wo AMD ja gerade immer sich für seine Mehr-(XXL)Module ausgerichtet hatte, das kann ich mir aber jetzt nicht vorstellen.

Krautmaster · 6. Juli 2013

eigentlich sollte ja mit Modulen eine deutliche Einsparung zu vollen K10/K10.5 Kernen einhergehen. In 28nm brauchen ja 2 Module vielleicht etwa 80mm² - da wär so ein 28nm 6 Moduler / 12 Kern für Desktop doch eigentlich drin oder? Müssen ja nicht Unmengen L3 drauf.

pipip · 6. Juli 2013

Krautmaster
Es war ja auch mit Piledriver "Komodo" 5 Module geplant. Der wurde aber durch den Vishera mit 4 Module ersetzt.
Damals waren ja wesentlich mehr Optimierungen mit Piledriver geplant, die wurden aber dann durch das leichtere update Vishera ersetzt.
Ein 6 Moduler wäre fix interessant, aber wer kauft diesen für den Desktop dann ?
Besonders wenn man oft hört, ja 8 Cores sind ja aufgrund der Software "eh unnötig".

Matzegr · 6. Juli 2013

Krautmaster schrieb:
eigentlich sollte ja mit Modulen eine deutliche Einsparung zu vollen K10/K10.5 Kernen einhergehen. In 28nm brauchen ja 2 Module vielleicht etwa 80mm² - da wär so ein 28nm 6 Moduler / 12 Kern für Desktop doch eigentlich drin oder? Müssen ja nicht Unmengen L3 drauf.

Ein Modul + L2 in 32nm sind 30,9mm² (Llano 2 Kerne+L2 sind ~37mm²)

Kaveri wird ~225mm² große sein. Da könnte man theoretisch vom Platzbedarf die iGPU durch 2 Module ersetzen. Dann wäre aber ein 4 Moduler ohne L3-Cache auch schon 225mm² groß. Da nochmal 2 Module und L3 drauf. Da wäre man wieder weit über 300mm².

Krautmaster · 6. Juli 2013

gut L3 wird überbewertet, find ich. Wenn AMD so auf Desktop Jagt geht dann kann man doch den verschwenderischen L3 (siehe Piledrive DIE) weglassen. Ähnlich den Athlons.

Wegen mir könnten es auch Llano Kerne sein, optimierte. Die sind klein, recht IPC stark und 8 davon wären sicher besser als die heutigen FX. Gut, sie gehen halt nicht ganz den hohen Takt was aber bei der Leistungsaufnahme dienlich ist, da die Llano Kerne in meinen Augen mindestens so effizient bei Perf/W sind wie Richland. Gerade durch den niedrigen Takt.

Nen Athlon II Quad (Propus) brauchte selbst in 45nm lächerliche 169mm² . In meinen Augen steht PileDriver nur so verschwenderisch da wegen dem L3, sowohl was die mm² als auch die Leistungaufnahme angeht. Noch heute sind bei selbem Takt Llano Kerne klar schneller als Module Gen2/3.

In 32nm oder gar 28nm müssten ja 10 Kerne davon auf ne DIE passen (ohne iGPU natürlich). Klar, der L3 fehlt dann, aber ist jetzt ja nicht so dass der die IPC/ Kern bei Piledriver auf top Niveau katapultieren würde. Selbst im Server Umfeld... vielleicht nicht ganz ohne L3, aber vielleicht nicht gerade ein drittel der DIE...

LoRDxRaVeN · 6. Juli 2013

Krautmaster schrieb:
gut L3 wird überbewertet, find ich. Wenn AMD so auf Desktop Jagt geht dann kann man doch den verschwenderischen L3 (siehe Piledrive DIE) weglassen. Ähnlich den Athlons.

Was meinst du mit Piledriver-DIE? Es gibt kein Piledriver-DIE...

In meinen Augen steht PileDriver nur so verschwenderisch da wegen dem L3, sowohl was die mm² als auch die Leistungaufnahme angeht.

Piledriver ist nur der Codename der CPU-Architektur - das ist erstmal völlig unabhängig vom L3-Cache. Das sieht man schon daran, dass es sowohl einen Piledriver-basierenden Prozessor mit L3 Cache als auch ohne gibt.

Die "8 K10 Kerne wären besser gewesen"-Diskussion ist schon sowas von ausgelutscht. Dabei wird immer vernachlässigt, dass auch die Effizienz von K10 in 32nm im Form vom Llano alles andere als berauschend war und nur marginal gegenüber Thuban zugelegt hat - wenn überhaupt. Somit kann man nicht davon sprechen, dass K10 energieeffizienter ist/wäre, als es K15 (aka Bulldozer-Architektur) ist. Weiters kann Bulldozer massig Instruktionen, die ein K10 nicht kann - die Vergleiche hinken einfach von hinten bis vorne. Auch bzgl. dem Takt kann man nicht so einfach pauschalisieren. Nur weil K10 niedriger getaktet hat, heißt das nicht, dass ein Bulldozer-basierender Prozessor mit ein paar 100MHz mehr (bei gleicher Performance) nicht effizienter sein kann. Die Regel "mehr Takt bedeutet höhere Leistungsaufnahme" gilt nur innerhalb der selben Architektur.
Ich will damit zusammenfassend nur sagen, dass ein Vergleich nur äußerst eingeschränkt möglich ist und somit unmöglich solch ein Fazit gezogen werden kann, ohne das wissenschaftlich untersucht zu haben. Und das wäre wahrscheinlich der Umfang einer Doktorarbeit mit dementsprechenden Fachwissen, wovon hier wohl nur die allerwenigsten verfügen - ja, auch inkl. mir

LG

Matzegr · 6. Juli 2013

Krautmaster schrieb:
Wegen mir könnten es auch Llano Kerne sein, optimierte. Die sind klein, recht IPC stark und 8 davon wären sicher besser als die heutigen FX. Gut, sie gehen halt nicht ganz den hohen Takt was aber bei der Leistungsaufnahme dienlich ist, da die Llano Kerne in meinen Augen mindestens so effizient bei Perf/W sind wie Richland. Gerade durch den niedrigen Takt.

Die Frage ist, wie groß wär so nen Llano Kern wenn er um SSE4.1 SSE4.2, AES, AVX, XOP, FM3 und FM4 erweitert wird. Und wie sieht dann die Effizienz aus

Perf/W liegt Llano und Trinity auf einem Niveau. Richland steht da am besten da, trotz höheren Taktes.

Krautmaster schrieb:
Noch heute sind bei selbem Takt Llano Kerne klar schneller als Module Gen2/3.

Aber im Endeffekt ist es egal. Wichtig ist Perf/W und nicht Perf/Takt.

Wenn hoher Takt per se schlechter wäre, dann frag ich mich warum Intel bei seiner iGPUs immer auf so einen hohen Takt setzt. Da ist man teilweise mit 1,3GHz ja deutlich vor der Konkurrenz.

Ein Übersichtsartikel wäre ganz interessent, wo man mal die 65W TDP (Das sind ja immer die Effizientesten der jeweiligen Generation) Varianten von Llano, Trinity und Richland gegenüberstellt.

News AMD „Kaveri“: Architektur-Änderungen im Überblick

Rear Admiral

Fleet Admiral

Lt. Junior Grade

Fleet Admiral

Commander

Captain

Fleet Admiral

Commodore

Lt. Junior Grade

Lt. Commander

Fleet Admiral

Lt. Commander

Lt. Commander

Lt. Commander

Fleet Admiral

Fleet Admiral

Commander

Fleet Admiral

Lt. Commander

Commander

Ähnliche Themen

Passend zum Thema