News AMDs „Kaveri“-Samples im Umlauf

aylano schrieb:
Denn sowie Jaguar uns mit +30% IPC überraschte, kann es diesesmal ja genauso sein.
Vorallem, weil wesentliche Einheiten vergrößert wurden, was bei Jaguar ja nicht passierte.

Bei Jaguar von +30% IPC zu reden ist genauso Rosinenpickerei, wie wenn jemand mit so stumpfsinnigen Aussagen alá "Intels IPC ist um 50% höher als AMDs" daherkommt. Das es solche Fälle gibt, ist klar, aber in der Breite kann man keinesfalls davon sprechen.
Weiters wurde natürlich wesentliche Einheiten vergrößert - man denke alleine an die FPU. Und dann eben noch all' die Instruktionssätze. Von nichts kommt keine höhere IPC...

LG
 
pipip schrieb:
aylano
Im Endeffekt darf man hoffen, dass man einen Takt von 3,6-3,7 Ghz erreicht, dann würden wir eventuell einen solchen 65 watt tdp Kaveri sehen. Ein 45 watt tdp Variante würde dann auf einem Niveau eines A10 6700 + sein.
Tut mir leid, aber ich Hoffe nie, sondern ich versuche das Technische abzuleiten.
SOI ist laut meinen Informationen für eine höhere Effizienz zuständig, weniger für höhere Takte.
Andererseits hat sich die Effizienz-Verbesserung mit kleineren planaren Strukturen AFAIK nicht unerheblich verringert. Dass mit SOI höhere Takte möglich sind, liegt natürlich auch daran begründet, dass bei einer höheren Effizienz bei hohen Takten, natürlich weitere Taktsteigerungen möglich wären.

Mein Gedanke war eher, dass 32nm-SOI mittlereweile so ausgereift ist, dass es bei 28nm garnicht so einfach ist hohe Takt (ohne SOI-Vorteil) überhaupt zu erreichen. Oder anders gesagt, hohe bzw. höhere Takte sind wegen dem TDP-Limit nicht möglich.

Für mich ist ja auch deshalb die Fertigungs-Frage so bezugslos, weil wir ja nichteinmal wissen, ob es 28HPP oder 28SHP ist.
Und umwieviel 28HPP schlechter oder besser sie gegenüber 32nm-SOI wissen wir ja auch nicht.

Tatsache,
es gibt Gerüchte über 3,5 Ghz-Basis-Samples, was Engineering Samples ziemlich hoch ist.
es gibt Gerüchte von +30% IPC, was nach Jaguar garnicht mehr so unwahrscheinlich klingt, vorallem weil Jaguar ja keine Einheiten-Vergrößerungen hatte.

Nicht zu vergessen ist, dass man ja deshalb früher einiges für Bulldozer erwarten konnte, weil K10.5 nur so 1 Befehl-pro-Takt bei 3 Möglichen (wegen 2 ALUs) verarbeitet hat und mit einfacherer (2 statt 3 ALU) Befehlsverteilung eine höheren & effizientere Befehls-pro-Takt-Verarbeitungsrate nicht nur für Möglich sondern (wie manche sagten) auch erwarten konnte.

Im Grunde ist der jetztige Bulldozer und 32nm-SOI immer noch die Technik aus dem Jahre 2011, wobei beide ja schon für Anfang 2011 gedacht waren.

Aber ja, ich bin dieses mal auch konservativ und erhoffe mir, dass man zu mindestens bei gleicher Tdp von 95 Watt die 10% CPU und 25% GPU erreichen wird.
Konservativ ist man in der Regeln, wenn man die Sache aufgrund der geringen Anhaltspunkte abschätzen kann.
Davor konnte man die Entwicklung der Produkte auf Basis der Fertigungen (90nm --> 65nm --> 45nm) und der Architekturen (K8 --> K10 --> K10.5) ja sehr gut einschätzen. Zwar lage ich beim K10-B2-Stepping etwas daneben, aber das Potential konnte ich damals recht gut einschätzen, weil es sich bestätigt hat, dass AMD beim K10-B-Steppings quasi nur Bug-Fixes im Gesamten Jahre 2008 machte und kaum/keine Performance-Optimierungen. Hingegen das C-Stepping dann lange auf Performance @ Stepping optimiert wurde, bevor es raus kam.

Jetzt gibt es eben seitens GF und Bulk-Fertigung noch zu wenig Informationen.

PS:
So wie bei niederen Takten oft größeren CPU- & GPU-Steigerungen möglich sind, könnte die SOI --> Bulk-Umstellung genauso bewerken, dass bei niederen Takten mehr oder gar weniger (= nichtlinear) Steigerungen möglich sind.
+10% & +15% @ 95W-TDP ist eine konkrete ansage, die bei 17/35W (deutlich) besser oder schlechter sein kann.

Größte unbekannte ist die Spannung.
Gerade im Desktop hatte AMD hohe Spannungen sodass man recht einfach von 95 auf 35/17W runtergehen konnte.
Also, dass zuerst Desktop-Kaveris kommen sollen, könnte ja auch darauf deuten, dass AMD @ Desktop-CPUs (65 & 95W-TDP) die beste Steigerungswerte bei CPU & GPU bekommen. Schließlich ist ja 28nm ja kein neuer unreifer Fertigungs-Node mit geringen Yields, den man nicht schnell genug hochrampen kann.

Was Kaveri grundsätzlich interessant macht ist, dass der Nachfolger mit 20nm & Excavator schon ansteht, wo nicht nur weitere deutliche IPC-Steigerungen möglich sind, sondern 20nm dann ziemlich sicher effizienter als 28nm ist, während wir jetzt eigentlich noch garnicht wissen, ob 28nm überhaupt effizienter ist als 32nm-SOI.
Ergänzung ()

LoRDxRaVeN schrieb:
Bei Jaguar von +30% IPC zu reden ist genauso Rosinenpickerei, wie wenn jemand mit so stumpfsinnigen Aussagen alá "Intels IPC ist um 50% höher als AMDs" daherkommt. Das es solche Fälle gibt, ist klar, aber in der Breite kann man keinesfalls davon sprechen.
Man muss sich aber auch auf die stumpfsinnigen Aussagen der Masse anpassen;)

Weiters wurde natürlich wesentliche Einheiten vergrößert - man denke alleine an die FPU. Und dann eben noch all' die Instruktionssätze. Von nichts kommt keine höhere IPC...
Zu einfach gesagt.
Denn dann hätte damals ja Bulldozer gegenüber K10.5 ja auch deutlich zulegen müssen, der so die gleichgroße FPU hatte. Schließlich bekam Bulldozer genauso wie Jaguar SSE 4.1 & 4.2 & AVX

PS: Dazu ist die Core-Größe kaum gewachsen wenn überhaupt.
Natürlich gab es verbesserungen, aber es macht einen Unterschied ob der Core-Fläche bzw. Core-Transistor-Menge um 25-50% wächst oder eben nicht.
 
Zuletzt bearbeitet:
Dass die DIE-Size effektiv nicht zugenommen hat, ist wieder ein anderes Thema (kleinerer Node usw.), aber das ist erstmal unabhängig davon, ob nun "wesentliche Einheiten" größer dimensioniert wurde und kein Indiz diesbezüglich.
Deinen Einwand bzgl. Bulldozer kann ich nur zum Teil nachvollziehen - dessen (größere) FPUs übertrupfen in der Regel eine K10 FPU mit Leichtigkeit. Nicht umsonst leisten sonst effektiv 4 BD-FPUs (FX-8xx0) idR mehr also 6 K10 FPUs. Also pro FPU hat man eindeutig zugelegt, aber sie sind hald in der Anzahl weniger. Aber das ist hier ziemlich Offtopic
 
aylano
Naja, ich mach meine Prognose ganz billig. Die Abstände der bisherigen APUs waren immer so 5-10% CPU und ca 25% GPU. Im schlimmsten Fall wird AMD auch wieder dieses Mal zu Richland Positionieren. Deshalb sage ich ja auch konservativ, aber vllt verwende ich auch das falsche Vokabel.

Ich gebe mich aber eben auch wegen den Prozess sehr vorsichtig. Wer weiß, vllt überrascht uns AMD am Ende doch mit fd-SoI und deshalb gab es Richland als Überbrückung ? Man weiß es nicht ^^
 
FD-SOI bei 28NM ist ziemlich unwahrscheinlich.
Amd spricht von einem 28NM Bulkprozess, nur welcher genau ist noch unklar.

SOI hat ja vor allem den Vorteil Leckströhme effektiv zu unterdrücken.
Aber da der 28NM Bulk Prozess inzwischen ausgereift sein sollte, glaube ich nicht an
grossartige Nachteile. Vermutlich wird man den Takt bei gleichem Verbrauch halten können.
Das wäre schon ein deutlicher Gewinn, da Steamroller eben grössere Veränderungen mitbringt.

Vor allem die Änderungen am Frontent, den Decodern, der Sprungvorhersage
und nicht zuletzt effizienterem Cache und Timings dürfte viel bringen.

Piledriver war eigentlich nur ein neues BD Stepping mit kleinen Verbesserungen,
dafür hat es eh viel gebracht. Also eigentlich fast noch Stand 2010/11.

Steamroller ist eine bedeutende Optimierung und ein Öffnen der Flaschenhälse.
Darum gehe ich auch von mindestens 20% mehr CPU-Leistung aus.
 
LoRDxRaVeN schrieb:
Dass die DIE-Size effektiv nicht zugenommen hat, ist wieder ein anderes Thema (kleinerer Node usw.), aber das ist erstmal unabhängig davon, ob nun "wesentliche Einheiten" größer dimensioniert wurde und kein Indiz diesbezüglich.
Was meinst du mit effektiv?
Jaguar ist von ~4,8 auf 3,1mm² gesunken und das ist mit 0,65 bzw. -35% ja genau jene Shrinks, wie man schon vom K10 kennt, die von 25mm (65) auf 15mm² (45nm) und später 10mm² gesunken sind.
Und wenn Jaguar einige wesentliche Einheiten dazubekamen, dass solls mir recht sein, denn dann wurde woanders ordentlich eingespart, was eben das Know-How einer Architektur ist.

Deinen Einwand bzgl. Bulldozer kann ich nur zum Teil nachvollziehen - dessen (größere) FPUs übertrupfen in der Regel eine K10 FPU mit Leichtigkeit. Nicht umsonst leisten sonst effektiv 4 BD-FPUs (FX-8xx0) idR mehr also 6 K10 FPUs. Also pro FPU hat man eindeutig zugelegt, aber sie sind hald in der Anzahl weniger. Aber das ist hier ziemlich Offtopic
Die Sache ist ja auch die.
Bulldozer ist mit 20mm² ja doppelt so groß wie ein K10.5 mit 10mm².
Überragend ist es noch nicht, wenn sich 4 BD-FPU aus Sicht der Core-Flächen sich eigentlich gegen 8 K10-FPUs messen müsste.

Kurz gesagt.
Jaguar konnte um +30% ohne/kaum relativen Flächenzuwachs enorm gesteigert werden(, obwohl wir vom kleinen 4,8mm²-Bobcat vs 9,7mm²-Atom schon überrascht waren,) während Bulldozer mit seiner Performance uns mit doppelter K10-Corefläche überraschte.
Mich würde es nicht überraschen, wenn im Bulldozer noch viel ungenutztes Potential drinnen steckt. Schließlich gabs ja auch Aussagen von (EX) AMD-Mitarbeiter, die sich drüber massiv aufregten, dass sie "nicht alle" Techniken in Bulldozer bisher integrieren konnten.

Bei Piledriver hat man ja auch mit paar "Bugfixes" bzw. Aktivierungen schon so 7-8% IPC-Steigerung erreicht.
 
Ich wollte überhaupt nie auf die DIE-Size eingehen. Es ging mir schlicht darum, dass für Jaguars FPU (und andere Einheiten) mehr Transistoren verbaut wurden und dadurch die IPC gestiegen ist. Und das bedeutet eben, dass sehr wohl "wesentliche Einheiten vergrößert wurden". Das ist alles was ich aussagen wollte. Nicht mehr, nicht weniger. Das drumherum bzw. die weiteren Aussagen die du getätigt hast, sind unabhängig davon.

LG
 
Zurück
Oben