News AMD zeigt lauffähige „Kaveri“-APU

aylano schrieb:
Meiner Die-Abschätzung nach würde ich auf 225mm² kommen. Andere Gerüchte sprechen von 200-210mm².

So hab noch mal genauer "gemessen". Ich komme auf 1,6x1,4mm für die Die. -> 224mm² (also ~4 CUs weniger als bei meiner ersten Schätzung).


6 Shadercluster im Trinity@32nm nehmen ~47mm² ein
10 GCN CUs im Cape Verde@28nm nehmen ~51mm² ein.

Also 8 CUs, sprich 512 Shader werden es auf jeden Fall sein. Es könnten allerdings auch durchaus 10 CUs sein.

Wenn man bedenkt, dass ne Asus 7750 mit 10 CUs und 1 GB VRAM unter Last gerade mal 41W benötigt, dann wären rein vom TDP Budget sicherlich auch 10 CUs im Kaveri möglich.

Mal schauen was es am Ende wirklich wird.
 
abwarten. Vllt gehts ja doch. Nur bis da jemand bei AMD in der Lage ist ne klare Aussage zu machen geht noch Zeit ins Land. (siehe das AM3 Sockel Chaos zum FX)
 
Krautmaster schrieb:
abwarten. Vllt gehts ja doch.

FM2 hat eine 3 Pin-breite Erhebung im Sockel, somit wird man keinen Kaveri in nen FM2 Sockel bekommen. Umgekehrt dagegen ist es kein Problem, nen Trinity/Richland in nen FM2+ (Da ist diese Erhebung nur noch 2 Pins breit) zu stecken.

600px-AMD_FM1_CPU_socket_-_closed-top.jpg
 
Zuletzt bearbeitet:
Matzegr schrieb:
6 Shadercluster im Trinity@32nm nehmen ~47mm² ein
10 GCN CUs im Cape Verde@28nm nehmen ~51mm² ein.

Also 8 CUs, sprich 512 Shader werden es auf jeden Fall sein. Es könnten allerdings auch durchaus 10 CUs sein.

Wenn man bedenkt, dass ne Asus 7750 mit 10 CUs und 1 GB VRAM unter Last gerade mal 41W benötigt, dann wären rein vom TDP Budget sicherlich auch 10 CUs im Kaveri möglich.

Mal schauen was es am Ende wirklich wird.
Mit 60-80mm² hatte ich daumen mal pi das Front-End miteinberechnet.
Wie ich schon sagte. Was möglich wäre, wird schon wesentlich unrelevante, wenn AMD relevante Angaben machte.
Einerseits muss die iGPU so 1000 GFlops erreichen, was bei einem Desktop-Modelle mit relativ hohen Taktraten üblich erreicht wird und andererseits wird AMD wohl auch ULV-APUs (15-25W-TDP) mit höchstwahrscheinlich üblichen non-Teildeaktivierten CUs rausbringen wollen.

Also, Kaveri soll 1000 GFlops besitzen.
Momentan 779 Gflops, wobei da schon die CPU drinnensitzt.
GPU-GFlops = 384*2*0,844 = 650 GFlops
CPU-GFlops = 779 - 650 = 130 Gflops
Nehmen wir mal 150 CPU-GFlops für Kaveri an, so sind 850 Gflops für GPU-GFlops gedacht.
CU-Verhältnis = 850/650 = 31%
Kaveri-CU-Einschätzung = 6 CU * 1,31 = 7,84 entspricht 8 CU mit 830 Mhz.

Wenn man bedenkt, dass Llano (5CU) --> Trinitiy (6CU) nur 1CU-Zuwachs bekam, wären dann zu Kaveri mit + 2-CUs eher passend, als gleich mit +4 CU bei Quasi gleicher Fertigung.
 
Also ich bin auf hUMA gespannt. Eventuell kann man sogar mehr aus der Bandbreite (Dual Channel DDR3 2133) rausholen als bisher. Denn mit hUMA wird ja nicht mehr die Bandbreite zwischen CPU und GPU geteilt, sondern kann sie Gemeinsam verwenden. Ich bin gespannt wie das funktioniert.
Wenn Kaveri noch mal 20 % iGP Performance auf Richland A10 gewinnt, wäre man schon bei einer 6670.
Falls es sogar 40 % werden (optimistisch) sollte man schon bei einer 6750 sein ^^
Mit DDR3 erwarte ich mir momentan aber nicht mehr. Außer man verwendet wirklich DDR3 2400 und kann sehr viel aus den Ram rausholen.
Interessant wie es dann mit den Ram-Preisen aussieht. AMD sollte deren Prozessor gleich mit Radeon RAM bündeln für optimale RAM ect. Wenn der Preis der APU+RAM kaum der gleichperformanten Grafikkarte übersteigt, wäre das schon eine sehr super Option.
 
joa schneller wirds werden, aber auch die 50€ Desktopkarten legen zu. Bei APUs wird eher interessant wie man das Bandbreitenproblem angehen wird. Schnellerer DDR is ja nur ne temporäre Option.
 
pipip schrieb:
Also ich bin auf hUMA gespannt. Eventuell kann man sogar mehr aus der Bandbreite (Dual Channel DDR3 2133) rausholen als bisher. Denn mit hUMA wird ja nicht mehr die Bandbreite zwischen CPU und GPU geteilt, sondern kann sie Gemeinsam verwenden. Ich bin gespannt wie das funktioniert.
Wenn Kaveri noch mal 20 % iGP Performance auf Richland A10 gewinnt, wäre man schon bei einer 6670.
Falls es sogar 40 % werden (optimistisch) sollte man schon bei einer 6750 sein
Es stellt sich die Frage, ob mit hUMA auch die realtive Bandbreiten-Nutzung reduziert wird, weil durch die direkten Zugriffe von iGPU & iCPU im APU-Lx-Speicher keine Umwege über Memory-Controller gemacht werden müssen, sowie der interne APU-Lx-Cache effektiver genutzt werden kann, sodass externer Arbeitsspeicher nicht mehr ganz so viel genutzt wird.

Man hat ja jetzt auch gesehen, wie stark Richland bei mikrigen Taktsteigerungen zulegen konnte.
Der Uncore-Bereich ist die größte Unbekannte, weil man den schwer einschätzen kann, aber sobedeutend, dass man ihn nicht vernachlässigen darf.
 
aylano schrieb:
Nehmen wir mal 150 CPU-GFlops für Kaveri an, so sind 850 Gflops für GPU-GFlops gedacht.

850 GFLOPS für die iGPU ist nen realistischer Wert.

Jetzt gibt es aber mehrere Möglichkeiten die zu erreichen ;)

A) 8 CUs @ 830 MHz -> 850 GFLOPS in der Theorie.
B) 10 CUs @ 666 MHz -> 850 GLOPS in der Theorie.

Bei Variante B würde man sich ungefähr an den Notebookchips (7000 Serie) orientieren, was Takt und Leistung angeht und man hätte auch noch mit den Taktraten nach oben einiges mehr an Spielraum als wenn man Variante A bringt.
Variante B wäre vielleicht auch günstiger wenn man 2014 nen Refresh bringen möchte, da man für mehr Leistung den Takt weniger als bei Variante A erhöhen müßte, was sich positiv auf die Effizienz auswirken könnte.
 
Matzegr schrieb:
850 GFLOPS für die iGPU ist nen realistischer Wert.

Jetzt gibt es aber mehrere Möglichkeiten die zu erreichen ;)

A) 8 CUs @ 830 MHz -> 850 GFLOPS in der Theorie.
B) 10 CUs @ 666 MHz -> 850 GLOPS in der Theorie.
AMD hat bisher immer die Strategie geht, (wenn möglich) hohe Takte zu gehen.
Es ist berechtigt zu argumentieren, dass 666 Mhz @ 10-CU auch möglich wären, weil Llano @ Desktop 600 Mhz hatte.
Aber Llano hatte bei der Einführung große Yieldprobleme, weshalb man zuerst recht niedrig gehen musste, aber dann später bei Trinite wieder ordentlich auf 760 Mhz steigern konnte. Das würde auch erklären, warum Richland nur +40 Mhz hatte.

Bei Variante B würde man sich ungefähr an den Notebookchips (7000 Serie) orientieren, was Takt und Leistung angeht und man hätte auch noch mit den Taktraten nach oben einiges mehr an Spielraum als wenn man Variante A bringt.
Orientierungen an Notebook-Takte konnet ich bisher keine Zusammenhänge sehen.
Spielräume brauchte AMD bei Kaveri nicht, weil sie so in 12 Monaten eh wieder durch 20nm abgelöst werden und Kaveri jetzt in einer sehr ausgereiften Fertigung bringen.

Variante B wäre vielleicht auch günstiger wenn man 2014 nen Refresh bringen möchte, da man für mehr Leistung den Takt weniger als bei Variante A erhöhen müßte, was sich positiv auf die Effizienz auswirken könnte.
Ich sehe für 2014 keinen Platz für Refresh. Kaveri ist auf der 32/28HP-Fertigung je nach Betrachtung genauso schon der 2. Rrefresh und die Steigerungen in iGPU waren mit +40Mhz ja auch schon fast mikrig. Deutlich mehr Sinn sowie meiner Erwartung, wird AMD 2014 sich viel eher um den Kaveri-Nachfolger mit GCN 3.0 (mit neuer CU-Konfiguration) und vielleicht schon Excavator und HSA 2.0 kümmern. Jedes dieser Elemente ist für einen Perfekten Start wesentlich wichtiger als ein Kaveri-Refresh der ja auch mindestens 6 Monate abstand zur nächstes Plattform besitzen muss.

Grundsätzlich ist zu sagen, dass es sich nur um 28HP handelt.
Zuerst muss sich zeigen, ob 28HP überhaupt besser (Performnace-pro-Watt) ist als 32nm-SOI.
+30% iGPU-Performance ist ja bei gleichen TDP nicht wenig.
Es kann ja genauso sein, dass AMD bei Kaveri in den Einheiten auf die CPU-Performance setzt, weil sie bei Llano & Trinity & Richland mehr die GPU-Performance im Augen hatten. Falls das so kommen sollte, wären so neben bei +30% iGPU-Performance dann sehr viel.
Wobei wir hier von der Reinen GPU-Power sprechen.
Ziel von Kaveri ist ja mehr GPU-Computing-Performance infolge hUMA (=Qualitativ) zu erreichen und nicht durch mehr Einheiten (Quantitativ)
 
Die Limitierung beim Ram die sich auch beim Richland zeigt muss AMD ja auch angehen (Richland gewinnt offensichtlich hauptsächlich wegen Ramtakt gegen Trinity, taktbereinigt sind beide defakto praktisch gleich fix auf GPU Seite). Eventuell hast du dahingehend recht dass Kaveri zunächst die GPU Leistung nur geringfügig aufbohrt, dank GCN aber schon deutliche Gewinne bei Computing Power haben wird. Zudem hat AMD noch Headroom bei der TDP bei GPU last only. 20% mehr GPU Leistung wären also schon denkbar wenn entsprechend schneller Ram eingesetzt wird und sich die GPU einfach bei wenig CPU last mehr der TDP genehmigen darf.
 
Krautmaster
Die Limitierung beim Ram die sich auch beim Richland zeigt muss AMD ja auch angehen
Deshalb sage ich ja, dass ich besonders auf hUMA gespannt bin. Eventuell kann man die Bandbreite für die IGP besser ausnützen.
Das neue dabei ist ja auch, dass die IGP auch auf den L2 Cache zugreifen können sollte xD
Mich würde allein deshalb schon interessieren ob man den L2 Cache vllt verdoppeln könnte.
Würde das nicht auch etwas bringen ? Was denkt ihr ^^
ein L3 Cache wird man wohl die nächste Zeit nicht integrieren.

Matzegr
Schade, habe extra ein A85 Chipsatz genommen mit mehr Phasen. Aber die Teile kann ich noch gut als Office-PC andrehen, falls ich zu Kaveri Ende des Jahres aufrüsten werde.

Für die A-Serie hoffe ich, dass dann die nächsten Generationen der Sockel dann doch beständig bleibt. Immerhin wäre das ne tolle Sache, wenn man nach 2 Jahren über einen Prozessor CPU und GPU aufrüsten kann.
Eine APU bis zu einem Preis von max 200 Euro (natürlich dementsprechende Grafikpower) Würde ich sogar ausgeben wollen. Mein HTPC kann auch die 100 watt tdp lautlos kühlen.
Eher mein SFX Netzteil ist der laute Brüller.
http://geizhals.at/xilence-sps-xp250-sfx-250w-sfx12v-a555120.html
(falls jemand ein leiseres kennt, bitte sagen xD)
 
Zuletzt bearbeitet:
Was spricht eigentlich dagegen, mit Kaveri beginnend, die APU's wie die GPU's auszuliefern..?!
Referenzdesign. Eigene Designs der Hersteller... mit mini-ITX als Grundlage. Fester GDDR5.

Ich fände das super und auch nötig..! Bin niemand der eine CPU verkauft und das Board behält bzw. das verlangen hat so schnell aufzurüsten. Bei den Lebenszeiten der Sockel macht das doch keinen Unterschied mehr? FM1 konnte man ja noch verzeihen... dafür sollte aber FM2 bereits 'Kaveri-Ready' gemacht worden sein!
 
aylano schrieb:
Grundsätzlich ist zu sagen, dass es sich nur um 28HP handelt.
Zuerst muss sich zeigen, ob 28HP überhaupt besser (Performnace-pro-Watt) ist als 32nm-SOI.


Steht das zu 100% fest?

Ich kann mich noch an ne Aussage von Thomas Seifert Anfang 2012 erinnern. Da hieß es alle 28nm Produkte sind bulk.

Anfang 2013 tauchte dann beim Common-Plattform-Technology-Forum allerdings ne GF Roadmap auf wo 28nm SHP abgebildet war. Dazu die Aussage des GF Sprechers:

We are starting with 32nm, this is the super high performance platform our customer AMD uses for microprocessors and moving that to 28nm.
 
Matzegr schrieb:
Steht das zu 100% fest?
die Aussage des GF Sprechers:
Zuerst ersten Frage, würde ich ich nein sagen.
Aber bei meiner Aussage war es mir Wurscht, ob es 28HP oder 28SHP heißt.

Es geht auch darum, dass wenn AMD mit Kaveri nicht nur eine iGPU-Perforance-Steigerung und iGPU-Effizienz-Steigerung schafft, sowie iCPU-Performance-Steigerung und iCPU-Effizienz-Steigerung im ähnlichen Ausmaß schafft, dass dann Intel Ende des Jahres praktisch nicht mehr darauf reagieren kann und es da ein ordentliches Kräfteverschieben geben kann, weil AMD schon jetzt ziemlich stark ist.
Es hat sich ja nicht nur meine Spekulationen einer 16nm-Einführung von Intel @ Juni 2014 bestätigt, sondern es gibt ja auch schon erst Gerüchte, ob 16nm vielleicht doch erst Ende 2014 kommt.

Alleine wenn Kaveri in Sachen iCPU & iGPU mit >15% Performance-Steigerungen und Effizienz-Steigerungen zulegen kann (von hUMA mal begesehen), dann reicht es, dass die meisten ein längeres Gesicht machen, als die Kontrollöre bei Pferdefleischproben.

Eines muss man klarstellen.
AMD bzw. Rory Read hat alle seine Folien-Marketing-Aussagen erfüllt, sodass man eine Erfüllung von 1000GFlops ausgehen kann.
Also, wenn man +30%-GFlops-Steigerungen versprochen werden, sind die Chancen recht groß, dass es eine +10 bis 15%-CPU-Steigerung könnte.

Im Falle Jaguar hat AMD seine Versprechungen von +15%-IPC-Steigerungen sogar gelogen und mit +30+% überrascht.

Die Größte Änderung hätte ich fast mit der Die-Größe gesehen und mit <200mm² gerechnet. Momentan sieht es so aus, dass Kaveri deutlich >200mm² dahertanzt. Also könnten da noch einige Überraschungen auftauchen. Denn während über die GPU-Performance schon sehr früh diese 1000GFlops erwähnten, wurde über die CPU-Performance ja noch überhaupt nichts angedeutet.

Ich kann mich noch an ne Aussage von Thomas Seifert Anfang 2012 erinnern. Da hieß es alle 28nm Produkte sind bulk.
Anfang 2013 tauchte dann beim Common-Plattform-Technology-Forum allerdings ne GF Roadmap auf wo 28nm SHP abgebildet war. Dazu
SHP muss jetzt nicht unbedingt SOI oder FD-SOI heißen. Es kann ja auch ein verbessertes HP sein ohne SOI a la ULK.
SLP hat ja genauso Stoffliche oder Qualitätsmäßige Verbesserungen gegenüber LP.
 
aylano schrieb:
Es hat sich ja nicht nur meine Spekulationen einer 16nm-Einführung von Intel @ Juni 2014 bestätigt, sondern es gibt ja auch schon erst Gerüchte, ob 16nm vielleicht doch erst Ende 2014 kommt.

....

Denn während über die GPU-Performance schon sehr früh diese 1000GFlops erwähnten, wurde über die CPU-Performance ja noch überhaupt nichts angedeutet.

Intel bringt keinen 16nm Prozess. TSMC wird 16nm haben, GF und Intel gehen auf 14nm.

Prinzipell wäre halt für die großen APUs FD-SOI interessant um effizienztechnisch aufzuholen. Laut Roadmap soll ja bei GF 2014 14nm FD-SOI zur Verfügung stehen. Laut Aussage von Subi Kengeri (Vice President of Advanced Technology Architecture, GlobalFoundries) könnte AMD 14nm FD-SOI durchaus nutzen, wenn sie wollen:

We are the manufacturing partner for ST’s FD-SOI technology. We also are planning to offer the technology to other customers who may be interested, but we have not announced details yet


Zur CPU von Steamroller in Kaverie:Es sind 15% Performance/Watt gegenüber Piledriver kommuniziert wurden (auf Design-Ebene). Ist halt die Frage wieviel man noch durch den Prozess rausholen kann. Bei 28nm bulk wäre nicht soviel drinn wie bei 28 PD-SOI, am optimalsten wäre halt 28 FD-SOI, der laut Roadmap zur Verfügung stehen könnte.

Naja, zum Jahresende werden wir es wissen.

Nachtrag:

Ach verdammt, man sollte auch mal die Anhänge lesen ;)

Stand Feb. 2012: Kaveri hat 4GHz (CPU) und 900 MHz (GPU) -> 128 + 921 = 1050 GFLOPS
 
Zuletzt bearbeitet: (Ergänzung)
Matzegr schrieb:
Prinzipell wäre halt für die großen APUs FD-SOI interessant um effizienztechnisch aufzuholen. Laut Roadmap soll ja bei GF 2014 14nm FD-SOI zur Verfügung stehen. Laut Aussage von Subi Kengeri (Vice President of Advanced Technology Architecture, GlobalFoundries) könnte AMD 14nm FD-SOI durchaus nutzen, wenn sie wollen

Najo, vorsichtig.. 2014 soll GF zwar 14nm FD-SoI haben, aber hier wurde glaube ich immer von mobile chips gesprochen. GF fertigt ja auch für Smartphone Anbieter Prozessoren oder ?
Somit könnten die größeren Chips auch erst später folgen. Interessant wäre aber ein Kabini in 14nm SoI, denn dann wären AMDs APU auch Smartphone fähig.

Zur CPU von Steamroller in Kaverie:Es sind 15% Performance/Watt gegenüber Piledriver kommuniziert wurden (auf Design-Ebene). Ist halt die Frage wieviel man noch durch den Prozess rausholen kann. Bei 28nm bulk wäre nicht soviel drinn wie bei 28 PD-SOI, am optimalsten wäre halt 28 FD-SOI, der laut Roadmap zur Verfügung stehen könnte.
Wer weiß, eventuell war 28 nm Bulk geplant, dann meinte GF na geht schon SoI wird super, basiert auf 32 nm SoI und mittlerweile sind wir erfahren genug bla bla und schon könnte man ein Grund haben, wieso Kaveri sich nach hinten verschoben hat.

Also ich schließe mich an, bin gespannt was es nun wird :D Es wäre aber lustig Wetten abzuschließen ^^ ob SoI oder Bulk. Würde aber auch auf ersteres hoffen, denn bei Richland macht 32 nm SoI schon einen guten Eindruck.
Wobei natürlich Bulk als Vergleich fehlt.


Stand Feb. 2012: Kaveri hat 4GHz (CPU) und 900 MHz (GPU) -> 128 + 921 = 1050 GFLOPS
Also 128 GFLOPS allein durch die CPU ? Wieviel hat denn Trinity zum Vergleich ?
 
pipip schrieb:
Najo, vorsichtig.. 2014 soll GF zwar 14nm FD-SoI haben, aber hier wurde glaube ich immer von mobile chips gesprochen. GF fertigt ja auch für Smartphone Anbieter Prozessoren oder ?

....
Also 128 GFLOPS allein durch die CPU ? Wieviel hat denn Trinity zum Vergleich ?


Selbst wenn man ne APU erst 2015 in 14nm FD-SOI bringen kann, ist es immer noch besser als irgend ein Bulk-Prozess. Es wäre suboptimal wenn man 32nm SOI hat, dann auf bulk wechselt und später auf FD-SOI. Drum hoff ich ja, dass das Einschieben von Richland erfolgte, weil man ein wenig mehr Zeit brauchte wegen 28 nm SOI.


Die GFLOPS Angaben sind laut Appendix alle rechnerisch ermittelt: (Cores * Freq * 8) für CPU + (Shader * Freq * 2) für GPU.

Feb. 2012 war die Angabe für Kaveri 4C/8CUs und 1050 GFLOPS -> 4 GHz CPU und 900 MHz GPU, wenn man die Formel von oben nimmt:

3-1080.2166660356.png


Interessanterweise gab es später im Juni bei der AFDS 2012 eine andere Grafik:

amd_apu_kaveri.png


Dort liegt Trinity bei weniger GFLOPS als bei der Folie vom Feb. 2012. Nur leider findet man da keinen Anhang, der erklärt wie man auf die Werte kommt.
 
Zurück
Oben