Matzegr schrieb:
Prinzipell wäre halt für die großen APUs FD-SOI interessant um effizienztechnisch aufzuholen. Laut
Roadmap soll ja bei GF 2014 14nm FD-SOI zur Verfügung stehen. Laut Aussage von Subi Kengeri (Vice President of Advanced Technology Architecture, GlobalFoundries) könnte AMD 14nm FD-SOI durchaus nutzen, wenn sie wollen:
Wenn sie wollen, dann ja, aber 28nm-FD-SOI wurde erst 2012 liziensiert und Mitte 2013 für Startklar erklärt und so um dem Jahreswechsel für Volume-Produktion vorhanden sein soll. Lizensiert wurde das von einer Firma, die üblich ARM nutzt. Das wäre alles ziemlich kurzfristig und eigentlich auch riskant, weil FD-SOI nicht für solche Big-Dies wie 250mm²-APUs erprobt ist.
Zur CPU Steamoller in Kaverie:Es sind 15% Performance/Watt gegenüber Piledriver kommuniziert wurden (auf Design-Ebene). Ist halt die Frage wieviel man noch durch den Prozess rausholen kann. Bei 28nm bulk wäre nicht soviel drinn wie bei 28 PD-SOI, am optimalsten wäre halt 28 FD-SOI, der laut Roadmap zur Verfügung stehen könnte.
Weil ständig eine kontenuierliche Weiterentwicklung stattfindent, bräuchte man nicht mal was gravierendes um nur 15% zu erreichen.
Ma hat ja jetzt bei Piledriver & Richland gesehen, dass selbst bei selber Fertigungs-Technologie jeweils fast +15% drinnen waren.
Weiterentwicklungen erkennt man auch, dass von SiGe 4. Gen & Co gesprochen wird. Also, es ist nicht unbedingt nötig bei 28SHP eine neu Technologie (FD-SOI) einzuführen. Da könnte verbesserte vorhandene Technologien wie SiGe 5. Gen & Co genauso reichen.
Neue Technologien wie z.B. ULK damals brauchten gleich einen Sprung von 30% bei gleicher Architektur. Deshalb würden selbst +15% @ CPU sogar IMO gegen FD-SOI sprechen, weil Kaveri eben eine neue CPU-Architektur bringt.
Aus meiner Sicht ist eine CPU-Performance-Steigerung von >15% und GPU-Performance-Steigerung von >30% bei gleichen Stromverbrauch/TDP schon als großen Erfolg anzusehen.
Natürlich ist mehr Möglich.
Nicht nur weil AMD mit jetztig deutlich höheren Spannungen noch sehr viel Pontial zur Energie-Effizienz-Steigerung hat, sondern weil sich 15% und 30%-GPU zusammen mit Feritgung & Architektur eigentlich garnicht so viel sind. Denn GPU-Computing-Performance konnte man immer schon recht hoch steigern, während die +15% CPU-Performance-Steigerung schon alleine aus der IPC-Steigerung herausbekommen kann. Daher sind Fertigungs-Verbesserungen bei Kaveri nicht zwingend, aber weil sie fast schon 2 Jahre nach 32nm-SOI kommt, sind natürlich gewisse Sprünge möglich.
Ach verdammt, man sollte auch mal die Anhänge lesen
Stand Feb. 2012: Kaveri hat 4GHz (CPU) und 900 MHz (GPU) -> 128 + 921 = 1050 GFLOPS
Was für ein Anhang?
held2000 schrieb:
Vlt nicht uninteressant mfg
Auszug 3D Center
Unter diesem 28nm SHP-Prozess könnte dann der Trinity/Richland-Nachfolger "Kaveri" gefertigt sein, auch zukünftige (im Jahr 2014 zu erwartende) FX-Prozessoren mit Steamroller-Unterbau könnten jenen 28nm SHP-Prozess nutzen.
Neue Fertigungs-Roadmap von GlobalFoundries zeigt 28nm SHP-Prozess
http://www.3dcenter.org/news/neue-fertigungs-roadmap-von-globalfoundries-zeigt-28nm-shp-prozess
Ist nichts neues.
Diese Roadmap mit den Fertigungsbezeichnungen sind nur Namen.
Es kann eben sein, dass 28HP quasi kleine (<150mm²) Dies mit guter Yield bedeuten, während 28SHP große Dies (150-350mm²) mit guter Yield bedeutet und die Yields der Big-Dies (150-350) eben über dieses Jahr verbessert wurde. Da müssten nichteinmal großartige Verbesserungen zu sehen sein. TSMC braucht ja auch ein Jahr um die Yield von großen Dies deutlich zu verbessern.
Es ist ja kein zufall, dass a) 28HP 1 Jahr davor (Produktion-Volume-Ramp-Beginn März 2012) fertig wurde und X-Box & PS4 (und Kaveri) ebenfalls so ab März 2013 mit den Produktion-Volume-Ramp beginnen.
pipip schrieb:
Offtopic
Nur mal so ne kleine Frage am Rande. Wenn man VLIW5 und GCN nimmt und Games optimiert, müssten sie im besten falls beide den Faktor 2 haben.
Somit stellt sich mir die Frage, kann VLIW5 bei guter Optimierung eine ebenso gute Effizienz erreichen wie GCN. VLIW 4 wurde ja im Desktop eingeführt, da man ja VLIW5 meist nur 3,5 Alus ordentlich nutzen konnte.
Ich kann dir nicht folgen.
Im Ideal-Fall wäre VLIW-5 sicher effizienter als VLIW-4 und GCN. Aber die Realität ist nicht Ideal und deshalb war der schnitt bei VLIW-5 bei so 3,5 (70%) und bei VLIW-4 bei so 3,2 (80%).
Momentan in dieser Generation wird VLIW-4/5 wahrscheinlich noch gleich gut sein, aber das Problem sehe ich in der Einheitenskalierung.
Mit GCN kannst du die CU noch auf 128 oder 256 Shader erhöhen, bei SIMD geht das nicht (bzw. nicht so einfach) und da hätte man die Einheiten über das Frontend = Grafik-Engines erhöhen müssen. Mit 16SIMD pro Grafikengine ist man eben jetzt schon an den Grenzen und auf 4 Grafik-Engines zu erhöhen ist vielleicht auch nicht unproblematisch bzw. hoch effizient.
Kurz gesagt, GCN ist wahrscheinlich momentan nicht mal effizienter, aber abgesehen von HSA hätte man zukünftige Skalierungsprobleme, wo VILW-4/5 in Zukunft nicht ganz so gut mit Einheiten Skaliert wie GCN.