News AMDs „Trinity“ 20–30 Prozent schneller als „Llano“?

Caanon · 25. Oktober 2011

@Knuddelbearli: Herdware will wohl eher auf die Minimum-Framerate hinaus bzw. auf Framerate-Einbrüche in bestimmten Situationen.

Ich wage arg zu bezweifeln, dass nicht schon Llano ausreichend gut für die Masse an WoW-Zockern geeignet ist, nur weil die Minimum-Framerate nicht immer bei mindestens 30fps liegen mag.

Man kann einfach immer übertreiben, wenn man unbedingt möchte.
So manch einer mit High End Eyefinity-Setup findet alles darunter bestimmt auch viel zu schlecht für Spiele.

Und nein, weder die nächste, noch die übernächste und selbst die allerletzte WoW-Expansion werden etwas daran ändern, dass WoW ein MMO für die Massen ist und dementsprechd auch auf "schwachen" Systemen für die Masse ausreichend gut spielbar sein muss. Man muss ja nicht jedes neue Grafikfeature nutzen, was hinzugekommen ist.

Staubwedel · 25. Oktober 2011

@pipip

Die Frage ist doch, wo die Mehrleistung herkommen soll. 20% höhere IPC glaube ich nicht. Kommt die Mehrleistung rein durch Taktsteigerung, kann man den Trinity wahrscheinlich als Fail abhaken.

Begründung hab ich schon geliefert, siehe Stromverbrauch des BD. Wenn der trotz 32nm mehr zieht als der Vorgänger in 45nm, wie siehts dann beim Llano gegen Trinity aus? Der Llano ist schon in 32nm, hat wohl eine bessere IPC als der Zambezi.
Das würde heißen, das der Piledriver extrem besser sein müßte als der Zambezi und daran glaube ich nicht. Außer er kommt erst in 2 Jahren

Caanon · 25. Oktober 2011

Staubwedel schrieb:
20% höhere IPC glaube ich nicht. Kommt die Mehrleistung rein durch Taktsteigerung, kann man den Trinity wahrscheinlich als Fail abhaken.

20% wären wohl auch Overkill.
AMD erwartet 3 bis 5% höhere IPC beim Piledriver-Kern gegenüber einem Bulldozer-Kern bei gleicher TDP: http://www.tomshardware.com/reviews/fx-8150-zambezi-bulldozer-990fx,3043-9.html
Den Rest zu den 10 bis 15% mehr pro-Kern-Leistung holt man über den Takt raus.
Wie genau sich Trinity nun gegenüber Llano schlagen wird, der ja nicht auf Bulldozer-Kernen basiert, muss man dann natürlich ermitteln.
Mehr pro-Kern-Leistung bei gleicher TDP sollte gut drin sein.

Staubwedel schrieb:
Begründung hab ich schon geliefert, siehe Stromverbrauch des BD. Wenn der trotz 32nm mehr zieht als der Vorgänger in 45nm, wie siehts dann beim Llano gegen Trinity aus? Der Llano ist schon in 32nm, hat wohl eine bessere IPC als der Zambezi.
Das würde heißen, das der Piledriver extrem besser sein müßte als der Zambezi und daran glaube ich nicht. Außer er kommt erst in 2 Jahren

Die Begründung ist aber so wackelig wie ein zweibeiniger Hund auf Eis, da bei Zambezi im Grunde drei Probleme zusammen kommen, die bei Trinity aller Wahrscheinlichkeit nach nicht mehr zutreffen werden:
- Unausgereiftes Design
- Unausgereifter Fertigungsprozess
- Orochi-Die für Desktops wohl überdimensioniert, da er auch für die Server-Varianten Valencia und Interlagos geeignet sein muss

Staubwedel · 26. Oktober 2011

Wir sprechen hier aber davon, das solch starke Verbesserungen innerhalb weniger Monate kommen sollen. Und das halte ich momentan für unrealistisch.

Ich hätte nix dagegen wenn es so wäre, aber der BD spricht eben nicht dafür. Das muß jeder zugeben, der realistisch ist

bensen · 26. Oktober 2011

pipip schrieb:
bensen

also 20-30% könnten nicht nur durch die bessere ipc zustande kommen.

Hab ich ja auch nicht geschrieben. 10% durch höhere IPC und 10% durch höheren Takt (~4 GHz) macht dann etwa +20%.

Mehr Cache kannst du übrigens vergessen, das wird wohl eher weniger. Da muss auch noch ne große GPU Platz finden. Und das Ding soll ja nicht so groß oder noch größer als nen Zambezi werden. Würde mich nicht wundern wenn der komplett ohne L3-Cache daher kommt.

deadohiosky · 26. Oktober 2011

Nunja, bei Llano wird ja ca. 40% Die-Fläche für die GPU benötigt das wären bei 228mm² Gesamtfläche ca. 91,2mm² für die GPU.

Wenn man man ganz plump die Die-Fläche eines Bulldozers nimmt und durch zwei teilt...

sind wir bei ca. 160mm² angelangt.

Plus GPU wären das ca 250mm² also nur "ein wenig" mehr als Llano.

Bedenkt man dann aber auch noch, dass Trinity gerüchteweise gar keinen L3-Cache hat und durch Optimierung bzw. durch Wegfall obsoleter bzw. nicht benötigter Strukturen (z.B. HT Links für Chip-zuChip-Kommunikation) Platz eingespart werden kann und außerdem VLIW4 10% flächeneffizienter ist als VLIW5 kann man (rein theoretisch

) davon ausgehen dass Trinity min. genauso "groß" wie Llano wird und unter Umständen sogar deutlich kleiner.

pipip · 26. Oktober 2011

bensen

es war eher so gemeint. 1 Modul hat 2MB l2 Cache k. Das heißt bei 2Modulen habe ich 4 cores, und 4 MB l2cache. Ich spiele jz ein spiel was 4 cores unterstützt. ich kann die 4 cores optimal auskosten und hab eine etwas bessere Leistung als der alte A8 weil ich einen höheren Takt habe und eine gesteigerte IPC von sagen wir 10 % (mehr oder weniger gegen über dem FX 4100).
So jz starte ich ein Spiel dass aber nur 2 Threads aufteilen kann. Ok jz kommt Turbo 3.0. Es werden pro Modul (ein Modul besteht aus 2 Cores einer FPU und 2mb cache) ein Core deaktiviert.
Also noch mal 2 active Module mit jeweils einen Core deaktiviert. Wenn man jz in das Modul hineinschaut hat ein Core jz 2mb l2 Cache zur Verfügung und keine der FPUs musste deaktiviert werden. Das heißt die IPC steigt durch den größeren Cache (vllt so 3-5 % ? ist geraten ...)
Jz kommt es eben auf die Fertigungstechnik an. Wie hoch man den Takt setzen kann und welche Perfomancesteigerung (20-30 %) erreicht

Mich würde echt interessieren wie viel Mehrleistung der l3 cache beim Bulldozer bringt. kann man den nicht eh deaktivieren ?? der dürfte ja auch einiges Verbrauchen.

Caanon · 26. Oktober 2011

Staubwedel schrieb:
Wir sprechen hier aber davon, das solch starke Verbesserungen innerhalb weniger Monate kommen sollen. Und das halte ich momentan für unrealistisch.

Ich hätte nix dagegen wenn es so wäre, aber der BD spricht eben nicht dafür. Das muß jeder zugeben, der realistisch ist

Man fängt doch nicht erst mit der Entwicklung des Nachfolgers an, wenn der Vorgänger gerade eben auf den Markt gekommen ist. So funktioniert das nicht.
Geh davon aus, dass Piledriver bzw. Trinity jetzt schon seit Monaten in Entwicklung sind.
Ideen darüber, was man mit Piledriver gegenüber Bulldozer und was mit Trinity gegenüber Llano verbessern könnte, schwirren bei AMD mit Sicherheit schon über ein Jahr umher, aber es braucht eben alles seine Zeit.

Thane · 26. Oktober 2011

Seit dem Fail mit Bulldozer sollten einige hier doch langsam etwas skeptischer mit den Leistungsangaben von AMD umgehen, oder ?
Ich sehe hier nicht so schwarz wie vor dem Bulldozer Release, aber über 20-30% mehr CPU Leistung halte ich für etwas weit her geholt. In optimalen Szenarien vielleicht, aber nicht über einen ganzen Testparcours.

Mal sehen, wie hoch der Takt letztlich wird und vor allem, wie hoch der Energiebedarf.

Staubwedel · 26. Oktober 2011

@Caanon

Sicherlich ist die Entwicklung des Piledriver vor Zambezi-Launch gestartet worden, daran hege ich keine Zweifel.

Der BD wurde über Jahre entwickelt und kann trotzdem kaum einen Stich gegenüber dem Vorgänger machen. Selbst wenn man berücksichtigt dass ein neues Hardwaredesign entwickelt wurde, die Zeit der Entwicklung war viel zu lang für die letztendliche Leistung.
Das man da in deutlich kürzerer Zeit solch große Verbesserungen schafft ist deshalb eher Wunschdenken.

Aber warten wir mal ab, vielleicht werden wir doch positiv überrascht

bensen · 26. Oktober 2011

deadohiosky schrieb:
Wenn man man ganz plump die Die-Fläche eines Bulldozers nimmt und durch zwei teilt...

Ja klar, so ist das kein Problem. Es ging ja um das Thema "mehr Cache". Und da kommst du schon auf eine amtliche Fläche wenn du den ganzen L3 mitnimmst und evtl. noch vergrößern willst.

Aber auf dem jetzigen Schaubild ist ja auch kein L3-Cache vermerkt. Muss nichts heißen, aber ich halte das für nicht unwahrscheinlich, dass der ohne kommt. Die brauchen einfach nen kleinen Die im Lowcost/Mainstreambereich.

pipip schrieb:
es war eher so gemeint.

Also noch mal 2 active Module mit jeweils einen Core deaktiviert. Wenn man jz in das Modul hineinschaut hat ein Core jz 2mb l2 Cache zur Verfügung und keine der FPUs musste deaktiviert werden. Das heißt die IPC steigt durch den größeren Cache (vllt so 3-5 % ? ist geraten ...)

Ah ok. Das kam für mich nicht so rüber weil du hinter größeren Cache L2 und L3 geschrieben hast.
Aber auch so verstehe ich nicht so ganz wo der Unterschied zu Zambezi sein soll. Für den Turbo-Modus sollen hier ja ganze Module deaktiviert werden um für die anderen einen hohen Taktspielraum zu haben. Laut AMD funktioniert das aber ja noch nicht so richtig und es entsteht die Situation wie du sie darstellst. Die ist ja anscheinend von AMD aber nicht erwünscht. Inwiefern soll sich bei Trinity da was an der Hardware ändern, so dass diese Situation erwünscht ist?

Mich würde echt interessieren wie viel Mehrleistung der l3 cache beim Bulldozer bringt.
kann man den nicht eh deaktivieren ?? der dürfte ja auch einiges Verbrauchen.

SRAM verbrät eigentlich nicht so wahnsinnig viel. Bei AthlonII vs. PhenomII sinds ~15W laut HT4U.

pipip · 26. Oktober 2011

bensen
Naja man wird sehen, der jzige BD hat Turbo 2.0, Piledriver soll Turbo 3.0 haben. Man wird sehen was der unterschied zwischen beiden ist. Der turbo 2.0 deaktiviert einfach Module und übertaktet diese.
Somit fallen aber auch cache und FPUs weg. Bei deaktivieren der cores pro Modul hat dann aber jeder core eben mehr Ressourcen. Nur ist es halt fraglich wie das mit den Cache klappen könnte...

*DEFENDER(GER)* · 26. Oktober 2011

zur frage wer kauft so was - 50% gehen nach China, und demnächst wird sogar direkt bei TSMC gefertigt, so einfach ist das. Da ist der Massenmarkt den AMD auch dringend zum überleben benötigt (hab ich vor kurzem iwo gelesen)

Piledriver: würde auch sagen alles unter 4ghz Grund Takt bringt genau gar nix merk/fühl-bares hervor
AMD sollte sich lieber mal ganz schnell an einem multichip Llano DIE probieren; mit CrossfireX als Leckerli, da würden die grünen Jungs viel mehr reißen mit und btw. ich würde vlt. sogar ein paar alte Chipdesigner einstellen, noch denken Menschen etwas effiz. ;-)

Caanon · 26. Oktober 2011

Staubwedel schrieb:
@Caanon

Sicherlich ist die Entwicklung des Piledriver vor Zambezi-Launch gestartet worden, daran hege ich keine Zweifel.

Der BD wurde über Jahre entwickelt und kann trotzdem kaum einen Stich gegenüber dem Vorgänger machen. Selbst wenn man berücksichtigt dass ein neues Hardwaredesign entwickelt wurde, die Zeit der Entwicklung war viel zu lang für die letztendliche Leistung.
Das man da in deutlich kürzerer Zeit solch große Verbesserungen schafft ist deshalb eher Wunschdenken.

Aber warten wir mal ab, vielleicht werden wir doch positiv überrascht

Sicher, Bulldozer war Jahre in der Entwicklung. Aber seit wann hatte AMD auch Engineering Samples davon?
Allzu lange kann das eigentlich nicht gewesen sein, sonst hätte man viele Verbesserungen, die wohl erst in Piledriver zu finden sein werden, schon in Bulldozer eingebracht und er wäre zumindest etwas besser geworden. Denn es lag ja wahrscheinlich nicht nur an Bulldozers Design selbst, sondern zum Teil auch an GFs noch unreifer 32nm Fertigung, die sich von Quartal zu Quartal eh verbessert.
Bei Piledriver kann der Erwartungsfall deshalb eigentlich nur deutlich besser aussehen.

Außerdem, was verstehst du bitte unter großen Verbesserungen? Wir reden hier doch nicht davon, dass Bulldozer durch Verbesserungen zum IPC-Monster werden soll.
Hier geht es um 3 bis 5% höhere IPC und 6 bis 10% höheren Takt bei gleicher TDP.
Wenn selbst das bei AMD nicht drin sein sollte, dann gute Nacht AMD.

Staubwedel · 27. Oktober 2011

20% höhere CPU-Leistung ist ein großer Schritt, die IPC alleine interessiert da eher weniger, sondern was insgesamt rauskommt.

Herdware · 27. Oktober 2011

Staubwedel schrieb:
20% höhere CPU-Leistung ist ein großer Schritt, die IPC alleine interessiert da eher weniger, sondern was insgesamt rauskommt.

Das geht doch eigentlich nur über eine IPC-Erhöhung. Nur deutlich mehr Takt, würde den sowieso schon nicht berauschenden Lastverbrauch der Bulldozer-Architektur nur noch schlimmer machen. Für eine APU, die auch und vor allem für den Notebookmarkt gedacht ist, wäre das eine Katastrophe.

20% wären es außerdem, wenn die jetzigen Bulldozer-Cores (pro Takt) genauso viel leisten würden, wie ein alter K10(.5)/Stars. Das tun sie aber nicht. Sie sind über alles um ca. 10% langsamer und wie gesagt, höhere Effizienz und damit mehr Taktspielraum bei gleicher TDP ist auch Fehlanzeige.

Wenn also Trinity 20% mehr CPU-Leistung haben soll als Llano, dann müssen die Piledriver-Cores gegenüber den heutigen Bulldozern unterm Strich um mindestens 30% zulegen. Das bedeutet deutlich höhere IPC bei gleichzeitig erhöherter Effizienz.

Das ist schon verdammt ehrgeizig von AMD. Das letzte mal, dass sowas geschafft wurde, war bei Intels Core2. Es wäre auf jeden Fall der größte Performance/Effizienz-Sprung, in der "jüngeren" AMD-Geschichte (also in diesem Jahrtausend

). Nicht mal der geniale Athlon 64 konnte sich so deutlich vom den Athlon XP absetzen.

So sehr ich mir so ein kleines Wunder wünsche (das ja immer noch nicht ganz ausreichen würde, um die CPU-Leistung der APUs auf das Niveau von Sandy Bridge zu bringen, von Ivy Bridge ganz zu schweigen), halte ich es doch für sehr unwahrscheinlich.
Wenn Bulldozer 10% schneller und obendrein effizienter als Stars gewesen wäre, dann müsste Piledriver "nur" ca. 10% demgegenüber zulegen. Das würde der AMD-Folie über die zu erwartenden Steigerungen in den nächsten Jahren entsprechen und auch in etwa dem Schritt von Phenom I auf Phenom II.
Aber wie gesagt, das ist nicht der Fall.

Vielleicht stammt diese Aussage von AMD einfach noch aus Zeiten, als man (zumindest in der Marketingabteilung) noch davon ausging, dass Bulldozer eine gewisse Verbesserung gegenüber K10/Stars sein würde und kein Rückschritt.
Damit hat schließlich bis vor gut 2 Wochen jeder fest gerechnet.

Caanon · 27. Oktober 2011

Staubwedel schrieb:
20% höhere CPU-Leistung ist ein großer Schritt, die IPC alleine interessiert da eher weniger, sondern was insgesamt rauskommt.

Die 20% von Trinity gegenüber Llano halte ich auch eher für einen der besseren Fälle und würde im Durchschnitt "nur" mit irgendwas zwischen 5 und 15% höherer pro-Kern-Leistung gegenüber Llano bei gleicher TDP rechnen. Trinity wird einfach deutlich höher takten als Llano.
Windows 8 rechne ich da aber nicht mit ein.
Mit Windows 8 wird Trinity mit Llano wahrscheinlich den Boden aufwischen. Aber natürlich werden viele Systeme mit Trinity nie Windows 8 sehen, was ein großes Problem für AMD ist.

allel · 27. Oktober 2011

Na für den vermurksten Windows7 Scheduler kommt ja vielleicht noch ein Update. Hoffentlich nicht nur wenn Windows 8 Vista 2.0 wird.

das Trinity besser wird glaube ich durchaus:

zunächst die Probleme mit der 32 nm Fertigung (zu hohe Betriebsspannung) werden hoffentlich mit 28 nm überwunden.
Evt. kann AMD sogar zu TSMC wechseln, wenn aus Dresden nichts gescheites kommt.

Der L3 Cache von 8 GB und 2 Module fallen flach. Damit jede Menge Flächen-/ Kosten- und Stromersparnis. Dazu noch der Strukturgewinn.
Der Designansatz ist doch revolutionär mit 20 % Fläche etwa 80 % Leistung im Vergleich zum Vollkern zu haben.

Der Hauptvorteil des SB, die mOP-Cache für dekodierten Code für ca. 1500 16k Codepakete wird wohl erst 2013 das Frontend des Bulldozer entlasten.

Vielleicht bohrt AMD zwischenzeitlich den L1 Daten-Cache von nur 16 KB wieder auf.

Und dann hat er ja neben AVX, schnellerem AES auch noch XOP (zusätzliche Vektorbefehle aus AES2), LWP( Abruf von Performencedaten von Entwicklern im Usermode) und einen Hardwaredivider.

Und mit FM1/FM1+ existiert im Gegensatz zu AM3+ eine moderne Plattform, welche USB3 und PCIe3 ohne Probleme anbindet.

Knuddelbearli · 29. Oktober 2011

nun denke ne menge dürfte alleine duch einen ebsseren fertigungsprozess erreichbar sein

vergleicht mal den Phenom2 X4 940BE gegenüber den letzten die wir hatten und 45nm lief von anfang an sehr gut.

Frage ist halt ob sie ihn in den Griff bekommen 65nm haben sie zB nie wirklich in den griff bekommen

Lonely Shepherd · 31. Oktober 2011

Wenn man bedenkt, dass die Bulldozer Architektur durch die zum Einsatz gekommenen "automatischen Design Prozesse" nun von Ingenieur-Hand aus stark verbessert werden kann/konnte, eine GPU mit effizienteren VLIW4 hineingepakt wird und ein User mit einem Engineering Sample Trinity bzw. einem Piledriver-Kern bereits eine 16% bessere IPC als Llano unter Linux bei gleichem Takt attestiert hat, dann sind diese Angaben in der News durchaus glaubhaft.

Btw. auf dieser Folie ist sehr wahrscheinlich von mobile Prozessoren die Rede, deswegen auch SODIMM beim Speicherkontroller.

News AMDs „Trinity“ 20–30 Prozent schneller als „Llano“?

Lt. Junior Grade

Commander

Lt. Junior Grade

Commander

Fleet Admiral

Banned

Fleet Admiral

Lt. Junior Grade

Fleet Admiral

Commander

Fleet Admiral

Fleet Admiral

Cadet 4th Year

Lt. Junior Grade

Commander

Fleet Admiral

Lt. Junior Grade

Lt. Commander

Commodore

Lieutenant

Ähnliche Themen

Passend zum Thema