News 15 „Haswell“-Prozessoren für Notebooks benannt

hier dürfte man ähnliche Zahlen haben wie in der ct

http://atenra.blog.com/2012/02/01/amd’s-bulldozer-cmt-scaling/

1024.jpg


1024.jpg


1024.jpg


Was sagt uns das jetzt?

Bei Intel skalieren Kerne an sich praktisch 1:1 - SMT setzt dann noch etwa 24% drauf.

CMT skaliert hingegen mit 67%.

Skaliert nun die Intel CPU besser oder die AMD CPU?

Schauen wir uns Intel 2 + SMT zu 4Kern + SMT an -> genau 200%

Bei AMD 2M4k zu 4M8K -> ebenfalls genau 200%

=> beide CPU skalieren genau gleich über Threads mit der Performance.

Aber:

CMT sollte nach natürlich mit weniger Fläche und Transistoren auskommen. Und das ist auch das Ziel - was weder bei Vishera noch bei Trinity aber deutlich erkennbar ist und eigentlich das Entscheidende ist (erinnern wir uns an die AMD Folien, CMT müsste mit ~125% der Fläche eines SingleCoreDesigns auskommen) - die Intel DIE ist aber sogar kleiner. Selbst bei "selber" Fertigung.

Wenn ein Llano also ~200mm² für 4 Kerne brauchen würde müsste Trinity mit ~125mm² auskommen... um bei AMDs Zahlen zu bleiben. Und das auch noch bei selber IPC Pro Kern!

Dazu kommt dass ein einzelner, nicht parallelisierbarer Thread fast doppelt so schnell ist und der Vorteil dass der Turbo aggressiv pro Thread/Kern gefahren werden kann.
Zusätzlich kommt Intel mit weniger Takt aus.

Deswegen kann man nicht sagen dass CMT besser sein muss als SMT bzw klassische voll ausgebaute Kerne. Wenn ich Fläche einspare, und breite Leistung abrufe (zb Server) sicher. Aber bei Consumer Märkten ist heute eher das "SingelCore" entscheidend (0,76 vs 1,34). Nur weil die bei AMD so niedrig ausfällt fährt man ja massiv hohen Takt.

Im Artikel heißt dass dann so:
We start with POV-Ray, AMD’s FX single thread performance is 21% lower than last generation Phenom II and 74% lower than Intel’s Core i7.
 
Zuletzt bearbeitet:
DinciVinci schrieb:
Bitte mach Dich mit den Grundlagen der verschiedenen Mikroprozessorarchitekturen vertraut!

Kannst du auch was anderes außer heiße Luft zu produzieren?

Der Begriff Simultaneous Multithreading (kurz SMT; deutsch etwa simultaner Mehrfadenbetrieb) bezeichnet die Fähigkeit eines Mikroprozessors, mittels getrennter Pipelines und/oder zusätzlicher Registersätze mehrere Threads gleichzeitig auszuführen.
 
Zuletzt bearbeitet:
@Krautmaster:

Du verwechselst immer noch IPC und Multithread-Architektur. Lies bitte die Analysen von Andreas Stiller. Ich habe jetzt auch keine Lust mehr, darauf einzugehen.

@Mr. Kaijudo:

Im Gegensatz zu Dir liefere ich hier noch fachliche Argumente.
 
Elkinator schrieb:
nein, eher die integration vom speichercontroller und das entfernen des FSB, das wurde halt bei nehalem auf einmal gemacht udn deswegen ist da die IPC im vergleich zu core2 stark gestiegen.
Der Performancesprung von Core auf Nehalem war kleiner als von Nehalem auf Sandybridge. Es gibt mehr zu verbessern als nur die Speicheranbindung.

Elkinator schrieb:
unt trotzdem wird SMT bei haswell nicht mehr bringen als bei ivy.
ich gehe nicht davon aus das intel bei haswell die herne schlechter auslasten kann als beim vorgänger.
Also du schreibst da schon komisches Zeug. Warum sollte man SMT nicht verbessern können? Wenn man die Pipeline an manchen Schwachstellen etwas aufbohrt und einen kern "breiter" baut, wird die Leistung bei 2 Threads erhöht. Und ja, bei nur einem Thread werden vielleicht nicht alle Einheiten voll ausgelastet.
Und Haswell wird breiter. Die Architektur wurde schon vorgestellt, einfach mal reinschauen.
Ich wüsste jetzt nicht wie man jetzt schon vorraussagen könnte das SMT nicht mehr bringt.

SMT bringt ca. 30% leistung bei 7% mehr transistoren
CMT bringt ca. 80% leistung bei 12% mehr transistoren
Das hat welcher Test ergeben? Sorry aber solche Marketingwerte sind doch echt uninteressant.
Elkinator schrieb:
das problem bei AMD sind die decoder, nicht die modulbauweise.
auch SMT würde nicht viel bringen wenn der decoder die bremse ist.
Die konsequente Modulbauweise beinhaltet nun mal nen gemeinsamen Decoder. Und dort scheint es wohl Nachteile zu geben. Sonst würde AMD nicht wieder auf getrennte Decoder setzen.
Damit nähern sich die beiden Konzepte auch wieder ziemlich an. Es gibt da kein reines schwarz-weiß.

DinciVinci schrieb:
Wenn man die IPC von AMD und Intel gedanklich mal normiert, sieht man eindeutig, wie schwach Intels SMT gegenüber CMT ist.
Insgesamt ist das keine Schwäche. Das ist einfach nen anderes Konzept. Man erhält eine starke Singlethread-Leistung und kann dafür bei 2 Threads nicht so stark zu legen.
Ich sag ja auch nicht wenn man AMD die Hälfte der Kerne klaut, steht man Multithreaded auch nicht mehr so gut da. SMT "ermöglicht" eben ne starke IPC.

Es ist alles ne Frage wie man das Transistorbudget einsetzt. Beide Konzepte haben Vor- und Nachteile.

PS: Man kann auch Argumente bringen. Ihr greift euch nur noch persönlich an. Jeder zweite Satz lautet. " Du hast keine Ahnung." oder "Das ist unsinn.".
 
Zuletzt bearbeitet:
Elkinator schrieb:
du bist echt lustig, hast keine ahnung von der materie und machst auf wichtig.

du schreibst so viel schwachsinn zun SMT/CMT, das tut echt weh...

ums mal mit einem Zitat zu beantworten...

Mr.Kaijudo schrieb:
Kannst du auch was anderes außer heiße Luft zu produzieren?

dem schließe ich mich an.

@Elkinator

Jetzt erklär mir nochmal wieso CMT besser ist als SMT bitte. Deine Aussage. Bitte untermauert mit Quellen, Ergebnissen, und deinem grenzenlosen Fachwissen auf Microprozessorarchitekturebene.

CMT ist nur dann besser, wenn man die Einsparungen bei Fläche/Transistoren einen höheren Benefit bringen als die Leistung die man einbüßt durch Modulbauweise (relativ, nicht absolut).

@DinciVinci

danke, jetzt haben wir schon heiße Luft in Form von Quellen wie "Lies bitte die Analysen von Andreas Stiller" und "ct 23/11, S.136 - 142" :rolleyes:
 
Zuletzt bearbeitet:
Elkinator schrieb:
nein, ich nicht, nur alle anderen hier^^

Das ist normal, daran habe ich mich gewöhnt. :) Ich sehe es als unterhaltsame Laune der Gesellschaft. :D

@Elkinator:

Jo, verschwinde jetzt hier auch. Sonst bin ich morgen für meine LAN-Party nicht mehr fit genug. ;)

Krautmaster schrieb:
@DinciVinci

danke, jetzt haben wir schon heiße Luft in Form von Quellen wie "Lies bitte die Analysen von Andreas Stiller" und "ct 23/11, S.136 - 142"

Reicht Dir die Quelle jetzt auch schon nicht mehr? Noch konkreter geht es ja wohl nicht.
 
Zuletzt bearbeitet:
@DinciVinci

zugreifbare Quellen wären gut da ich nicht einsehe 2,50 nun für die ct auszugeben um dann zu lesen dass da dasselbe steht wie oben in den Grafen, nämlich das bei CMT 1 -> 2 Threads stärker skaliert als bei SMT.

Steht da wie viel real an Fläche / Transistoren gespart wurde durch die Nutzung von CMT?
Ergänzung ()

Llano: ~225mm²

11-1080.4078702993.jpg


Trinity: ~ 240mm²

Trinity_Die_Shot.jpg


Ich sehe jetzt aus den DIE Shots keine massive Einsparung an Fläche durch den Umschwung auf Module anstelle vollwertiger Kerne.

Wenn es nach AMD geht und den Folien müsste Trinitys CPU Part nur etwa 25% größer sein als zwei der Llano Kerne was eine deutlich kleineren CPU Bereich nach sich ziehen würde. Das hat schon mal nicht hin. Man hat etwas eingespart, aber bei Weitem nicht von 200% = Dualcore auf 125% CMT Design.

(unter Annahme selbes Architekturdesign pro Kern bei etwa gleichbleibender Leistung / Thread)

Und parallel dazu ist auch noch die Leistung bei Auslastung einzelner Threads massiv gesunken was über Takt ausgeglichen werden muss.
 
Zuletzt bearbeitet:
du kannst auch kein DIE shot von llano mit trinity vergleichen, das ist ja wohl jetzt nicht dein ernst?
blöder geht es ja echt nicht mehr...

zeig mir doch bitte ein DIE shot von llano mit CMT, so etwas wirst du aber wohl kaum finden.

und das die IPC gesunken ist, ist auch egal, trinity ist ja auch kein K10, das kann man einfach nicht so vergleichen wie du es dir vorstellst.

trinity unterstützt auch SSE4.1/4.2, XOP, AVX, CVT16, CLMUL, AES, FMA3, FMA4 das kann man einfach nicht 1:1 vergleichen...
man sieht anhand der beiden DIE shots also nichts!
Ergänzung ()

ausser ein dummes beispiel mit 2 DIE shots das keinen sinn ergibt ist von dir jetzt nicht viel gekommen.
eine diskussion ist eben nicht möglich, wenn man schon bei deinen argumenten siehst das du keine ahnung hast...
 
allerdings. Befehlsätze brauchen Platz. Solange die sich aber nicht direkt in Mehrleistung bemerkbar machen muss ich die auch nicht massiv berücksichtigen.

AMDs Argument war also eine neue Architektur mit weniger Leistung bei mehr Takt bei etwa ähnlichem Transistorbudget zu bringen?

Welches Design bildet die Basis für AMDs heutige Module? Wie würdest du das fiktive SingleCore Design bezeichnen?

An den DIE Shots sieht man eins. Dass das Design nicht wirklich effizienter geworden ist (absolut nur weil man die Spannung massiv aufgrund der ausgereifteren Fertigung senken konnte). Die CPU Parts kann man vergleichen - nicht unbedingt über Architektur / Kerndesign sicher,aber über deren Größe und der daraus generierten Performance.

Edit:

naja, dann stehen also viele quellenlose Worte, Beleidigungen und Zitate aus AMD Marketing Folien gegen 2 DIE Shots und einigen Diagrammen bezüglich Skalierung oben.
Man könnte auch sagen es steht "nichts" gegen "etwas".

Edit2:

Naja, wie wärs wenn du die "ahnungslosen" hier etwas mit deinem Wissen bereicherst. Ganz im Sinne eines Forums. Ich lerne gerne dazu. Aber nicht über heiße Luft sondern fundierten Quellen.
 
Zuletzt bearbeitet:
Elkinator schrieb:
zeig mir doch bitte ein DIE shot von llano mit CMT, so etwas wirst du aber wohl kaum finden.

und das die IPC gesunken ist, ist auch egal, trinity ist ja auch kein K10, das kann man einfach nicht so vergleichen wie du es dir vorstellst.

Ach der Nachteil ist egal aber der Vorteil ist das absolute Killerargument :lol: scheiss auf die IPC Hauptsache CMT spart ein bisschen Fläche.

Für Multithreading ist CMT klar das bessere Konzept aber darum geht es hier auch nicht, es geht um das Gesamtbild und da liegt nun mal klar SMT vorne da dieses gepusht wird und die Intel CPUs nun mal vorne liegen.
 
Zuletzt bearbeitet:
nochmal CMT ist sicher alles andere als "schlecht" nur fällt der Benefit Stand heute noch recht bescheiden aus und bringt eben oft auch Nachteile sofern ich heutige Produkte anschaue.

Und vielleicht muss sich AMD dann fragen ob es "SSE4.1/4.2, XOP, AVX, CVT16, CLMUL, AES, FMA3, FMA4 " alles braucht wenn unterm Strich deutlich weniger reale Leistung bei rauskommt. Kein Hahn kräht danach wenn in 4 Jahren Trinity vor dem i3 liegt weil ab und an FMA4 reinhaut. Auch dann will AMD nämlich noch CPU verkaufen - so denk ich doch.
 
Zuletzt bearbeitet:
@Elkinator und DinciVinci

Wem wollt ihr etwas vormachen? Haltet ihr die anderen und diejenigen, die sich das hier - so wie ich - einfach nur durchlesen, für so dumm, dass wir nicht merken, dass da von euch beiden so gut wie keine Argumente kommen?

Und die Beleidigungen könnt ihr euch sparen.
 
Da kann ich mich calluna nur anschließen. Ich hab die Diskussion jetzt auch komplett durchgelesen, ohne sehr viel Ahnung von CPU-Architektur zu haben. Und auf eurer Seite erkenne ich null (in Zahlen: 0) stichhaltige, fundierte Argumente, nur Zahlen ohne greifbare Quelle und Beleidigungen.
 
Also vorgewissen Intel-Freunde hatte ich damals ein wesentlich vernünftigeren Eindruck, aber das ist eine andere Geschichte und darauf habe ich auch keine lust weiter ein zu gehen.
Ich werde jetzt hier lediglich einige Gedanken machen. Und hier geht es nicht um AMD Prozessoren vs Intel Prozessoren sondern ich mache etwas das mir etwas mehr Objektivität verhelfen soll.
Also ich werde hier jetzt mal eine Basis schaffen. Ihr wollt doch CMT mit Intels HTT (SMT) vergleichen. Dann macht das doch ordentlich und nicht halbherzig. Sry aber manche Leute hier wollen SMT als besser darstellen weil die Intel Prozessoren momentn besser Laufen und meinen eine Technik wie CMT sei schlechter ? Das ist doch kein Vergleich von CMT mit SMT lol. Wie bereits schon gesagt, scheitert es bei den AMD Prozessoren daran, dass die IPC nicht passt und das liegt bestimmt nicht an CMT.

Wenn ihr also vergleichen wollt was besser ist für welche Anwendung dann vergleicht doch einen 2 Moduler mit 4 threads mit einem 4 Moduler mit 4 threads. Dann vergleicht einen Intel Dualcore mit HTT (SMT) mit einem Intel Quadcore (beide also auch 4 threads).
Dann vergleicht aber nicht die Intel und AMD Prozessoren sondern nur was die Vorteile von CMT und HTT ist.
Ihr werdet merken dass die single Core performance nichts mit SMT oder HTT zu tun hat sondern allgemein nur mit der IPC und dem richtigen Takt. HTT und CMT sind nämlich nicht für die IPC oder ähnliches zuständig sondern dazu dass die Performance bei gleicher Fläche besser ausgelastet wird.
Das heißt wenn ihr ein Programm hat mit einem fetten Core der viel Logik hat und schnell ist und die gleiche Fläche belegt wie ein Prozessor mit einem CMT modul, kann der single core schneller sein wenn das Programm nur ein Thread befeuert und ein CMT Modul kann schneller sein wenn das Programm 2 Threads gut befeuert. Aber in diesem Ansatz wurde SMT gar nicht erwähnt. HTT würde also den Vorteil von Intel bringen, dass es hier quasi ein kompromiss wäre. Man würde also in der selben Fläche ein Single core mit HTT also bei einem Programm das 2 threads befeuern können im vergleich zum single core ohne HTT eben noch etwas mehr rauskitzeln können.

Insofern hat Krautmaster schon recht, die idee von CMT ist ja die Fläche besser auslutschen zu können. Das schafft AMD ja auch im Server. Doch muss man bedenken dass auch das AMD Fanlager recht hat. Die Performance des Bulldozer ist nicht deshalb schlechter wegen CMT sodern dass im CMT-Modul-Bauweise noch nicht alles optimal umgestetzt ist und eben noch anpassungen fehlen.

Man spricht also hier davon, dass CMT in der Realität nicht das bringt was sie theoretisch bringen soll. Aber lol frage, wo in der Technik ist das nicht so. Selbst Intel wird von HTT damals mehr versprochen haben. Selbst Intel hat jahre gebraucht bis sie HTT ordentlich integrieren konnten. AMD hat gerade mal die 2 te Generation der CMT-Prozessoren draußen... Aber zu meinen CMT ist schlechter als Inte HTT (SMT) weil Intel Prozessoren am Desktop schneller ist, ist doch kein ordentlicher Vergleich.
Wenn dann CMT und HTT in den jeweiligen Prozessor vergleichen und herausfinden, wie profetiere ich von CMT und wie von HTT. Dann kann man überlegen, welche Technik für welche Anwendung eventuell sinvoller ist.

MikelMolto
Nur um dir wieder einen Spiegel vor zu halten, da man schon wieder nur aus der zweiten Reihe ruft, zu denen hält die sowieso egal was ist immer zu Intel halten, dann noch auf objektiv macht, obwohl man mit emotionalen Mitteln die Argumentation des anderen Lager als subjektiv darstellt.

Krautmaster
Zuerst 2 Bilder vergleichen ohne eine Basis (sry 2 screenshots...) und jetzt noch sagen, du zählst das nicht dazu, weil das ja momentan keiner nutzt ? Ist das ein Scherz ?
Du vergleichst also 2 Architekturen. Das CMT besagt dass ein Modul 80% eines Dual Core besitzt.
Das heißt wenn du CMT ordentlich vergleichen möchtest, dann einen Bulldozer mit 2 Modulen jeweils einen Core mit einen Bulldozer mit 1 Modul und 2 Threads.
Wenn du ein Llano mit einem Modul vergleichen willst, dann sollten die Cores genauso viele Piplines haben. Dann kannst du sagen ja der oder der ist besser. Aber du vergleichst hier auch 2 verschiedene paar Schuhe. Noch schwerwiegender du vergisst dass der Trinity wesentlich mehr Techniken mit sich bringt und meinst jetzt, das ist totes Gebiet, weil es kaum genutzt wird ?

Dann wird noch Elkinator und DinciVinci zugesagt, Sie haben keine Argumente ^^ Und wie wird das gemacht xD mit keinen Argumenten :D oder mit solchen, die mit der ganzen Diskussion nichts zu tun haben und nicht reinpassen ^^

Ps: wenn ein Ingeur hier im Forum sagt, jemand hat mit einer Materie keine Ahnung, sollte er ebenso seine qualifikationen nennen. Klar ist das keine Argumentation auf die man Disskusionen aufbauen soll, denn manche die sich auch als Hobby auseinandersetzen können großes Wissen anreichern. Doch sollte man dann doch schaffen auch auf sachliche Ebene es zu wiederlegen oder einfach den Mut haben, vllt doch einzugestehen doch noch nicht gut genug informiert zu sein. Aus Fehlern lerne ich und lasse mich aus den Gründen gerne belehren, denn der wahre Sieger ist der, der aus seinen Fehlern lernt.
 
Zuletzt bearbeitet:
pipip schrieb:
Ihr werdet merken dass die single Core performance nichts mit SMT oder HTT zu tun hat sondern allgemein nur mit der IPC und dem richtigen Takt. HTT und CMT sind nämlich nicht für die IPC oder ähnliches zuständig sondern dazu dass die Performance bei gleicher Fläche besser ausgelastet wird.
Naja indirekt schon. Bei CMT musst du kleinere Kerne nehmen. Wenn Intel ein Modul mit 2 Integer-Cores basteln würde, müsste man so einen Haswell-Core derbe abspecken um flächenmäßig nicht größer zu werden. Das resultiert automatisch in eine geringere Single-Thread-Performance.
 
In diesem Thread geht es um die Ankündigung der Haswell CPU's für Notebooks.
Das Konzept CMT mag ja besser sein und die Zukunft bedeuten aber Intel setzt auf HTT und wird und kann das kurzfristig auch nicht ändern.
Wenn AMD es schafft, mit CMT und seiner APU dem Intel ordentlich Konkurrenz zu machen, dann freut mich das, weil ich da auch von profitiere.
Im Endeffekt ist mir vollkommen wurscht, ob da Intel oder AMD drauf steht. Das Teil muss optimal dafür sein, was ich damit mache.

Ich finde es wichtig, dass man in so einem Forum mitreden darf ohne ein Fachmann zu sein.

Mich würde interessieren, woher die Aussage kommt:
CMT bringt ca. 80% leistung bei 12% mehr Transistoren. Evtl. hat da mal jemand einen link für mich, weil so richtig kann ich das nicht glauben und die Aussage ist mir auch etwas zu allgemein.

dann vergleicht doch einen 2 Moduler mit 4 threads mit einem 4 Moduler mit 4 threads. Dann vergleicht einen Intel Dualcore mit HTT (SMT) mit einem Intel Quadcore (beide also auch 4 threads)
Steht doch in der Grafik in Post #61 von @Krautmaster. Muss man nur richtig interpretieren.
 
pipip schrieb:
Krautmaster
Zuerst 2 Bilder vergleichen ohne eine Basis (sry 2 screenshots...) und jetzt noch sagen, du zählst das nicht dazu, weil das ja momentan keiner nutzt ? Ist das ein Scherz ?
Du vergleichst also 2 Architekturen. Das CMT besagt dass ein Modul 80% eines Dual Core besitzt.
Das heißt wenn du CMT ordentlich vergleichen möchtest, dann einen Bulldozer mit 2 Modulen jeweils einen Core mit einen Bulldozer mit 1 Modul und 2 Threads.
Wenn du ein Llano mit einem Modul vergleichen willst, dann sollten die Cores genauso viele Piplines haben. Dann kannst du sagen ja der oder der ist besser. Aber du vergleichst hier auch 2 verschiedene paar Schuhe. Noch schwerwiegender du vergisst dass der Trinity wesentlich mehr Techniken mit sich bringt und meinst jetzt, das ist totes Gebiet, weil es kaum genutzt wird ?

Das is vollkommen richtig, Trinity bringt deutlich mehr Erweiterungen mit als zb noch Llano. Das macht den Kern als solchen größer und sorgt offensichtlich zusammen mit etwas besseren Stromspartechniken dafür, dass ein Trinity Modul fast so groß wird wie zwei komplett autarke Llano Kerne.

Trotz dieser Große und dem benötigten Transistor-Budget ging aber die Leistung total nach hinten los, denn ein Llano Kern leistet mehr, bei weniger Takt.

Die DIE Shots sollen nichts über die zugrundelegende Architektur oder das Featureset sagen. Es geht schlicht darum, dass das CMT in erster Linie Einsparungen bei Fläche und Transistoren mitbringen soll. Das macht es ja vielleicht auch, gemäß AMDs Rechnung müssten ein fiktiver Trinity Dualcore also von ~125 Flächeneinheiten auf ca 200% Flächeneinheiten wachsen. Ein Fiktiver Trinity Dualcore wäre also relativ groß und trotz dieser Größe schwächer als ein Llano Dualcore?

Wieso aber bläst man den Kern so auf wenn man dann den CMT Vorteil komplett über Bord kippt? Aufblassen würde Sinn machen wenn die IPC / Leistung pro Kern / Thread deutlich gestiegen wäre, aber das Gegenteil ist der Fall - und das auch bei Beanspruchung eines einzelnen Threads wo zb der Decoder praktisch gar kein Flaschenhals bilden kann.

Und auch du machst irgendwie eine SMT vs CMT Diskussion draus aber wie schon gesagt sind beides schlicht Techniken - nicht ich habe gesagt dass SMT grundsätzlich klar die bessere Technik ist, im Gegenteil, in Summe sollte CMT deutlich mehr Vorteile bieten - Stand heute aber nicht erkennbar.

Ich sagte SMT macht heute im Consumer Markt mehr Sinn da man viel Leistung auf wenige Threads bereitstellen kann und diese Leistung / Thread hoch sein sollte da typisches User Szenario (Intel hat dasselbe ja mim P4 gelernt...). Und AMD lässt bei CMT bzw ihren Modulen eines vollkommen offen - sinkt die Leistung auch bei einzelnen Threads gegenüber einem SingleCore? Offensichtlich sogar mehr als man angenommen hat - siehe Leistung 1 Thread Llano vs 1 Thread Trinity oder Vishera gegen Phenom II.

Die Skalierung von 1 auf 2 Threads ist mit 67% ja sehr gut - weit besser als bei SMT, nützt aber bedingt was wenn der einzelne Thread schon ne Krücke ist.

Im Server Segment geht es eher um MultiThread. Hier sollte CMT ja mit wenig Transistoren nahezu die doppelte Leistung abbilden können.

Sollte, dann sollte aber ein Vishera auch lieber 8 Module und 16 Kerne auf seine 300mm² packen - sodass man auch etwas von dem CMT Vorteil spürt. Mag sein dass der Overhead CMT (außerhalb des Kerns) so groß ist, dass er den Flächenanteil fast wieder auffrisst. Sieht bei Trinity so aus und bei Vishera kommt noch der riesige L3 dazu.

pipip schrieb:
Das heißt wenn du CMT ordentlich vergleichen möchtest, dann einen Bulldozer mit 2 Modulen jeweils einen Core mit einen Bulldozer mit 1 Modul und 2 Threads.
Wenn du ein Llano mit einem Modul vergleichen willst, dann sollten die Cores genauso viele Piplines haben

na Moment, da sind wir lang drüber raus. Da man nicht weiß wie groß ein Singlecore Bulldozer wäre kann man das schlecht vergleichen. Die Skalierung 1 Modul 1 Thread auf 1 Modul 2 Threads ist ja bekanntlich gut - wieviel Transistorbudget spart aber AMD wirklich?
Die Skalierung zweifelt ja auch keiner an, aber wie gesagt, wenn die Leistung auf einem Thread so mau ist dann kann die Skalierung noch so gut sein...
Logischerweise sind 2 Thread auf 2 Modulen etwas fixer als 1 Modul mit 2 Threads. Auch kein Geheimnis.

Was kann ein nativer einzelner Kern ohne Modulbauweise in Bulldozer Architektur leisten? So viel wie ein Modul mit 1 Thread belastet? 1 Modul 1 Thread - die Leistung kennt man ja - und ist sehr bescheiden. Den nativen SingleCore Bulldozer wird man nie wissen was der leisten würde, also kann man nur mit anderen Vorgängerarchitekturen aus dem Haus vergleichen, also ein Llano Kern zB. - auch da dieser ebenfalls in 32nm daherkommt.
Ergänzung ()

MikelMolto schrieb:
Mich würde interessieren, woher die Aussage kommt:
CMT bringt ca. 80% leistung bei 12% mehr Transistoren. Evtl. hat da mal jemand einen link für mich, weil so richtig kann ich das nicht glauben und die Aussage ist mir auch etwas zu allgemein.

ich meine die wurden in einer AMD Folie zu Bulldozer mit Modulen generell genannt. Die 12% machens jetzt aber nur bedingt besser da diese ja noch deutlicher machen dass CMT heute noch nicht diese Einsparung bei an Budget mitbringen.

Edit:

Beispielsrechnung (mm² so gewählt dass vernünftige Zahlen rauskommen, keine realen werte. mm² sind einfach nur Flächeneinheiten)


Wenn jetzt 2x Llano Kerne ca so groß sind wie 1 Trinity Modul, dann müssten die zusätzlichen Trinity Features das Modul extrem aufblasen.

Angenommen 1 Llano Kern hat 100mm² - haben sie nicht ich weiß, aber damit rechnet sichs gut.
Llano mit CMT, also ein Llano Modul, müsste nach AMD Logik ~112mm² haben und ~ 180% eines Llano Dualcores (mit ~200mm²) leisten können.

korrekt?

Jetzt sehen wir aber dass ein Llano Dualcore nur dezent größer ist als ein Trinity Modul. Rückwärts gerechnet müsste ein also etwa 200mm² großes Trinity Modul ja ~ 12% schrumpfen und wäre dann so groß wie ein fiktiver Trinity Singelcore.

Also 200mm²*100 / 112 = ~ 180mm² die ein fiktiver Trinity Singlecore brauchen würde.

Wie verhält sich die Performance? Sicher, ein 200mm² großes Trinity Modul wäre Faktor 1,8 fixer bei 2 Threads als der dezent kleinere 180mm² Trintiy Dualcore, aber wieso ist die Performance des SingleCores verglichen mit Llano so mau?

Ich würde jetzt erwarten, dass ein ~ 180mm² Featureset aufgeblasener Trinity SingleCore von sich aus schon weit mehr Power / Takt bietet als zb der Llano Singlecore mit nur 100mm²...

Das Gegenteil ist aber der Fall.

Ich weiß auch dass ein Trinity Modul etwas kleiner ist als zwei Llano Kerne, aber im kleinen prozentualen Bereich. Ein mit AMD Zahlen errechneter fiktiver Trinity Singlecore wäre dennoch sehr groß gegen einen Llano Kern bei weniger Leistung. Da passt dann was mit der Architektur nicht.
 
Zuletzt bearbeitet:
AMD hat gesagt, ein modul entspricht der performance eines fiktiven bulldozer dual cores

Übrigens ich hab kein CMT vs SMT beschworen ^^ darüber wurde ja schon.ordentlich diskutiert. Ich sage nur, man sollte nicht sagem SMT ist besser weil die Intel CPUs schneller ist. Wäre ja die gleiche Aussage wenn AMD einen Phenom II mit SMT auf den Markt gebraucht hätte. Würde man dann sagen AMDs SMT ist langsamer, obwohl es die gleiche Technik wäre ?

KM
Soviel ich weiß entspricht die aussage 80% eines dual cores integer Anwendungen. Ich bin leider im Internet, aber ich glaub es gab letztens erst irwo ein test wo man 4 threads : 2 M/4T mit 4M/4T getestet hat. Hier konnte man sie 80-100 % bei den Anwendungen rauslesen. Ein Modul mit 1 core hat übrigens alleine den massigen l2 cache

CMT ist rein theoretisch wesentlich potenter, wenn alles gut abläuft. Doch das liegt an der Software.Somit ist ein zwischenschritt wie SMT das Intel verwendet bei jetzigen Software-Umfeld geeigneter und effizienter.
 
Zuletzt bearbeitet:
Krautmaster schrieb:
....
Angenommen 1 Llano Kern hat 100mm² - haben sie nicht ich weiß, aber damit rechnet sichs gut.
Llano mit CMT, also ein Llano Modul, müsste nach AMD Logik ~112mm² haben und ~ 180% eines Llano Dualcores (mit ~200mm²) leisten können.


korrekt?...

Die angaben bezogen sich immer auf einen theoretischen SingleCore (SC)
Ein Dualcore würde 200% des Platzes eines SCs benötigen und liefert bis zu 200% der Leistung eines SCs
Ein Modul würde 120% des Platzes eines SCs benötigen und liefert bis zu 180% der Leistung eines SCs
Intels HT würde 105% des Platzes eines SCs benötigen und liefert bis zu 125% der Leistung eines SCs


Krautmaster schrieb:
....
Ich würde jetzt erwarten, dass ein ~ 180mm² Featureset aufgeblasener Trinity SingleCore von sich aus schon weit mehr Power / Takt bietet als zb der Llano Singlecore mit nur 100mm²...

Ich weiß auch dass ein Trinity Modul etwas kleiner ist als zwei Llano Kerne, aber im kleinen prozentualen Bereich. Ein mit AMD Zahlen errechneter fiktiver Trinity Singlecore wäre dennoch sehr groß gegen einen Llano Kern bei weniger Leistung. Da passt dann was mit der Architektur nicht.


Immer dieses Leistung/Takt. Wichtig ist einzig und allein die Leistung/Wattstunde! Und da ist Trinity nicht schlechter als Llano und das obwohl K10.5 schon zu tote optimiert ist und bei K15 noch viel Potential vorhanden ist.

Was bringt aber ein aufgeblasenes Trinity Featureset, wenn es der Benchmark nicht unterstützt? Schauen wir uns mal Cinebench 11.5 an. Würde man stattdessen Cinema 4D R13 oder R14 einsetzen, würde der Trinity wesentlich besser gegenüber den Llano abschneiden. Denn: FX-8120 @4,5GHz vs. Phenom II X6 @3,8GHz
Bei Cinebench R11.5 erreicht der FX 14% mehr Punkte als der X6 beim Rendern mit Cinema 4D R13 ist der FX aber plötzlich 40% schneller als der X6.
Wenn wir jetzt noch nen Benchmark finden würden, der FMA unterstützt, dann würde die K10.x Architektur gegenüber K15 kein Land mehr sehen.

Jetzt noch nen kleiner Einwurf zum Thema SMT/CMT

Programm 3dsmax 2011 + Vray 1.5SP5

FX 8120 @4,5 GHZ : ~ 679s
I7 2600K @4,5 GHZ : ~ 621s
FX 8350 @4,5 GHZ :~ 580s


Und nun Spannen wir den Bogen zum eigentlichen Thema: Haswell

Intel wird mit Haswell erst mal ähnliche Probleme haben wie AMD mit ihrer K15 Architektur.
In den Standardbenchmarks wird die Leistung gegenüber Ivy-Bridge kaum steigen, weil halt die neuen Features noch nicht unterstützt werden.

Da kann ich dir jetzt schon prophezeien, dass sich beim Test von Haswell viele drüber beschweren werden, dass man kaum schneller als nen Ivy ist und jetzt lehn ich mich ganz weit aus dem Fenster: Schon auf Seite 1 der Kommentare wird die Aussage kommen, das AMD daran schuld ist, weil man keine Konkurrenzfähigen Produkte hat. :evillol:
 
Zuletzt bearbeitet:
Naja es sind ja nicht nur neue Befehlssätze hinzu gekommen. Da wurde ja auch grundlegend was geändert. Vielleicht nicht ganz so umfassend wie von Nehalem auf Sandybridge (am Frontend hat sich fast nichts getan), aber gerade bei den Ausführungseinheiten und der Speicherhierarchie wurde schon was verändert.
Wieivel das bringt werden wir sehen.
 
Zurück
Oben