News IDF 2012: Die CPU-Architektur „Haswell“ im Detail

aylano schrieb:
Sandy-Bridge erst recht, bei dem "nur" das Front-End auf Effizienz verbessert worden ist.

Aber so ist es eben nicht und Haswell wird für CPU-Verhältnisse einen großen Schritt machen. Die CPU-Entwicklung geht langfristig über viele Jahre. Mich würde es nicht wundern, wenn die Front-End-Verbesserungen von Sandy-Bridge ebenfalls wichtig war, um bei Haswell dann 4-fach-Superscalar sinnvoll (= hoche auslastung) einzuführen.
Naja, bei Sandy Bridge kam neben dem Front-End aber auch noch der Ring dazu, wo am Ende sogar die GPU dran nuckelt. Zudem noch das neue PRF (was es in ähnlicher Form ja schon mal zu Netburst-Zeiten ab) und die AVX1-Erweiterungen. Das ist m.E. schon deutlich mehr als nur ein paar Änderungen am Front-End.

Im Grunddesign ist Haswell gefühlt deutlich näher an Sandy Bridge dran, als Sandy Bridge ihrerseits an Nehalem.
 
aylano schrieb:
Denn während es in den Top10 von HPC-Markt GPGPU schon längst etabliert ist, kommt Kabini & Kaveri mit HSA im Massen-Notebooks & Desktops dann so richtig in Schwung.

Nur drei von den zehn setzen auf GPUs, die - wen wundert's? - nicht von AMD, sondern von Nvidia kommen.
Geht man nach der Leistung pro Watt, belegt IBM mit seinen BlueGene/Qs die ersten 20 Plätze der Green500.

Aber AMD wird sicher was tolles aus dem Hut zaubern. So wie sie es schon mit Bulldozer gemacht haben, nicht wahr? :rolleyes:
 
Voyager10 schrieb:
Intel hat auf der IDF gezeigt das man mit weniger Power dem Ivy Bridge in Grafiklastigen Szenarien davon rennt , woher die gesteigerte Haswell TDP von 95W bei den stärksten Modellen kommen soll ist mir daher echt noch ein Rätzel.
Die 95 Watt sind imho durch die zusätzlichen Einheiten, breiteren Puffer und weiteren Verbesserungen zu erklären. Zum einen steigerst du die Auslastung und zum anderen kannst du im Worst-Case-Fall (und daran orientiert sich bei Intel i.d.R. die TDP immer noch) auch noch mehr Ressourcen auslasten. Bisher war es im Desktop-Segment so, dass selbst bei Volllast der iGPU, die CPU ebenfalls den maximalen Taktbereich (inkl. Turbo) ausschöpfen konnte und man immer noch unter der TDP lag. Ich denke, bei Haswell wird dies ähnlich sein, nur dass dieser in der besten Ausführung 40 EUs statt 16 EUs sowie mehr Cache bei der iGPU hat, sowie bei der CPU breitere Puffer, eine zusätzliche ALU, eine zusätzliche Store-Unit etc... Ohne neue Fertigung, kannst du sowas eigentlich kaum in der selben TDP unterbringen, denn so ineffizient waren die bisherigen Designs sicherlich nicht ;) Erweiterungen wie S0ix um den Verbrauch zu senken, greifen außerdem eher im Idle bzw. Niedrig-Last-Zuständen und nicht unter Volllast und greifen daher bei Nahe-TDP-Betrieb kaum.
http://ht4u.net/reviews/2012/intel_haswell_architektur_preview/index9.php

aylano schrieb:
Wenn ich es richtig verstanden habe, ist Steamroller die "letzte Architektur-Entwicklung" was ausschließlich in Handarbeit desgint wurde. Beim Nachfolger ist immerhin/zumindestens die FPU vollständig mit automatischen Tools entworfen, wie es bei Kabini & Ontario der Fall ist.
Die Architektur wird i.d.R. immer von Hand entworfen. Einzig die reine Umsetzung in Hardware wird durch Tools automatisiert. So ist es auch sicherlich jetzt schon. Bisher hat man allerdings die FPU von Hand optimiert (also die Hardware-Schaltung) um höhere Taktfrequenzen zu erzielen. Dies ist aber für den Energieverbrauch und die Flächeneffizienz eher kontraproduktiv. Daher wird man nun auch hier auf Tools zurückgreifen, die einem einen großen Teil der Arbeit abnehmen. Vermutlich kommt der Umstieg im übrigen nicht erst nach Steamroller...
http://ht4u.net/news/26060_neue_bibliotheken_sollen_amds_bulldozer-nachfolger_sparsamer_machen/

Grüße
Fabian
 
Zuletzt bearbeitet:
Fabian_HT4U schrieb:
Ich denke, bei Haswell wird dies ähnlich sein, nur dass dieser in der besten Ausführung 40 EUs statt 16 EUs sowie mehr Cache bei der iGPU hat, sowie bei der CPU breitere Puffer, eine zusätzliche ALU, eine zusätzliche Store-Unit etc... Ohne neue Fertigung, kannst du sowas eigentlich kaum in der selben TDP unterbringen, denn so ineffizient waren die bisherigen Designs sicherlich nicht


40 EUs gibt es im Desktop nicht.
 
Simon schrieb:
Naja, bei Sandy Bridge kam neben dem Front-End aber auch noch der Ring dazu, wo am Ende sogar die GPU dran nuckelt. Zudem noch das neue PRF (was es in ähnlicher Form ja schon mal zu Netburst-Zeiten ab) und die AVX1-Erweiterungen. Das ist m.E. schon deutlich mehr als nur ein paar Änderungen am Front-End.
PRF zählte ich auch zum Front-End, weil es ist in der CPU-Core ist.
Der Ring ist ja nicht die CPU-Architektur.

Im Grunddesign ist Haswell gefühlt deutlich näher an Sandy Bridge dran, als Sandy Bridge ihrerseits an Nehalem.
Ich nehme an, diese Ansicht entsteht, weil du die Architektur primär vom Front-End besteht/abhängt, während ich die Execution-Einheiten (ALU) & Ports(-Erweiterungen) höhere einstufe. Unter anderem bin ich dieser Meinung, weil du & ich nicht wissen, wie viel Rücksicht die Sandy-Bridge Front-End-Verbesserung mit PRF auf die zukünftige Hasswell Execution-Erweiterung nahm, womit die IPC-Steigerungen dann stärker steigen.

CHAOSMAYHEMSOAP schrieb:
Nur drei von den zehn setzen auf GPUs, die - wen wundert's? - nicht von AMD, sondern von Nvidia kommen.
Geht man nach der Leistung pro Watt, belegt IBM mit seinen BlueGene/Qs die ersten 20 Plätze der Green500.
Mit "GPGPU" meinte ich auch BlueGene/Qs.
Mit alten CPU-Only-Lösungen kommt man eben im HPC nicht mehr so weit.

Wobei ich jetzt BueGene nicht genau kenne. Aber das ist das Problem, was ich schon woanders ansprach. In den letzten 1-2 Jahren sind mit Bobcat/Jaguar, Atom (für Centerion, Handy, Netbook), ARMv7 (A9), ARMv8 (A15), AMD-GCN, Phi-Xi, BlueGene schon so viele Architekturen dazugekommen, dass man schon langsam die Überblick verliert. Vorallem, wenn man die Tendenzen/Entwicklungen sehen will und so den Schritt im vergleich zum Vorgänger sowie Konkurrenz auch einmal betrachten muss/soll.

Aber AMD wird sicher was tolles aus dem Hut zaubern. So wie sie es schon mit Bulldozer gemacht haben, nicht wahr? :rolleyes:
Ich verstehe deine Spöttische Art nicht.
Nur weil AMD nach Itanium, Netburst und Atom mit Bulldozer nicht auch Core ins Lächerliche zog, muss man nicht gleich auf die Bulldozer-Architektur laufend herumreiten, vorallem wenn die Core-Architektur massiv von der Intel-Fertigung profitiert.

Und was soll AMD im GPGPU-Markt besseres machen, als bei derersten vernünftigen (also mit GCN, C++ und ECC) GPGPU-Workstation- und GPGPU-HPC-Einführung die Konkurrenz in Double-Precise-Rohperformance gleich in die Schranken zu weisen?

AMD hat in den letzten 5-6 Jahren darauf hingearbeitet, dass man ab 2012 jährliche CPU, GPU und APU-HSA-Entwicklungen rauszubringen und damit in Zusammenarbeit die Konkurrenz zu übertrumpfen versucht. Manche würden das wahrscheinlich erst anerkennen, wenn AMD alle Märkte [GPU (Game, Worktstation, HPC), CPU (Bobcat, Bulldozer) und APUs (Trinity, Ontario)] beherschen würde.
Es ist schon interessant, welche Kritik AMD momentan mit der einen Architektur bekommen, obwohl sie die Leistungskrone im Single-GPU-Game-Markt und Netbook-Markt besitzen.

Haswell ich CPU-Technologisch eine Interessante Entwicklung, aber im HPC bzw. Top500 sieht man jetzt schon, dass Intel heute schon ohne Xeon-Phi oder einer GPGPU kaum/nicht den Spitzenplatz erreichen wird. Da das auch für Bulldozer gilt, kann man im Server-Markt nicht mehr mit einem Produkt alleine bewerten.
 
aylano schrieb:
Mit "GPGPU" meinte ich auch BlueGene/Qs.
Nur, daß da gar keine GPU drin steckt.

aylano schrieb:
Mit alten CPU-Only-Lösungen kommt man eben im HPC nicht mehr so weit.
Sequoia, K Computer, Mira und SuperMUC belegen die ersten vier Plätze in der aktuellen (Juni 2012) Top500 Liste. Und alle arbeiten ohne GPUs bzw. Beschleunigerkarten.
Von den zehn schnellsten Supercomputern arbeiten nur drei mit Tesla Karten von Nvidia.

Betrachtet man die Leistung pro Watt liegt IBM mit seinen BlueGene/Q Systemen auf den ersten 20 Plätzen, Intel landet mit Xeon Phi auf Platz 21 und die GPU beschleunigten Systeme kommen dahinter.

aylano schrieb:
aber im HPC bzw. Top500 sieht man jetzt schon, dass Intel heute schon ohne Xeon-Phi oder einer GPGPU kaum/nicht den Spitzenplatz erreichen wird.
Siehe oben: SuperMUC schafft es als reines x86 System ohne Beschleunigerkarten auf Platz 4 (die 3 Plätze davor werden auch von Systemen ohne extra Beschleuniger belegt).

Das heißt nicht, daß ich mir von Intel nicht mehr Engagement im Grafikbereich wünschen würde, aber mir reicht es schon, wenn Haswell PhysX und Optimus beherrschen würde.

Ich mache mir jedenfalls keine Illusionen und träume von HSA, weil ich weiß, daß die Softwarehersteller sich nach der Architektur des Marktführers richten werden und das ist nunmal Intel.
 
Zurück
Oben