News AMD: Exascale-Vision mit 32 Kernen, GPU und Stacked DRAM

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
18.763
Zum Analyst Day im Mai hatte AMD bereits eine High-Performance-APU für das Serversegment angekündigt, ohne jedoch weiter ins Detail zu gehen. Nun sind Vorstellungen von AMD-Wissenschaftlern und Ingenieuren aufgetaucht, nach denen eine APU bis zu 32 Kerne, eine GPU und Stacked DRAM auf einem Interposer unterbringt.

Zur News: AMD: Exascale-Vision mit 32 Kernen, GPU und Stacked DRAM
 
Es wäre geil, wenn es Treiber geben würde, die 32 Kerne nutzbar machen, für alle games, die weniger als 32 Kerne nutzen können, egal wie sie programmiert sind, das wäre geil! Ja, ich weiß, viele Kommas. :D
 
Das Ding wäre selbst mit Bulldozermodulen flott :D

//Aber jetzt mal ehrlich: Sowas könnten sie heute vermutlich schon mit den Puma+ Kernen (Carrizo-L) realisieren ohne groß drüber nachdenken zu müssen, wenn die Interposer weit genug fortgeschritten wären.
Und das wäre auch gar nicht mal so langsam wie viele hier gleich rumschreien werden
 
Pure Existenz schrieb:
Es wäre geil, wenn es Treiber geben würde, die 32 Kerne nutzbar machen, für alle games, die weniger als 32 Kerne nutzen können, egal wie sie programmiert sind, das wäre geil!
Wozu, um eine 500W HPC APU im Idle mit 60W Verbrauch zu nutzen? Dann doch lieber n günstigeren 4-Kerner der zwar 80W schluckt aber mich keine 10.000€ das Stück kostet xD

Wenn sich HSA im HPC Bereich durch setzt wäre AMD hier echt im Vorteil, vor allem weil GPUs ja nicht in allen Problemen leistungsstärker als CPUs sind, hier kann man mit effizienter Programmierung sicher gut was reißen und im Bereich der Supercomputer kommt auch weniger Software von der Stange zum Einsatz.

Ach ja, bin gespannt wann die ersten "dääääh Intel würde das viel besser machen, AMD suckzzzzz!!!11einself"-Posts kommen :D
 
Rechner mit GPU-Unterstützung führen aktuell bereits die Supercomputer-Top-Listen an – eine Entwicklung, die sich in Zukunft noch verstärken wird.

Jup, nur dass diese APUs ebenso mit HSA Grafikkarten kombiniert werden können. Eigentlich hatte ich solch ein System in Form von Micro Server erhofft, aber das wird wohl in der Form nicht mehr kommen.

Erinnere mich aber noch, wie so einige der Meinung wäre, 16 Core APU wird es bei AMD so früh nicht geben. 32 ist somit durchaus eine Ansage, speziell wenn man bedenkt, höhere IPC, HTT, ect als Bulldozer, der zu seiner Zeit durchaus eine gute Figur gemacht hatte.

Diablokiller999
Interessant ist doch, wie der Chip aufgebaut ist. Ist es ein Die, oder eher, kommt es eher dem Konzept nahe, das AMD für die Zukunft geplant hat. CPU, GPU ect Module die auf einem Interposer kombiniert wird.
Kann gut sein dass es 8 CPU Module (jeweils 4 Cores) 1 GPU Modul (Typ Greenland) und 4 HBM Stacks (mit HBM 2.0 sollten das 32 GB HBM sein).

Denn dann würde das auch zu AMD "Raven Ridge" passen. Nämlich weniger CPU Module, aber vllt die selbe Greenland GPU Modul + 1-2 HBM Stacks mit 8-16 GB HBM.
 
Zuletzt bearbeitet:
Diablokiller999 schrieb:
Ach ja, bin gespannt wann die ersten "dääääh Intel würde das viel besser machen, AMD suckzzzzz!!!11einself"-Posts kommen :D

Xeon Phi ist schon jetzt sehr nahe dem Konzept das einzige was da noch fehlt ist der HBM also ja Intel wird sich da mit sicherheit die Butter nicht vom Brot nehmen lassen.
 
Zuletzt bearbeitet:
Steeeep

Mit Sicherheit nicht. Aber es ist trotzdem interessant. Es gibt Xeon Phi mit vielen Cores (und viel FPU Performance), GPGPU GPUs und jetzt APUs, was eigentlich mehr oder weniger zwischen Xeon Phi und GPUs aufstellt.
 
Passend dazu hat US-Präsident Obama vor wenigen Tagen per Executive Order den Exascale-Computer bis spätestens zum Jahr 2025 gefordert.

Wieso keine Überlicht schnellen Raumschiffe? - wenn man schon Fortschritt per Executive Order fordern kann, dann aber richtig^^

btt
Mal sehen was davon beim Endanwender ankommt.
 
Interessant wäre ob AMD so weit wäre das die da paar Teile für den Rechner verkaufen könnten das würde AMD gut tun und wäre für AMD ein großes Prestige Objekt für andere Server.
 
Was mich auch interessieren würde wäre ein Ansatz für Server, bei dem die zwei "besten" Kerne ausgesucht und auf Desktoptakt gesetzt werden.

Dann hätte man drei Stufen:
- Der Teil ganz nicht parallelisierbare, aber wichtige Aufgaben: Die 2 ~4Ghz Kerne
- Nicht oder wenig parallelisierbar, aber braucht nicht die volle Geschwindigkeit: Die anderen Kerne bei den Serverüblichen 2-3 Ghz
- Voll parallelisierbar: Die Grafikeinheit
 
pipip schrieb:
Steeeep

Mit Sicherheit nicht. Aber es ist trotzdem interessant. Es gibt Xeon Phi mit vielen Cores (und viel FPU Performance), GPGPU GPUs und jetzt APUs, was eigentlich mehr oder weniger zwischen Xeon Phi und GPUs aufstellt.

Naja doch nur mit dem unterschied das Intel von Anfang an die GPGPU relevanten Vektoreinheiten gleich in den x86er Kern einbaut und somit den ganzen einschränkenden Grafikkartenursprung weglassen kann.
Das Ergebnis ist eine viel flexiblere und breiter einsetzbare Architektur bei ähnlicher Performance.
Und im HPC Bereich wird der HBM Speicher weniger wegen seiner Geschwindigkeit denn seiner Platzersparnis benötigt um eben eine hohe Packungsdichte zu erreichen um in einem Node gleich mehrere dieser Riesendies unterbringen zu können und sie gleichzeitig mit ausreichend Speicher und einfach zu handhabender Kühlung auszustatten.

Ich lese grad Knights Landing wird sogar bis zu 16GB On Package Stacked RAM (mit 500GB/sec) haben und für die gesockelte Variante noch zusätzlich 6 Kanal DDR4 Speicherinterface. 2015 ist release also wenn dann AMD endlich mal was produziert wird Intel schon lange auf dem Markt sein.
 
Zuletzt bearbeitet:
Robo32 schrieb:
Wieso keine Überlicht schnellen Raumschiffe? - wenn man schon Fortschritt per Executive Order fordern kann, dann aber richtig^^
...
Weil es unrealistisch ist. Aktuell und laut Einstein bräuchten wir unendlich Energie um zB ein Raumschiff auf Lichtgeschwindigkeit zu bringen. Zudem gibt es nichts schnelleres als Licht. Es ist auch überhaupt noch nicht abzusehen ob es jemals was schnelleres als Licht geben wird. Nach aktueller Lage eher niemals.
Das was Obama gefordert hat ist absolut realistisch.
Insofern völlig unverständlich für mich deine Frage.
 
Zuletzt bearbeitet:
Dann muss eben eine Abkürzung genommen werden. Oder vlt. doch lieber auf ner "Welle" reiten ;-)
 
Das Problem ist ja nicht, dass man ExaScale-Cluster nicht auch schon heute bauen könnte, sondern das ganze in einem vernünftigen Rahmen hinsichtlich Platzbedarf, Netzwerk und ganz wichtig dem Energieverbrauch stattfinden kann.

Daher wäre es viel interessanter, wenn AMD erklären würde, wer für sie denn die 10 TFLOP/s APU mit welchem Prozess und Transistoreigenschaften fertigen soll und vor allem, wie man denn gedenkt, die einzelnen Nodes entsprechend leistungsfähig zu vernetzen.

Einfach nur Ausführungseinheiten aneinanderklatschen wird nicht allein ausreichen, um ein brauchbares ExaScale-System aufzubauen. Und nein, auch der fünfzigste Aufguss von 28 nm bei Global Foundrys wird sich dafür vermutlich eher nicht eignen...
 
Aktuell sucht man noch die Gravitationswellen. Trotzdem werden auch diese nicht schneller als Licht sein. Selbst mit Lichtgeschwindigkeit ist dieser vor kurzen bekannte erdänliche Planet 1400 Jahre entfernt. Aktuell könnten wir es in ca 140 Millionen Jahre schaffen wenn das Raumschiff 100000 km/h fliegt.
Das was wir von diesen Planet jetzt wissen ist also wie es vor 1400 Jahren war. Wenn es also dort Leben geben würde und dieses sich zeitgleich mit unserem entwickeln würde, könnten wir dies erst in ca 1300 Jahren erfahren. Radiowellen sind auch nur so schnell wie Licht.
 
Zuletzt bearbeitet:
Wollt schon sagen der warp Antrieb funktioniert ja durch die raumkrümmung.
Aber ich schweife ab.
Simon ab 2016 werden wir bei 14/16nm fF sein und man kann von ausgehen das die Fertigung 2020-25 etwas weiter sein wird.
Verstehe dieses schlechtmachen nicht ganz.
 
Zurück
Oben