News Fujitsu Monaka: Neues vom 144-Kern-Superchip aus Japan

MichaG

Redakteur
Teammitglied
Registriert
Juli 2010
Beiträge
13.417
In Japan wird an einem neuen Supercomputer-Chip gearbeitet. Dieser heißt Monaka, besitzt auf Chiplets verteilte 144 Kerne und wird der nächste Arm-Prozessor von Fujitsu für das Segment High-Performance-Computing (HPC) nach dem A64FX. Letzterer dient im einst schnellsten Supercomputer der Welt namens Fugaku.

Zur News: Fujitsu Monaka: Neues vom 144-Kern-Superchip aus Japan
 
  • Gefällt mir
Reaktionen: flo.murr, Nine-tailed Fox, ComputerJunge und 5 andere
Core Die auf SRAM Die... Zen 5 X3D lässt grüßen :p
 
  • Gefällt mir
Reaktionen: Sp3ll, nyster, Convert und eine weitere Person
MichaG schrieb:
Dieser heißt Monaka
Ich und mein Brainrott haben nur Monaka gelesen, und es direkt verkackt.

1734016703410.png
 
  • Gefällt mir
Reaktionen: maxik, ILoveShooter132, PietVanOwl und 5 andere
A64FX...

Noch nie gehört 😅
 
  • Gefällt mir
Reaktionen: ILoveShooter132, coxon, Schumey und 2 andere
5nm I/O-Die und 3nm Chiplets mit CPU Kernen kommt mir auch bekannt vor.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: nyster, Convert, ILoveShooter132 und eine weitere Person
Die Verwendung von Kacheln, gestapelter L3 Cache und alles auf Base Dies hört sich zwar sehr nach AMD an, allerdings ist die Fertigungstechnik dahinter eben TSMC. Interessant ist hier IMHO vor allem, daß es (wenn die CPU Realität wird) eine der ersten großen ARM CPUs auf Chiplet/Kachel Basis wäre. Fujitsu und ARM haben ja bereits für den monolithischen Vorgänger der in Mount Fuji verwendet wird eng zusammen gearbeitet, u.a. auch an SVE.
 
  • Gefällt mir
Reaktionen: lzon

Anhänge

  • Kimonaka.jpg
    Kimonaka.jpg
    39,3 KB · Aufrufe: 49
  • Gefällt mir
Reaktionen: coxon
@IBISXI
Bist du in der Zeile verrutscht? Das ist nicht mein Kommentar. ^^
 
  • Gefällt mir
Reaktionen: IBISXI
Entschuldigung dafür. Da ist was schiefgelaufen. Hab die Quotes entfernt.
 
  • Gefällt mir
Reaktionen: coxon
eastcoast_pete schrieb:
Die Verwendung von Kacheln, gestapelter L3 Cache und alles auf Base Dies hört sich zwar sehr nach AMD an, allerdings ist die Fertigungstechnik dahinter eben TSMC.
Und? Trotzdem ist AMD hier Vorreiter mit denn jeweiligen Chip Designs und der Partner mit denen TSMC solche Baukasten Chips sogar erfolgreich in den Consumer Markt bringen konnte und die Entwicklung in diese Richtung überhaupt machbar gemacht hat.

HBM ist das andere Beispiel, welches im Vergleich zu den anderen zwei Lösungen überhaupt wirklich auf den Markt geschafft hat.

Aber was soll man sagen, es sind die selben Aussagen wie AMD sind nur erfolgreich weil sie TSMC verwenden. Seit dem Release der letzten Intel Prozessoren wissen wir, wieviel man dem Wert schenken muss.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Col. Jessep, nyster und Convert
Eine weitere CPU mit DDR5 12-Kanal. Damit ist offensichtlich, dass DDR6 für dann 6-Kanal fällig ist. Das hätte den Vorteil, dass die Perf/Kanal doppelt so hoch wäre für die Maße an Anwendungen die so viel Bandbreite nicht brauchen, aber von einem doppelt so schnellen Kanal profitieren könnten.

Das ist im Grunde wie mit 12 CPU-Kernen gegen 6-Kerne die doppelt so schnell sind. Der doppelt-schnelle 6-Kerner wäre für die Maße an Anwendungen besser.

Ja der Desktop-Nutzer mit Ryzen/Core braucht vielleicht kein DDR6, aber wenn schon EPYCs und XEONS 12-Kanal DDR5 nutzen, ist DDR6 nicht nur theoretisch, sondern wirklich nötig.

Warum Threadripper 4-Kanal und WX-Variante 8-Kanal haben statt wie bei Ryzen 2-Kanal? Weil ein Ryzen bis 16 Kerne hat und ein Threadripper bis 96. Und der RAM-Speed ist nicht pro Kern, sondern für alle zusammen.

Ein Vergleich 144 Kerne zu 16 bei Ryzen und 96 bei Threadripper WX (Annahme DDR5 5200 und Kanäle sind pro Sockel):

Speed_Pro_Kern = 8*RAM_Speed * Kanalzahl * / CPU_Kernzahl
16-Kern Ryzen mit 2-Kanal: 8*5200 MB/s * 2 / 16 Kerne = 5200 MB/s pro Kern
96-Kern Threadripper mit 8-Kanal: 8*5200 MB/s * 8 / 96 Kerne = 3466,6 MB/s pro Kern
144-Kern Monaka mit 12-Kanal: 8*5200 MB/s * 12 / 144 Kerne = 3466,6 MB/s pro Kern

PS: Ein 24-Kern Ryzen würde auch auf 3466,6 MB/s pro Kern kommen. Das heißt von der Bandbreite des RAMs her könnte es 24-Kern Ryzen geben. Und wie die Gerüchteküche sagt, sollen bei Zen 6 12 Kerne pro CCD verbaut werden. Mal 2 macht das 24. :daumen:
 
Zuletzt bearbeitet:
pipip schrieb:
Und? Trotzdem ist AMD hier Vorreiter mit denn jeweiligen Chip Designs und der Partner mit denen TSMC solche Baukasten Chips sogar erfolgreich in den Consumer Markt bringen konnte und die Entwicklung in diese Richtung überhaupt machbar gemacht hat.

HBM ist das andere Beispiel, welches im Vergleich zu den anderen zwei Lösungen überhaupt wirklich auf den Markt geschafft hat.

Aber was soll man sagen, es sind die selben Aussagen wie, die AMD sind ja nur erfolgreicher, weil sie TSMC verwenden. Seit dem Release der letzten Intel Prozessoren weiß man, wieviel man dem Wert schenken muss.
Hab ich auch nicht bestritten! AMDs Zen 2 war der Pionier hier; allerdings war TSMCs Arbeiten am Packaging etc eben essentiell für die Umsetzung. Zen 2 war das Resultat einer engen Zusammenarbeit zwischen den beiden Firmen.

Mein Post war nicht über "AMD ist nur besser wegen TSMC" was auch so einfach nicht stimmen würde. Es ging darum, daß die geplante Fujitsu CPU wahrscheinlich die erste große ARM CPU im Chiplet/Kachel Design sein würde. Allerdings würde ich mich auch nicht wundern, wenn zB Apple nicht auch an Chiplet Designs für M SoCs arbeitet. Denn selbst mit sehr niedriger Defekt Dichte wird die Wahrscheinlichkeit, daß man bei Dies mit weit über 10 Milliarden Transistoren unschön viele "Nieten" zieht, schon so groß, daß sich Chiplets lohnen.
 
So beeindruckend die Hardware auch immer ist, wie unmöglich muss es sein, Problemstellungen so zu formulieren und in Software umzusetzen, dass es von diesen Maschinen auch nutzbringend verarbeitet werden kann. Mindblowing!
 
  • Gefällt mir
Reaktionen: Convert
  • Gefällt mir
Reaktionen: coxon
daVinci schrieb:
So beeindruckend die Hardware auch immer ist, wie unmöglich muss es sein, Problemstellungen so zu formulieren und in Software umzusetzen, dass es von diesen Maschinen auch nutzbringend verarbeitet werden kann. Mindblowing!
Tatsächlich sogar relativ einfach, wenn man sich den Vorgänger anschaut und das Verhältnis von theoretischer Maximalleistung zu tatsächlich in Benchmarks erreichter Maximalleistung ansieht. Da kommt Fugaku auf ein Verhältnis von ca 0,8, während die üblichen GPU-beschleunigten Superrechner nur im Bereich 0,6-0,7 liegen, Intels Rohrkrepierer Aurora sogar nur knapp über 0,5 (genau deshalb ist die Kiste ja auch so blamabel ineffizient verglichen mit der Konkurrenz).
 
Deutschland nicht mehr unter den Top 10 ist deprimierend als führendes Wirtschaftsland (noch) der EU ! Gerade für Forschung unabdingbar
 
pipip schrieb:
Und? Trotzdem ist AMD hier Vorreiter mit denn jeweiligen Chip Designs und der Partner mit denen TSMC solche Baukasten Chips sogar erfolgreich in den Consumer Markt bringen konnte und die Entwicklung in diese Richtung überhaupt machbar gemacht hat.
Und das interessante hier ist, dass das Design von Fujitsu dem Design von AMD extrem ähnelt, während Intel z.B. ein völlig anderes Layout des Chips nutzt.
 
Chesterfield schrieb:
Deutschland nicht mehr unter den Top 10 ist deprimierend als führendes Wirtschaftsland (noch) der EU ! Gerade für Forschung unabdingbar
Die nächste Stufe in Jülich wird doch gerade getestet. Davon abgesehen finde ich diese Deutschtümelei ziemlich Panne. Klar dürfen wir uns nicht abhängen lassen, aber mir wäre lieber wir wären bei Zukunftsthemen wie Fusion oder Quantenrechnern vorne mit dabei anstelle Millionen auszugeben um in einer Liste von Platz zwölf auf Platz neun zu rutschen bei der es nur darum geht wie viel Geld man nach Asien oder in die USA schiebt. Solange unsere Forscher gut arbeiten können... Und da ist es eben wichtiger dass nicht nur in Jülich ein Rechner für irgendwelche Vergleichslisten steht, sondern eben auch in Stuttgart, München etc wirklich gute Rechenwerke für die Forscher im Zugriff sind.
Wenn man bedenkt wie wenig Entwicklung und Wertschöpfung in dem Bereich mittlerweile in Deutschland und Europa verblieben sind, ist die Ausstattung in Deutschland derzeit ziemlich gut.
Dennoch wichtig zu beachten dass es Investitionen in die Zukunft sein müssen - und da ist der Aufbau eines Quantenzentrums viel bedeutsamer...
 
  • Gefällt mir
Reaktionen: LBB
pipip schrieb:
Aber was soll man sagen, es sind die selben Aussagen wie AMD sind nur erfolgreich weil sie TSMC verwenden. Seit dem Release der letzten Intel Prozessoren wissen wir, wieviel man dem Wert schenken muss.
Wie meinst du dass? Gerade die letzte Intel Gen zeigt doch, dass AMD's Arch wesentlich besser ist und sogar Intel mit der teureren Fertigung schlägt.
 
Der A64FX hat 52 kerne und nutzt für die eigentlichen Berechnung aber nur 48 die anderen 4 sind für Betriebssystem und so. Von daher könnte der neu auch mehr haben. Viel beeindruckender finde ich ist aber das der fugaku auf der Praxis relevanteren Top500 HPCG immer noch auf Platz 1. ist.
 
Zurück
Oben