News Hot Chips 33: IBMs Telum-Architektur setzt auf 32 MB L2-Cache – pro Kern

Volker · 24. August 2021

IBMs neuer z-Chip „Telum“ muss sich nicht hinter x86-CPUs verstecken: Zu den Design-Raffinessen des Mainframe-Prozessor gehören unter anderem 32 MB L2-Cache – pro Kern. Aber auch andere Eigenschaften suchen in der x86-Welt bisher ihresgleichen. Anfang 2022 sollen erste Systeme verfügbar werden.

Zur News: Hot Chips 33: IBMs Telum-Architektur setzt auf 32 MB L2-Cache – pro Kern

Multivac · 24. August 2021

Warum werden eigentlich die Wafer am Rand mit Teilweisen cpus belichtet?

konkretor · 24. August 2021

Eine wahre Monster CPU, würde mich jucken das mal zu administrieren.

brabe · 24. August 2021

Multivac schrieb:
Warum werden eigentlich die Wafer am Rand mit Teilweisen cpus belichtet?

Vor allem in der industriellen Produktion wird während des Prozesses die Rückseite und der Wafer-Rand (Vorderseite; bis zu 2 mm) mit Lösungsmittel besprüht. Dies soll zum einen Lackansammlungen auf der Rückseite und die Ausbildung einer Lackwulst am Rand verhindern.

Das habe ich gefunden.

Hannibal Smith · 24. August 2021

Artikel:
Die auf die Prozessoren abgestimmte Software sieht den Cache als physikalisch vorhandenen und über alle Kerne geteilten L3-Cache, wenn sie den Prozessor anspricht.

Wie kann man sich das vorstellen? Kann dann Kern 1 auf die Daten des L2/vL3 Caches von Kern 3, 4, 5 zugreifen?
Hört sich in erster Linie nicht dumm an, zusammen mit der Größe könnte das dann ne echt gute Trefferrate geben. Aber wie wird dann entschieden, welche Daten im Cache von welchem Kern liegen, wenn der Cache als großes ganzes erkannt wird?

Ironbutt · 24. August 2021

Und ich war schon kurzzeitig dem Glauben verfallen, IBM hätte nur noch wenig zu sagen in der IT-Welt... Aber die meisten Patente und die riesen CPU.

sikarr · 24. August 2021

Volker schrieb:
IBMs neuer z-Chip „Telum“ muss sich nicht hinter x86-CPUs verstecken

Das mussten sie noch nie, alleine die Annahme grenzt an Blasphemie

andi_sco · 24. August 2021

Ironbutt schrieb:
verfallen, IBM hätte nur noch wenig zu sagen

Ja, bin auch überrascht, das Sie so weit vorne liegen

4nanai · 24. August 2021

Multivac schrieb:
Warum werden eigentlich die Wafer am Rand mit Teilweisen cpus belichtet?

Weil im Step-and-Repeat Prozess immer mehrere Dies gleichzeitig belichtet werden. Die Anordnung auf den Belichtungsmasken ist dann natürlich rechteckig, wie hier zu sehen bei einer Maske für 20 Dies:

Rechteckige Maske und runde Wafer ergeben dann einfach den Ausschuss am Rand.

Calaphos · 24. August 2021

So bleibt pro Kern nur eine Leistungssteigerung von rund 7 Prozent übrig.

Das klingt jetzt nicht sonderlich beeindruckend, zumal der letzte Chip 2 Jahre alt ist, aus älterer Fertigung stammt und ~1/3 der Transistoren pro Core hatte. Das ist ja fast weniger Fortschritt als Intel CPUs jahrelang zwischen (jährlichen!) Generationen hatte.

Transistorzahlen sind aber wahrscheinlich wenig vergleichbar weil der Vorgänger auf große DRAM L4 Caches gesetzt hat, hier gehen wahrscheinlich die für die großen Caches drauf. Transistordichte hier ist auch Vergleichbar mit den Ampere GPUs auf 8nm Samsung, also immer noch eine ganze Ecke hinter TSMC.

[wege]mini · 24. August 2021

konkretor schrieb:
Ein wahre Monster CPU

+e

btt:

@Volker

"Groß waren IBMs Prozessoren zum Beispiel schon immer, 530 mm² sind für eine Telum-Chip deshalb keine Besonderheit. 22,5 Milliarden Transistoren bringt IBM auf dieser Fläche mithilfe von Samsung unter"

Die Tatsache, dass dieses zwar für IBM CPUs gilt, bedeutet jedoch auch wieder nicht, dass 22,5 Milliarden Transistoren für eine CPU nicht trotzdem total "gestört" ist, für eine CPU.

Selbst eine RTX2080Ti hatte "nur" 18,6 Milliarden Transistoren und die 4 Milliarden Transistoren von AMD für einen 8 Kern Prozessor, sehen hier eher niedlich aus.

Die Fläche ist, dem Aufwand entsprechend, ordentlich und die Vermutung, dass IBM nicht mit Murmeln spielt, ist ziemlich naheliegend.

Für Maschinen die dazu dienen, Spiele und anderen Firlefanz darzustellen, ist das natürlich nichts.

mfg

marzk · 24. August 2021

Interessant das man dort von SMT4 bzw sogar SMT8 wieder zurück auf SMT2 geht.
Bei Intel und AMD munkelt man immer wieder ob es in Richtung SMT4 geht.

Vielleicht ist das aber auch bedingt durch die unterschiedliche Architektur ein Apfel - Birnen Vergleich meinerseits.

Piak · 24. August 2021

Wieder 4 faches Multithreading pro Kern ?

rony · 24. August 2021

Mainframes .... die etwas anderen Computer - schon immer ^^

Ayo34 · 24. August 2021

Finde es zwar wahnsinnig interessant, kann mir aber nur sehr wenig darunter vorstellen. Wir brauchen Performance-Vergleiche und Benchmarks!

konkretor · 24. August 2021

@Piak nur 2 faches dieses mal

pipip · 24. August 2021

Der riesige L2-Cache ist allerdings nicht nur L2-Cache, sondern auch ein virtueller L3-Cache – diesen Ansatz gab es noch nie.

@Volker
Und warum. Weil L2 Cache viel Die-Fläche frisst

Es ist SRAM oder ? Vor Jahren hat IBM für einige Cache Level eDRAM genützt.

https://www.eetimes.com/ibm-positioniert-edram-gegen-sram/

Krautmaster · 24. August 2021

Das Ding besteht eig nur noch aus Cache oder?

textract · 24. August 2021

Hannibal Smith schrieb:
Wie kann man sich das vorstellen? Kann dann Kern 1 auf die Daten des L2/vL3 Caches von Kern 3, 4, 5 zugreifen?

Ja. Das geht sogar so ähnlich unter IBM Power, da können die Cores meines Wissens nach zwar nicht auf die Caches der anderen zugreifen, aber sie können die Daten geschickt bekommen, wodurch man bei Power selbst Sockel und sogar über Netzwerk systemübergreifend die CPUs in Echtzeit synchronisieren können. Damit kann man auf Power unterbrechungsfrei LPARs ( vergleichbar mit VM und Vmware ) von einer physischen Maschine zu einer anderen bewegen.

Calaphos schrieb:
Das klingt jetzt nicht sonderlich beeindruckend, zumal der letzte Chip 2 Jahre alt ist, aus älterer Fertigung stammt und ~1/3 der Transistoren pro Core hatte. Das ist ja fast weniger Fortschritt als Intel CPUs jahrelang zwischen (jährlichen!) Generationen hatte.

Was aber auch recht irrelevant ist, weil die Skalierbarkeit oft nicht von mehr Cores abhängig ist.

marzk schrieb:
Interessant das man dort von SMT4 bzw sogar SMT8 wieder zurück auf SMT2 geht.

Aber halt auch nur bei den z-Chips. Power 10 bleibt bei SMT8

milliardo · 24. August 2021

andi_sco schrieb:
Ja, bin auch überrascht, das Sie so weit vorne liegen

Tun sie das?

Jährlich grüßt die IBM-Wunder-CPU, die dann wieder nur die IBM-üblichen Nischen bedient.

News Hot Chips 33: IBMs Telum-Architektur setzt auf 32 MB L2-Cache – pro Kern

Ost 1

Lt. Junior Grade

Artikeldetektiv

Captain

Jumbo Frame

Lt. Commander Pro

Admiral

Legends of Tomorrow

Captain

Cadet 4th Year

Banned

Lt. Junior Grade

Captain

Commodore Pro

Admiral

Artikeldetektiv

Fleet Admiral

Fleet Admiral

Lt. Commander

Commander

Ähnliche Themen

Passend zum Thema