News Hot Chips 2023: AMD verrät wenig mehr über „Siena“ und verwirrt

HaRdWar§FreSseR schrieb:
Das wäre echt cool, wenn AMD eine Sharing-Effizienz nutzen könnte, bei der die Kerne auf den L3-Cache anderer Chiplets zugreifen können, wenn ihr eigener nicht ausreicht.
Das würde aber auch einen enormen Aufwand bedeuten, den AMD wahrscheinlich nicht leisten kann.
"Sharing-Effizienz" ist ein interessanter Begriff, den ich noch nie gehört habe. Wo hast du das gelesen?
Ergänzung ()
Das war nur ne Vermutung wie AMD das Aufbauen könnte um Verbindungen zu reduzieren.Bzw um die Fläche zu reduzieren in dem ja die einen weniger L3 Cache haben und die anderen teile mit 3d Cache ganz viel.
Weil das hier einer als Gedanken geschrieben hatte,da kam ich auf die Idee das AMD das so machen könnte.
Offziell hat sowas AMD ja nicht gepostet.
Fände ich auch als geil an.So könnte man viel mehr Kerne Unterbringen und hätte mit dem L3 Cache dennoch keinen Nachteil daran.Bin Gespannt wie es AMD in Zukunft so handeln wird.

Und ich selbst merke keinen so riesigen Nachteil von L3 Cache halbierung nur etwas.
Ich bin allerdings nicht auf die Server Sparte Angewiesen.Solange AMD noch Threadripper Pro Veröffentlich wie halt mit Zen 4,habe ich kein Problem damit.Jedoch wenn der Markt so weiter Schrumpft hat AMD keinen bedarf mehr an Threadripper und wechselt gleich direkt zu Server sowie Client usw.Da Verdient wohl AMD viel mehr als an den Threadripper CPUS.
Dann wenn es nur noch Server geben wird egal von Intel oder AMD dann wäre ich wohl ganz raus aus der ganzen Sache.
Weil eines haben Server gemeinsam,der Allcore Takt ist generell um einiges niedriger als bei den Threadripper sowie den ganzen Ryzen CPUS.Aber ob ich solche Aktion AMD zutrauen würde,wer weis.
 
  • Gefällt mir
Reaktionen: HaRdWar§FreSseR
HaRdWar§FreSseR schrieb:
Das wäre echt cool, wenn AMD eine Sharing-Effizienz nutzen könnte, bei der die Kerne auf den L3-Cache anderer Chiplets zugreifen können, wenn ihr eigener nicht ausreicht.
Das würde aber auch einen enormen Aufwand bedeuten, den AMD wahrscheinlich nicht leisten kann.
Das wird nix, beim 7950x3d haben die doch deutlich gezeigt / gesehen das es Performance technisch keinen sinn macht das ein "non-cache-Kern" auf den Cache des "cache-Kerns" zugreift.
 
  • Gefällt mir
Reaktionen: Rockstar85
GrumpyCat schrieb:
Einen Task von P auf E zu migrieren soll wie gehen? Wenn der potenziell z.B. TSX benutzt (das die E nicht beherrschen)?

Das beherrschen die P-Kerne auch nicht. Es ist theoretisch moeglich, dass es abgedreht wurde, weil's die E-Kerne nicht koennen, wie bei AVX-512. Wahrscheinlicher ist aber, dass Intel den Hut draufgeschmissen hat, nachdem sie das 1) ueber viele Jahre nicht fehlerfrei zum Laufen bekommen haben und 2) transactional memory sich als doch nicht so wichtig herausgestellt hat wie der Hype vor 15 Jahren nahelegte. Jedenfalls wird es schon beim Rocket Lake (noch ohne E-Cores) als Xeon unter TSX-NI "nein" angezeigt, und wenn ich mir den als Core i anschaue, wird TSX nicht einmal erwaehnt.

Oder andersherum, wenn ein Task erst "ruhig" auf einem E-Core gestartet wird, aber nach ein paar Sekunden doch Leistung will und von AVX-512 profitieren würde, das dem Task aber nicht als verfügbar geflaggt wurde (weil E das nicht kann)?

Wurde bei den P-Cores auch abgedreht (sogar wenn der Prozessor gar keine E-Cores hat).
Ergänzung ()

stefan92x schrieb:
Wundert mich aber etwas, dass AMD hier offenbar kein Einsparpotential sieht.

Zunaechst einmal kostet ein kleinerer IOD fuer Siena etwas Entwicklungsarbeit und ein neues Maskenset (irgendwo im Bereich von $10M). Wenn sie pro Siena vielleicht $50 Waferflaeche sparen wuerden, muessten sie 200000 verkaufen, bevor sich die Investition amortisiert. Naja, vielleicht machen sie's ja noch, wenn die Nachfrage hoch genug ist, und verwenden in der Zwischenzeit teildefekte grosse IODs.
 
Zuletzt bearbeitet:
mae schrieb:
Naja, vielleicht machen sie's ja noch, wenn die Nachfrage hoch genug ist, und verwenden in der Zwischenzeit teildefekte grosse IODs.
Eben darauf bezieht sich meine Überraschung, ich würde eigentlich davon ausgehen, dass Siena in ziemlich großen Stückzahlen laufen müsste, so dass sich das lohnt. Aber anscheinend erwartet AMD das nicht
 
  • Gefällt mir
Reaktionen: ETI1120
@ETI1120
Hälst du es für Realistisch, dass wir 4C im Desktop sehen werden?

Im Mobile könnte ich es mir vorstellen, da da ja AMD massiv an der Akkulaufzeit arbeiten würde.. Aber im Desktop


Wie Realitisch siehst du eine Zen 5 mit 4C Core als Co Prozessoren?
 
@Rockstar85 hm vielleicht eher wohl in Zukunft wenn es zu wenig Platz drauf gibt um was zu steigern.Wobei AMD ja noch immer die chips größer Gestalten kann.Aber sobald mal die Fertiung nicht mehr weiter runter geht und man die maximale Größe voll ausgefahren hatte,könnte AMD auch beim desktop dazu übergehen mit den C Modellen zu Agieren.Das erleben wir bestimmt noch da bin ich mir gánz sicher.
 
  • Gefällt mir
Reaktionen: Rockstar85
mae schrieb:
Zunaechst einmal kostet ein kleinerer IOD fuer Siena etwas Entwicklungsarbeit und ein neues Maskenset (irgendwo im Bereich von $10M). Wenn sie pro Siena vielleicht $50 Waferflaeche sparen wuerden, muessten sie 200000 verkaufen, bevor sich die Investition amortisiert.
Fürs Chip-Design kommt AFAIK schon ein bisschen mehr zusammen als USD 10M.

Auf der anderen Seite wird hier AMD einiges an Stückzahlen erwarten. So wie ich es verstehe haben sie schon Design Wins über ihre Xilinix-Leute geholt. D. h. sie können die Stückzahlen recht gut abschätzen.



mae schrieb:
Naja, vielleicht machen sie's ja noch, wenn die Nachfrage hoch genug ist, und verwenden in der Zwischenzeit teildefekte grosse IODs.
Das ist ganz sicher ein Aspekt, der die Mehrkosten relativiert.

Dass AMD später einen kleineren IOD auflegt würde mich sehr wundern.

Bei den Servern wird AFAIK sehr viel Aufwand in die Validierung gesteckt. Die Komponente neu aufzulegen über die die gesamte Kommunikation mit dem System läuft, würde AFAIK eine erneute Validierung erfordern.
stefan92x schrieb:
Eben darauf bezieht sich meine Überraschung, ich würde eigentlich davon ausgehen, dass Siena in ziemlich großen Stückzahlen laufen müsste, so dass sich das lohnt. Aber anscheinend erwartet AMD das nicht
Die andere Erklärung ist, dass das bisschen eingesparte Silizium den ganzen Aufwand nicht wert ist. Wenn die Specs die für Siena zirkulieren stimmen ergibt sich:
  • Die Memory Controller und Memory PHY sind halbiert.
  • Die IO soll 96 PCIe Lanes vs 128 PCIe Lanes sein, also 3/4
  • 4 CCD benötigen mindestens 4 xGMI Links.
    • Nur vier zu bringen reduziert die Option für die breite Anbindung auf 2 CCDs benötigt aber auch nur 1/3 der Fläche
    • Auf 6 XGMI zu gehen ist nichts halbes und ganzes
    • 8 xGMI Links würde nur eine Einsparung von 1/3 bringen, brächte aber die vollkommene Freiheit wie AMD die CCDs anbindet.

Man darf nicht vergessen, dass AMD sehr viele EPYC CPUs als Customized Varianten verkauft. Dies wird IMO auch bei Siena der Fall sein.

Und wenn man es aus der Warte Flexibilität betrachtet, hat das verwenden des großen IOD viele Vorteile. Der Sockel hat ja viel Platzt, vielleicht findet sich ja die eine oder andere Anwendung für die brachliegenden XGMI Links und PCIe Lanes.
 
  • Gefällt mir
Reaktionen: bad_sign und duklum
Oberst08 schrieb:
Laut Computerbase ist der Effizienzunterschied zwischen P und E marginal bis nicht vorhanden:
https://www.computerbase.de/2021-11...t/2/#abschnitt_wie_effizient_sind_p_und_ecore
Das ist auch nur ein halbgarer Test.
Hier wird das Bild runder: https://chipsandcheese.com/2022/01/28/alder-lakes-power-efficiency-a-complicated-picture/
Kurzum hängt mal wieder viel davon ab, um welche Aufgabestellung es sich handelt. Verallgemeinerd kann man sagen, P-Kerne sind bis 3 GHz effizient und bis 4 GHz noch effizient. E-Kerne geben bis 3 GHz eine gute Figur ab. In diesen Effizienzoptima sind E-Kerne geringfügig effizienter als P-Kerne.
 
Rockstar85 schrieb:
Hälst du es für Realistisch, dass wir 4C im Desktop sehen werden?

Zumindest fuer den Laptop ist Phoenix 2 schon angekuendigt oder zumindest geleakt. Ob der dann auch im Desktop kommt, mal sehen.
 
Richtig..
Da macht es ja auch sinn, gerade in Betracht zu Platz und Leistung zu Verlustleistung.. Aber den einzigen Vorteil den ich an 4C sehe für den Desktop wäre die kompaktere Die Größe...Da wir aber die Chipletpreise nicht kennen, kp wie sich das auswirkt.
 
Rockstar85 schrieb:
Hälst du es für Realistisch, dass wir 4C im Desktop sehen werden?
Ich denke nein. AMD hat ja auch selbst gesagt, dass es dass im Desktop nicht geben wird. Ausgenommen mobile APUs, die auch für den Desktop Sockel kommen.
Rockstar85 schrieb:
Wie Realitisch siehst du eine Zen 5 mit 4C Core als Co Prozessoren?
Ich gehe eher davon aus, dass AMD die Hauptarchitektur mit derselben c Architekturen verbindet und man nicht verschiedene Gens miteinander mischt.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Rockstar85
Rockstar85 schrieb:
Hälst du es für Realistisch, dass wir 4C im Desktop sehen werden?
Wir wir werden in jedem Fall E-Kerne von AMD im Desktop sehen.
Aber IMO nicht mehr auf der Basis von Zen 4. Und IMO nicht im High End.

Ich erwarte, dass Phoenix Point im Desktop Freunde finden wird und dass AMD deshalb auch Strix Point in den Desktop bringt.
Rockstar85 schrieb:
Im Mobile könnte ich es mir vorstellen, da da ja AMD massiv an der Akkulaufzeit arbeiten würde.. Aber im Desktop
Mark Papermaster hat gesagt dass es von AMD Hybrid CPUs geben wird. Phoenix 2 und Strix Point sind Hybrid APUs
Rockstar85 schrieb:
Wie Realitisch siehst du eine Zen 5 mit 4C Core als Co Prozessoren?
Das würde mich sehr wundern. Zen 5 hat neue Befehle und somit hätte AMD dasselbe Problem wie Intel mit Alder Lake.
Innocience schrieb:
In diesen Effizienzoptima sind E-Kerne geringfügig effizienter als P-Kerne.
Dazu 2 Dinge:
  • In den Benchmarks von Phoronix war Bergamo deutlich effizienter als Genoa und Genoa X. Aus den Zahlen von Phoronix lässt sich eine Effizientsteigerung von 29 % ableiten. STH sagt nichts zur Effizienz bezüglich zu Genoa, erwähnt aber dass Bergamo effizienter als die 128 Kern Variante von Ampere ist.
  • Durch übermäßiges Steigern der Frequenz kann man jedes Design ineffizient betreiben.
mae schrieb:
Zumindest fuer den Laptop ist Phoenix 2 schon angekuendigt oder zumindest geleakt. Ob der dann auch im Desktop kommt, mal sehen.
Das komische bei Phoenix 2 ist, dass er aus dem Preisvergleich wieder verschwunden ist.

Warten wir erst Mal ab wann Phoenix im Desktop kommt, bei Phoenix 2 bin ich skeptisch.

Philste schrieb:
Ich denke nein. AMD hat ja auch selbst gesagt, dass es dass im Desktop nicht geben wird.
Meinst Du das Interview mit David McAfee bei TPU?
Da hat er ganz klar erklärt, dass es für einer Umgebung ohne Power Constraints für E-Cores aus seiner Sicht eigentlich keine Anwendung gibt. Aber ein klares Nein vermieden. Es kann deshalb sein, weil er an Strix Point dachte oder weil er es sich offen halten will.
Philste schrieb:
Ich gehe eher davon aus, dass AMD die Hauptarchitektur mit derselben c Architekturen verbindet und man nicht verschiedene Gens miteinander mischt.
Das sehe ich genauso, weil es eben Vorteile hat, wenn alle CPU Kerne die identische ISA haben.

Aber dass AMD für die P und E Kerne immer dasselbe RTL verwendet, halte ich nicht für sicher.
Ergänzung ()

Chris007 schrieb:
die nvidia karte ist alt, aktuell is a100
Wirklich?

Und warum stampft die H100 die A100 in Grafiken auf der verlinkten Seite in den Boden?

Chris007 schrieb:
und die amd will keiner haben während die nvidia a100 bis ende 2024 ausverkauft ist
Die AMD Karte ist noch gar nicht draußen, also kann die noch gar keiner kaufen.

Und sobald AMD liefern kann, werden wir sehen, ob die tatsächlich keiner will und alle bis 2025 auf eine Lieferung von Nvidia CPUs warten. Für Intel gilt übrigens dasselbe.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Icke-ffm, duklum und Rockstar85
ETI1120 schrieb:
Aber dass AMD für die P und E Kerne immer dasselbe RTL verwendet, halte ich nicht für sicher.
Ich denke wir sollten die Begriffe P- und E-Kern nicht für AMD verwenden, da das für unterschiedliche Architekturen verwendet wird bei Intel. Bei AMD gibt es einfach nur ein Standarddesign und ein kompaktes Design (mit weniger Taktpotential und ohne Option zum Stapeln von Cache) des gleichen Kerns.
 
  • Gefällt mir
Reaktionen: mae, tso, bad_sign und eine weitere Person
Zurück
Oben