News Intels AI-Ambitionen: HPC/AI-GPU Falcon Shores kommt nicht auf den Markt

ETI1120 schrieb:
Die für mich plausibelste Erklärung ist, dass AMD Navi 31 so groß gemacht hat, das der Vollausbau im Preisrahmen von 1000 USD vernünftige Margen abwirft.
Das klingt auch für mich plausibel.
ETI1120 schrieb:
Warum sollte AMD mit einer so großen Navi 41 planen? 50 % mehr CUs als die Vorgängergeneration. Und dann noch mit erheblich teuren Packaging.
Weil man glaubte es zu können. Mit so einem Sprung hätte man sicherlich im absoluten High-End (rein technisch!) wieder angreifen können. Ob nun langsamer oder sogar schneller als die 5090 sei dahin gestellt, aber Navi41 wäre auf jeden Fall damit ernst zu nehmen gewesen
ETI1120 schrieb:
Wenn man der Geschichte mit 144 CUs und Multi Chiplet GPU folgt, dann hätte AMD alle Zurückhaltung fallen lassen die RDNA 3 geprägt hat.
Auch da stimme ich dir zu
ETI1120 schrieb:
Wie gesagt David Wang und Rick Bergman sagen im Februar 2023, dass RDNA4 in den selben Preisrahmen fällt wie RDNA3 fällt. Navi 48 IMO liegt von den Kosten her zwischen Navi 22 und Navi 21
Dürfte hinkommen.

Wirkt das ganze wie ziemliches hin und her? Ja definitiv. Aber es ergibt für mich Sinn, dass die Radeon-Entwickler eine Chance gesehen haben und die nutzen wollten, um wieder ganz oben anzugreifen, aber das Management (Lisa Su persönlich ja angeblich) interveniert hat, als absehbar war, dass die Marge schlecht sein würde. Radeon ist halt das AMD Sorgenkind derzeit, da halte ich gewisses Chaos für nicht überraschend.

Da wir hier allerdings langsam richtig offtopic werden, versuche ich nochmal den Bogen zurück zu schlagen:
Das was bei AMD mit der RTG passiert, passiert noch viel mehr bei Intel mit quasi jedem einzelnen Geschäftsbereich aktuell. Aber während AMD selbst bei eingedampfter Roadmap Architekturen nicht komplett absagt (RDNA4 kommt, aber halt nur als Mittelklasse), ruiniert Intel sich komplett seinen guten Ruf durch komplettes Chaos.
Ergänzung ()

Noch was aus dem Earnings Call, nicht nur ist Falcon Shores gecancelt, offenbar ist Clearwater Forest auch verschoben worden: https://www.servethehome.com/the-flagship-18a-intel-xeon-clearwater-forest-just-moved/

STH spekuliert hier, dass es damit zusammenhängt, dass AI-Server möglichst starke Cores brauchen, und der Cloud Native Markt (auf den E-Core CPUs wie eben Clearwater Forest ausgelegt sind) eher wenig Beachtung in diesem Jahr finden dürfte.

Das wäre die positive Interpretation, denn auf der anderen Seite sprechen wir hier über ein 18A-Produkt, das verschoben wird, das wirft natürlich auch wieder Fragen zum 18A-Node an sich auf.
 
Zuletzt bearbeitet:
stefan92x schrieb:
Da wir hier allerdings langsam richtig offtopic werden, versuche ich nochmal den Bogen zurück zu schlagen:
Das was bei AMD mit der RTG passiert, passiert noch viel mehr bei Intel mit quasi jedem einzelnen Geschäftsbereich aktuell.
  • RDNA3 hat nicht den Erwartungen und Ankündigungen entsprechend performt.
  • Das RDNA4-Lineup besteht nur aus 2 Chips.
  • MI100, MI250 und MI300 haben entsprechend der Erwartungen performt.*)
  • AMD hat jahrelang (notgedrungen) zu wenig in den Softwarestack investiert und versucht dies nun mit Hau-Ruck-Aktionen wett zu machen. Zuerst für Frontier bei HPC und aktuell bei AI.
  • AMD hat viel zu spät beschlossen, RDNA und CDNA wieder zusammenzuführen.

Was bei den Grafikkarten von AMD passiert, ist etwas ganz spezielles und kann so mit Intel nicht verglichen werden. Und auch bei Intel muss man die einzelnen Problemgebiete jedes für sich anschauen.

Aber Grundsätzlich gilt die Probleme bei Intel sind nicht über Nacht gekommen. Sie schwelen seit mehr als 20 Jahren. Auch der fehlgeschlagene Generationswechsel bei der Halbleiterfertigung hat sich erst viele Jahte später ausgewirkt.

stefan92x schrieb:
Aber während AMD selbst bei eingedampfter Roadmap Architekturen nicht komplett absagt (RDNA4 kommt, aber halt nur als Mittelklasse),
Es ist doch ganz einfach, AMD hat die Entscheidungen RDNA4 zu ändern vor mindestens 2 Jahren getroffen. Das hat es AMD ermöglicht noch etwas an den Chips ändern.

Intel hat nach Tests an Engineering Samples beschlossen, dass es keinen Sinn ergibt Falcon Shore als Produkt zu anzubieten. Zu diesem Zeitpunkt können einzelne Fehler auf dem Chip noch eliminiert werden. Wenn der Chip grundsätzlich zu wenig Performance liefert oder zu viel Power zieht, kann man dies nicht mehr ändern ohne die gesamte Roadmap in Frage zu stellen. Der Zeitpunkt der Entscheidung ließ nur "Augen zu und durch" oder einstellen zu. Jaguar Shore zu verschieben weil man Falcon Shore repariert ist keine vernünftige Option.

Was schadet Intel mehr, ein nicht wettbewerbsfähiges Produkt auf den Markt zu werfen und damit allen zu demonstrieren, dass Intel nicht wettbewerbsfähig ist oder es zu begraben? Wenn soll Intel damit bestrafen für Sales und für Marketing eines nicht wettbewerbsfähigen Produktes verantwortlich zu sein? Welche Kunden soll Intel noch mehr verärgern, weil man beim Versuch ein nicht wettbewerbsfähigen Produktes zu verkaufen, die Zeit der Kunden stiehlt .

stefan92x schrieb:
ruiniert Intel sich komplett seinen guten Ruf durch komplettes Chaos.
Das ist Unsinn. Der gute Ruf ist spätestens durch Sapphire Rapids und Ponte Vecchio ruiniert. Auf der anderen Seite ist "komplettes Chaos" maßlos übertrieben. Intel hat sich nun Mal viel zu spät entschieden eine eigene GPU-Architektur zu entwickeln. Dann noch ein Unternehmen zugekauft. Anschließend gar nicht erst versucht das Know How zu bündeln. Heraus kam getrennt marschieren und einzeln verlieren. Das folgerichtige Ergebnis, wenn man sich verzettelt, anstatt sich auf ein Produkt zu konzentrieren.

Das Versagen von Intel im Markt für HPC und AI Beschleuniger zieht sich seit 20 Jahren hin. Xeon-Phi konnte mit Nvidia nicht mithalten. Dass Xeon-Phi bei den Superrechnern einen gewissen Erfolg hatte, lag wohl maßgeblich daran, dass Intel der Hersteller von Xeon-Phi war. Ebenso wie Ponte Vecchio nur deshalb in Aurora verbaut wurde, weil Intel der Hersteller von Ponte Vecchio war. Was ein Vorzeige Projekt hätte werden sollen, wurde zum Mahnmal für Intels Ineffizienz. Sowohl was GPUs als auch was CPUs betrifft. Golden Cove war genau für einen Markt geeignet, High Performance Desktop. In allen anderen Märkten war Golden Cove eine Last. Ohne die traditionell starken Plattformen und die hohe Bindung der Unternehmenskunden, wäre es für Intel noch viel schwerer geworden.

Die Intel Data Center AI Beschleuniger sind aktuell nicht wettbewerbsfähig, weil in diesem Markt momentan nur Spitzenperformance bei guter Effizienz zählt. Es gibt kein Einstiegssegment bei Data Center AI Beschleunigern, wo Intel unter Aufgabe der Marge das Produkt losschlagen könnte.


Und noch etwas, Jaguar Shores muss 2026 oder allerspätestens 2027 kommen. Wenn dem so ist, dann ist die Architektur und RTL-Programmierung von bereits Jaguar Shore abgeschlossen. Damit liegt heute schon weitgehend fest welche Performance mit Jaguar Shore erreicht werden kann. 2026 wird der Nachfolger von Blackwell der Maßstab Jaguar Shores sein. 2027 wird wahrscheinlich der Nachfolger vom Nachfolger von Blackwell der Maßstab sein.

Allenfalls am Nachfolger von Jaguar Shore kann Intel momentan noch grundlegenede Dinge verbessern und so am Performance Level schrauben. Jede weitere Verzögerung reduziert die Erfolgschancen.

Im Halbleitergeschäft legten Entscheidungen, die vor 4 Jahren oder noch früher getroffen wurden, die Performance, Power und Area von Chips/Packages, die heute auf den Markt kommen, bereits weitgehend fest. D. h., das Einstellen von Falcon Shore ist nur die Konsequenz aus Entscheidungen die vor Jahren getroffen wurden. Das ist bitter, aber so ist das Halbleitergeschäft.

Wenn es bei Intel Chaos gäbe, hätte Falcon Shores es nicht einmal bis zum Engineering Sample gebracht.

Das Problem ist, dass Intel die Data Center GPU/AI Roadmap erst 2023 aufgeräumt hat. Pat Gelsinger hätte schon 2021 dafür sorgen müssen. Durch diese Verzögerung hat Intel 2 Jahre vergeudet. Hätte Intel die Roadmap 2021 aufgeräumt würden wir eventuell nicht über das einstampfen von Falcon Shores diskutieren.

Eine ganz andere Herausforderung ist, dass es für die Mitarbeiter frustrierend ist, wenn die Produkte an denen man arbeitet, eigentlich nie auf den Markt kommen. Es macht keinen Spaß für die Tonne zu arbeiten.
Das könnte den gewaltigen Aderlass, den Intel in den letzten Jahren erlitten hat, nochmal erhöhen.

stefan92x schrieb:
Noch was aus dem Earnings Call, nicht nur ist Falcon Shores gecancelt, offenbar ist Clearwater Forest auch verschoben worden: https://www.servethehome.com/the-flagship-18a-intel-xeon-clearwater-forest-just-moved/
War Clearwater Forrest auf 18A noch im Jahr 2025 jemals realistisch?

Fährt man einen neuen Prozess mit so großen Dies ein? Die Chiplets von Panther Lake sind kleiner und deshalb prädestiniert um den 18A Prozess einzufahren.

Die größeren Chiplets von Clear Water Forrest fertigt man, wenn der 18A Prozess eingefahren ist. Dazu bitte beachten, dass erst ca. 4 Monate nach dem Start der HVM die ersten fertigen Wafer die Fab verlassen.

stefan92x schrieb:
STH spekuliert hier, dass es damit zusammenhängt, dass AI-Server möglichst starke Cores brauchen, und der Cloud Native Markt (auf den E-Core CPUs wie eben Clearwater Forest ausgelegt sind) eher wenig Beachtung in diesem Jahr finden dürfte.
Das könnte auch ein Rolle spielen.
stefan92x schrieb:
Das wäre die positive Interpretation, denn auf der anderen Seite sprechen wir hier über ein 18A-Produkt, das verschoben wird, das wirft natürlich auch wieder Fragen zum 18A-Node an sich auf.
Nein.

Intel hat bei derselben Pressekonferenz gesagt Panther Lake kommt noch dieses Jahr. Das wäre nicht möglich, wenn es Probleme mit dem Prozess gäbe.

Das Problem ist, dass beim 18A Node Pat Gelsinger viel zu hohe Erwartungen geweckt hat. Sie waren eventuell notwendig um überhaupt das Projekt 5 nodes in 4 years angehen zu dürfen. Andererseits werden Projekte an ihren Erwartungen gemessen.

----

*) Noch ein bisschen Off topic:
Es machen News zu MI400 die Runde.
https://lists.freedesktop.org/archives/amd-gfx/2025-February/119450.html
enum {MISC_DATA_MAX_SIZE_IN_DWORDS = 20};

-struct WRITE_REG {
  • uint32_t reg_offset;
  • uint32_t reg_value;
+/*

  • * RRMT(Register Remapping Table), allow the firmware to modify the upper address
  • * to correctly steer the register transaction to either the local AID/XCD or
  • * remote MID on SMN.
  • * mode : Mode of operation for RRMT
  • * 0=Local XCD
  • * 1=Remote/Local AID
  • * 2=Remote XCD
  • * 3=Remote MID
  • * mid_die_id : Physical ID number of the Multimedia IO Die (MID) to be accessed for RRMT.
  • * 0=MID0.
  • * 1=MID1
  • * xcd_die_id : Virtual ID number of the Accelerated Compute Die (XCD)
  • * to be accessed for RRMT. For MI400, there are 2 Active
  • * Interposer Die (AID) each with 4 XCDs. The number of
  • * available XCDs depends on the Partition Mode programmed
  • * by the Secure Processor
  • * 0=XCD0.
  • * 1=XCD1.
  • * 2=XCD2.
  • * 3=XCD3.
  • * 4=XCD4.
  • * 5=XCD5.
  • * 6=XCD6.
  • * 7=XCD7.
  • *
Laut Kommentaren im Treiber sind es 2 AID mit jeweis 4 XCD.

Den Multi Media IO Die (MID) gab es auch in Fig 7 des Patentantrags US 20220320042A1 "Die Stacking For Modular Parallel Processors". Fig 7 hat ja angeblich das Top Modell von RDNA 4 gezeigt.
1738589255775.png

In Text steht auch nur:
Additionally, in some embodiments, the graphics processor MCM 702 also includes input/output (I/O) logic in a multimedia and I/O die (MID) 708 separate from the graphics processing stacked die chiplets 602.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: stefan92x
ETI1120 schrieb:
Der gute Ruf ist spätestens durch Sapphire Rapids und Ponte Vecchio ruiniert.
Ich erwähnte ja "alle Geschäftsbereiche" und dachte dabei eben auch daran, ich rede also keinen Unsinn, sondern wir beide sind uns da einig ;)
ETI1120 schrieb:
War Clearwater Forrest auf 18A noch im Jahr 2025 jemals realistisch?
Es wurde zumindest von Intel immer behauptet und wenn ihr ganzes Gerede davon, dass 18A besser als geplant laufen würde (weshalb man 20A abgesagt habe), war wäre, dann wäre das auch absolut realistisch. Wenn.
ETI1120 schrieb:
Fährt man einen neuen Prozess mit so großen Dies ein?
Wir reden immer noch über Intel. Die haben so oft versucht, mit der Brechstange nach vorne zu springen, dass ich es es Intel zutrauen würde.
ETI1120 schrieb:
Die Chiplets von Panther Lake sind kleiner und deshalb prädestiniert um den 18A Prozess einzufahren.
Passen könnte es theoretisch, dass Panther Lake wenige Monate vorher los läuft, ein Launch von beidem in 2H25 wäre tatsächlich denkbar. Und 2H25 ist ja schon "spät" für Panther Lake. Steht zwar schon lange so in bekannten Roadmaps, aber zwischenzeitlich wurde ja auch ein früherer Start vermutet wie hier: https://www.computerbase.de/news/pr...tzen-voll-auf-intel-18a-und-nicht-tsmc.88392/

Wäre Panther Lake tatsächlich jetzt schon vorgestellt worden, hätten wir eine Timeline, in der Clearwater Forest in diesem Jahr möglich gewesen wäre, mit einem realistisch sinnvollen Abstand zu Panther Lake.
ETI1120 schrieb:
Intel hat bei derselben Pressekonferenz gesagt Panther Lake kommt noch dieses Jahr. Das wäre nicht möglich, wenn es Probleme mit dem Prozess gäbe.
Doch. Wie du selbst sagst, beginnt man sinnvollerweise mit kleinen Chips. Wir alle wissen, dass die Ausbeute in den Keller geht, je größer ein Chip wird. Es wäre also denkbar, dass die erreichte Defektrate eine sinnvolle Produktion von Panther Lake ermöglicht, aber nicht von Clearwater Forest (Bonuspunkt: schlechtere Yields als geplant würde mehr benötigte Waferkapazität bedeuten, da könnte also auch ein Kapazitätsmangel entstehen gegenüber der Produktionsplanung).
ETI1120 schrieb:
Das Problem ist, dass beim 18A Node Pat Gelsinger viel zu hohe Erwartungen geweckt hat.
Oh ja...
ETI1120 schrieb:
Es machen News zu MI400 die Runde.
https://lists.freedesktop.org/archives/amd-gfx/2025-February/119450.html

Laut Kommentaren im Treiber sind es 2 AID mit jeweis 4 XCD.
Interessant zu sehen, dass auch AMD wieder die Anzahl der Dies reduziert (von aktuell 4+8 auf nur noch 2+8)
ETI1120 schrieb:
Den Multi Media IO Die (MID) gab es auch in Fig 7 des Patentantrags US 20220320042A1 "Die Stacking For Modular Parallel Processors". Fig 7 hat ja angeblich das Top Modell von RDNA 4 gezeigt.
Wenn ich das jetzt so sehe, dann würde ich stark vermuten, dass dieses Patent erst zum Nachfolger UDNA passt. Es macht auch enorm viel Sinn in meinen Augen. Denn mit UDNA führt man ja CDNA und RDNA wieder zusammen und will mit einer Architektur alle Märkte angreifen. Ein solcher MID als optionale Komponente für Desktop/Workstation-Karten, den man fürs Datacenter einfach weglassen kann, erscheint mir da durchaus als sinnvolles Chiplet.
 
stefan92x schrieb:
Es wurde zumindest von Intel immer behauptet und wenn ihr ganzes Gerede davon, dass 18A besser als geplant laufen würde (weshalb man 20A abgesagt habe), war wäre, dann wäre das auch absolut realistisch. Wenn.
https://www.intel.com/content/www/us/en/newsroom/opinion/continued-momentum-intel-18a.html#gs.envgxt

Since releasing the Intel 18A Process Design Kit (PDK) 1.0 in July, we have seen positive response across our ecosystem and are encouraged by what we’re seeing from Intel 18A in the fab. It’s powered on and booting on operating systems, healthy, and yielding well – and we remain on track for launch in 2025.
Die Pressemeldung ist vom 4 September 2024. Damit ist klar, dass es nicht in der ersten Jahreshälfte losgeht.

It's steht wohl für Panther Lake.

One of the benefits of our early success on Intel 18A is that it enables us to shift engineering resources from Intel 20A earlier than expected
Da steht nicht, dass der 18A Prozess vorgezogen würde.
Focusing resources on Intel 18A also helps us optimize our engineering investments.
Sie sparen sich das Yield fahren für 20A. Außerdem haben sie mehr Zeit, um die Fertigung einzurichten.
IIRC wurde gesagt dass Intel bei ausrüsten der Fab 500 Mio USD spart weil Arrowlake komplett zu TSMC verschoben wurde.
stefan92x schrieb:
Wir reden immer noch über Intel. Die haben so oft versucht, mit der Brechstange nach vorne zu springen, dass ich es es Intel zutrauen würde.
Ann Kelleher ist kompetent. Ansonsten wäre es ihr ab August 2020 nicht gelungen die Halbleiterentwicklung bei Intel wieder in die Spur zu bringen. Ich kenne nur positive Kommentare zu Ann Kelleher.

Mit der Brechstange spielst Du auf 10 nm an. Und wann sonst noch?

stefan92x schrieb:
Passen könnte es theoretisch, dass Panther Lake wenige Monate vorher los läuft, ein Launch von beidem in 2H25 wäre tatsächlich denkbar. Und 2H25 ist ja schon "spät" für Panther Lake. Steht zwar schon lange so in bekannten Roadmaps, aber zwischenzeitlich wurde ja auch ein früherer Start vermutet wie hier: https://www.computerbase.de/news/pr...tzen-voll-auf-intel-18a-und-nicht-tsmc.88392/
Das ist eine veraltete Information, aktueller Stand:
And Intel is only going to continue bolstering its AI PC product portfolio in 2025 and beyond as we sample our lead Intel 18A product to customers now ahead of volume production in the second half of 2025.”
Das 18A in der zweiten Hälfte von 2025 in HVM geht ist IIRC schon eine ganze Weile Stand der Dinge, und das hatten die Co-CEOs AFAIR auch noch Mal bei ihrem Amtsantritt erklärt.

Deswegen habe ich im vorherigen Post ausdrüklich erwähnt, dass Intel den Launch von Panther Lake noch für 2025 angekündigt hat.

Es war ein Problem mit Pat Gelsinger, dass er es zugelassen hat, dass sich falsche Erwartungen festsetzen. Wie bei Meteor Lake. Hier waren viele der Meinung dass Meteorlake Anfang 2023 käme, dann glaubten sie Mitte 2023 bis es zum Schluss tatsächlich Ende 2023 wurde.

Allerdings hat Pat Gelsinger im Quartal Call Q1/23 zu erzählt Meteor Lake wäre in HVM. Er hatte im Moment Ruhe und das zählte. Im September gab es dann einen großes Event in Irland zum Start der HVM. Was zu einem Post von Ende 2022 passt, dass die letzte EUV Maschine für die HVM erst im Mai 2023 geliefert werden sollte. Mir war klar, wenn dieser Post stimmt wird es spät in 2023.


stefan92x schrieb:
Ok. Ich habe mich unklar ausgedrückt. Der Umstand dass Panther Lake für dieses Jahr angekündigt wurde, bedeutet, dass der Prozess fertig entwickelt wurde und funktioniert. Funktioniert bedeutet dass die Transistoren ihre geplanten Parameter erfüllen.

Jetzt kommt es noch darauf an den Prozess einzufahren, so dass ein guter Yield erzielt wird. Wenn Intel mit der Angabe von D0-Fehlerrate < 0,4 Fehler/cm² nicht gelogen hat, dann ist die Chance sehr hoch, dass Intel den Yield in den Griff bekommt.
stefan92x schrieb:
Interessant zu sehen, dass auch AMD wieder die Anzahl der Dies reduziert (von aktuell 4+8 auf nur noch 2+8)
Wieso? Die Anzahl der Dies bestimmt den Yield beim Packaging. Was für die MI300 noch optimal war, kann für die MI400 ganz anders aussehen. Die Frage ist, gibt es für MI400 wieder eine APU? Die MI300 war so konzipiert, dass ein AID 2 XCD oder 3 Zen 4 classic CCDs aufnehmen konnte.

Wenn AMD tatsächlich mit Zen 6 bei EPYC auf Advanced Packaging wechselt, stellt sich auch hier die Frage nach der optimalen Anzahl der Dies neu.

Wenn der Pitch kleiner wird, steigen natürlich die Anfordungen an die Positioniergenauigkeit. Weshalb es gut sein kann, dass weniger aber größere Chiplets besser sind.

stefan92x schrieb:
Wenn ich das jetzt so sehe, dann würde ich stark vermuten, dass dieses Patent erst zum Nachfolger UDNA passt.
Es macht auch enorm viel Sinn in meinen Augen. Denn mit UDNA führt man ja CDNA und RDNA wieder zusammen und will mit einer Architektur alle Märkte angreifen. Ein solcher MID als optionale Komponente für Desktop/Workstation-Karten, den man fürs Datacenter einfach weglassen kann, erscheint mir da durchaus als sinnvolles Chiplet.
Eine möglich Interpretation.

Aber es wird ein wenig komplizierter. Dieselbe Architektur zu haben, bedeutet nicht dass XCD und GCD identisch sind.
 
Zurück
Oben