Instabile Core-CPUs: Intel findet finale Absturz-Ursache in anfälliger Schaltung

Volker Rißka
313 Kommentare
Instabile Core-CPUs: Intel findet finale Absturz-Ursache in anfälliger Schaltung

Sehr lange hat es gedauert, bis Intel dem Problem der instabilen K-CPUs auf die Schliche gekommen ist, der Fehler saß aber auch tief: Die Abstürze werden durch einen kleinen Schaltkreis in den CPU-Kernen ausgelöst, der den (zu) hohen Spannungen und Temperaturen nicht gewachsen war. Noch einmal gibt es ein Microcode-BIOS-Update.

Dass zu hohe Spannungen und Temperaturen dafür gesorgt haben, dass K-CPUs „zu schnell altern“ und mit der Zeit instabil werden können, war zuvor schon bekannt und wurde von Intel mittels neuer Vorgaben an die Mainboard-Hersteller und Microcode-Updates adressiert – beides sollte zu hohe Spannungen und Temperaturen verhindern. Was noch immer nicht bekannt war: Warum CPUs nach einiger Zeit instabil werden, also welcher Teil der CPU konkret Schaden genommen hat.

In einem erneuten Community-Posting erklärt Intel seine Funde:

Intel has localized the Vmin Shift Instability issue to a clock tree circuit within the IA core which is particularly vulnerable to reliability aging under elevated voltage and temperature. Intel has observed these conditions can lead to a duty cycle shift of the clocks and observed system instability.

Intel

Insgesamt gibt es nun vier Szenarien, die zum Vmin Shift und den bekannten Problemen der Instabilität führen:

  1. Motherboard power delivery settings exceeding Intel power guidance.
    a. Mitigation: Intel® Default Settings recommendations for Intel® Core™ 13th and 14th Gen desktop processors.
  2. eTVB Microcode algorithm which was allowing Intel® Core™ 13th and 14th Gen i9 desktop processors to operate at higher performance states even at high temperatures.
    a. Mitigation: microcode 0x125 (June 2024) addresses eTVB algorithm issue.
  3. Microcode SVID algorithm requesting high voltages at a frequency and duration which can cause Vmin shift.
    a. Mitigation: microcode 0x129 (August 2024) addresses high voltages requested by the processor.
  4. Microcode and BIOS code requesting elevated core voltages which can cause Vmin shift especially during periods of idle and/or light activity.
    a. Mitigation: Intel® is releasing microcode 0x12B, which encompasses 0x125 and 0x129 microcode updates, and addresses elevated voltage requests by the processor during idle and/or light activity periods.

Der letzte der vier Punkte ist nun einer, der noch hinzugekommen ist – und für den ein erneutes BIOS-Update nötig wird. Denn erst der besagte Microcode 0x12B, der die bisherigen Lösungen für die anderen gefunden Probleme einschließt, wird auch die Probleme mit der erhöhten Spannungsversorgung im Leerlauf und in Szenarien leichter Last adressieren.

Finales (?) Microcode-Update, gleiche Leistung

Der neue Microcode wird nun an die Mainboardhersteller geliefert (oder wurde es schon), die pflegen es nun in ihre BIOS-Updates ein. Mittlerweile haben die Mainbord-Hersteller aber darin so viel Übung, dass zuletzt nur noch wenige Wochen vergingen, bis erste (Beta-)Versionen verfügbar waren, finale Ableger folgten kurze Zeit später. Laut Intel wird auch dieses Update nicht an der Performance der Lösungen schrauben. Für die K-CPUs, die es primär betrifft, gelten weiterhin die zuletzt ausgelieferten Performance- und Extreme-Power-Delivery-Profile als Standard.

Intels Juni-2024-Vorgaben für Core iK-CPUS der 13. und 14. Generation
Intels Juni-2024-Vorgaben für Core iK-CPUS der 13. und 14. Generation (Bild: Intel)

Garantieverlängerung gab es bereits

Zuletzt hatte Intel die Garantie bestimmter CPUs bereits auf fünf Jahre erhöht, das schließt neben Boxed- auch Tray-Prozessoren und CPUs aus OEM-Systemen ein. Intel erklärte, wie Kunden bei Garantiefragen je nach Bezugsquelle der CPUs vorzugehen haben:

  • Die Garantieverlängerung gilt sowohl für frühere als auch für neu gekaufte Prozessoren aus dieser Liste
  • Die Garantieverlängerung gilt neben Boxed-Prozessoren auch für Tray-Prozessoren und Prozessoren, die in OEM- und Systemintegrator-Systemen verkauft wurden. Betroffene Kund:innen können von der Garantie wie folgt Gebrauch machen:
  • Käufer:innen von Boxed-Prozessoren wenden sich an den Intel Customer Support
  • Käufer:innen von Tray-Prozessoren wenden sich an den Händler, von dem sie den Tray-Prozessor erworben haben
  • Käufer:innen von OEM- und Systemintegrator-Systemen wenden sich an den Hersteller des Systems
  • Betroffene Kund:innen, die zuvor keinen Erfolg mit ihren RMA-Anfragen hatten, bitten wir, sich an den Intel Customer Support zu wenden.
Für diese CPUs gilt die längere Garantie
Für diese CPUs gilt die längere Garantie (Bild: Intel)

Ein Ende mit Schrecken

Während der Fehler zwar sehr tief im eigentlichen Prozessorkern saß und mit Sicherheit auch viel Zeit in Anspruch nahm ihn einzugrenzen, bleibt Intels Kommunikationsstrategie das größte Desaster in dieser gesamten Angelegenheit. Hat es das Unternehmen zum Ende zwar versucht zu verbessern, werden die ersten Monate und beinahe Jahre in Erinnerung bleiben, in denen das Problem quasi als nicht existent abgetan wurde.

Betroffene CPUs sind defekt

Heute weiß man: Bereits betroffene CPUs sind irreversibel physisch degradiert und können auch nicht mehr gerettet werden. All die Patches helfen nur, wenn es noch keine Probleme gibt.

Letztlich blickt nun aber auch Intel in die Zukunft und erklärt bereits zum wiederholten Male, dass neue Prozessoren, die nun erscheinen, diese Probleme nicht aufweisen würden, auch mobile CPUS der 13. und 14. Core-Generation haben den Fehler nicht. Dies schließt für die nahe Zukunft in erster Linie Intel Lunar Lake und Intel Arrow Lake ein.