News Instabile Raptor-Lake-CPUs: Intel identifiziert zu hohe Spannung als eine Ursache

@Maxminator die Dinger bestehen aus den gleichen Materialien, die Fertigungslinie folgt den identischen Standards, das Innenleben ist im Prinzip auch identisch, auch wenn natürlich nach anderen Kriterien / für ein anderes Anforderungsprofil "zusammengestellt", die Prozessoren sind für den 24/7 Einsatz unter Volllast konzipiert...
 
  • Gefällt mir
Reaktionen: LuxSkywalker, or2k, hanjef und eine weitere Person
Das ist mir schon bewusst. Das greift aber nur wenn es wirklich an einem Fertigungsproblem in der sehr komplexen Herstellung lag. Komischerweise sind eher die K CPUs betroffen, die wahrscheinlich durch Binning/Aussortieren bei einem Test eben diese K Bezeichnung bekommen und somit höhere Taktraten bekommen können. Und wie wir wissen, die höhere Taktraten brauchen mehr Spannung. Somit ist sehr wahrscheinlich die Spannung als Ursache anzusehen.
 
derkleinedieb schrieb:
Intel hat bei den betroffenen CPUs eine RMA Quote von 0,6%
...
Mein Bruder betreibt im Hamburger Raum ein Systemhaus und ist Lenovo Partner.
An 2 Mittelständler sind in 2024 , 48 Lenovo Thinkstation P3 (mit i9-14900K + RTX A4000) ausgeliefert worden. Davon sind 4 bisher reklamiert worden, wegen instabilem Betrieb. Der Vor-Ort-Service von Lenovo hat die Geräte nach erfolglosen Reparaturversuchen durchgetauscht.
Auch wenn das immer noch eine kleine Stichprobe ist von deinem Bruder, wieso nimmst du eine 0,6% Quote an, wenn dein Bruder schon über 8% hat?!
 
  • Gefällt mir
Reaktionen: Ganjaware, JarlBallin und Cerebral_Amoebe
@Maxminator Das ist ein simple kaufmännische Rechnung:

  • Die Single-Thread-Leistung ist in der Regel deutlich höher als bei den Xeons
  • Die Xeons bieten einen Feature- und Supportlevel, der bezahlt werden muss, hier aber nicht erforderlich ist
  • Die normalen Core-CPUs und Peripherie sind um Größenordnungen günstiger (um nicht zu sagen, dafür kannst Du die Sachen 3-4x kaufen und betreiben)
  • Für die Einsparung kann man sich Ersatz mehrfach selbst auf Lager legen
  • Was man "normal" nicht muss, weil die CPUs auf demselben Silizium basieren
  • Dafür hat man gravierende Nachteile bei der Packdichte
  • Aber wiederum weniger Stress bei der Kühlung und Energieversorgung. Man braucht halt nur viel Fläche/Raum

In einem RZ wird das Ganze in klimatisch optimalen Bedingungen betrieben

  • Regalwände statt 19"-Racks
  • Konstante, niedrige Temperaturen
  • USV-Gestützte Energieversorgung
  • Geringe Verschmutzung

im Vergleich zu "daheim von Overclocker Horst-Kevin".

Insbesondere bei Dedicated/Gameserver-Hosting ist das ein No-Brainer. Halb bis Dreiviertel Hetzner nutzt Consumer-Hardware. Oder wie Backblaze es bei Cloudstorage macht.

"RZ" ist nicht gleich RZ. Wir reden hier hier nicht von hochverdichteten Cloud-Servern wie sie bei Microsoft, Google und Amazon zum Einsatz kommen. Die sind mittlerweile so groß, die entwickeln für ihre Anwendungen eigene CPUs/Technologien und kaufen mitunter auch keine Xeons mehr aus Intels Regal.
 
  • Gefällt mir
Reaktionen: .fF, LamaMitHut, or2k und 6 andere
Maxminator schrieb:
Somit ist sehr wahrscheinlich die Spannung als Ursache anzusehen.
so in dem von dir genannten Kontext, ganz klar: Nein
die K(S) Prozessoren sind ebenfalls für den 24/7 Einsatz tauglich, solange sie innerhalb ihrer der Spezifikationen laufen und darüber hinaus sogar für den regulären OC Betrieb.

Das Problem ist, das aufgrund des Bugs im Microcode die CPU die entsprechenden Einstellungen im Bios übergehen kann und so mehr Energie zieht / anfordert, als sie eigentlich sollte -> auf (in diesem Fall sogar ausgesprochen kurzen) Dauer verträgt.
Deswegen gibt es ja das Problem auch bei den Prozessoren, die, laut Bios Einstellungen, im UV laufen
 
  • Gefällt mir
Reaktionen: meckswell und Maxminator
Aha, interessant. Danke für die Ausführungen ihr beiden.
PS: am 01. August meldet Intel ja die Q2 Zahlen - mal sehen ob die was im Conference call zu der Problematik sagen. Oder Gott bewahre Intel hat in Q2 Rückstellungen für den möglichen Rückruf gebildet...
 
  • Gefällt mir
Reaktionen: Cat Toaster
Alesis schrieb:
Und wenn man noch bedenkt, dass alle die Intel in Schutz genommen haben, jetzt einfach weiter machen ohne ihre falsche Ansicht zu überdenken, werden diese Leute natürlich weiterhin Intel feiern.
Offensichtlich verdienen die stärksten Befürworter hier im Forum Ihr Geld mit dem Verkauf von Hardware, daher rührt deren Obsession und nicht weil sie Ihren PCs Namen geben.

Je mehr weniger Informierte hier von Problemen lesen oder durch Mundpropaganda weitergegeben wird, desto mehr entrüstete Käufer werden den Verkäufern auf die Pelle rücken, ob nun berechtigt oder nicht.
Das ist bei dem 12VHPWR genauso gewesen.
Schuld ist die Borniertheit der Hersteller.
 
  • Gefällt mir
Reaktionen: M11E, inge70 und JarlBallin
Maxminator schrieb:
PS: am 01. August meldet Intel ja die Q2 Zahlen - mal sehen ob die was im Conference call zu der Problematik sagen. Oder Gott bewahre Intel hat in Q2 Rückstellungen für den möglichen Rückruf gebildet...

Glaub ich nicht. In den ganzen Finanzmärkten und auf den passenden Portalen spielt das Thema exakt gar keine Rolle bisher, mal hier als Beispiel: https://seekingalpha.com/symbol/INTC
Das da ist halt genau so eine Blase wie hier im Forum, einigen Tech-Seiten oder den paar Youtubern zum Thema, nur die jeweiligen anderen Extreme ;)

Das wollen sie auch so lassen, deshalb gibs ja nur Community-Posts in Foren und auf reddit, aber nichts im Newsroom. Es wird genau so laufen wie Intels Kommunikationspolitik dazu bisher: Schweigen ist Gold! Es sei denn sie finden nun doch den großen Bock, dass sie da nicht mehr quasi unbeschadet rauskommen. Aber bisher zeigen sie das so nicht.
 
  • Gefällt mir
Reaktionen: Tanzmusikus, or2k und Maxminator
Ben_computer_Ba schrieb:
Denkst du dir die Zahlen aus? Ja, dann behalt es für dich, ansonsten Beleg das bitte mal.
Wir haben in der Firma in fast 80 Rechnern den 13900k verbaut, bis jetzt einen defekt gehabt und der hatte von Beginn an Probleme gemacht. Die Rechner laufen alle einige Stunden und das täglich.

Es geht zum einen nicht im einen Totalausfall, sondern um fehlerhafte CPUs.


Kommen von Game Servern Nutzung im Datacenter, 24/7 Betrieb, keine OC Boards involviert. IIRC erwähnt Wendel das das Betroffene Datacenter dann sogar von Intel komplett alle 13 Gens gegen 14 Gens ersetzt bekommen hat, aber das Problem trotzdem nicht gelöst wurde.

In dem Fall waren wirklich iirc 50% der 13 und 14 Gens betroffen. Sample Size war iirc über 1000 CPUs. Ich könnte jetzt noch mehr ins Detail gehen, aber im Grunde schau dir einfach das Video an.

12th Gen Intel und Ryzen Systeme haben sich bei der Auswertung als komplett unauffällig gezeigt, und die 13th and 14th Gen Intels haben oft so etwa 6 Monate 24/7 Nutzung gebraucht bis sie angefangen haben untragbar zu werden. Also jene hälfte die Fehlerhaft war und so schnell von Degradation betroffen war.
Ergänzung ()

Volker schrieb:
Das da ist halt genau so eine Blase wie hier im Forum, einigen Tech-Seiten oder den paar Youtubern zum Thema, nur die jeweiligen anderen Extreme ;)
Also sofern Wendel sich seine Quellen nicht aus den Fingern saugt ist das ein Problem für OEMs und Datacenter Kunden. Zugeben, ein sehr begrenztes Problem, weil ja der Großteil der Modelle problemlos läuft, aber die Geschäftskunden scheinen trotzdem wirklich unzufrieden mit der Situation zu sein.
 
  • Gefällt mir
Reaktionen: Tanzmusikus und or2k
könnte das erklären warum meine versuche dies jahr amd karten stabil zum laufen zu bringen alle zum scheitern verurteilt waren ? ich hatte ja anfang des jahres schonmal herausgefunden das ein microcode update von intel das problem verschlimmt hat. hmmm
 
  • Gefällt mir
Reaktionen: OnkelDae
gerade geschaut: meinen i7 13700k habe ich im Oktober 2022 gekauft. Heißt es meine CPU ist NICHT von der Problematik betroffen?
 
Nooblander schrieb:
Was hat das mit dem Thema der News zutun?
Sorry. Ich hatte mich damit auf ein, zwei Kommentare über mir (glaube ich) bezogen. Ich hätte entsprechenden Kommentator wohl markieren sollen.
 
  • Gefällt mir
Reaktionen: Nooblander
Igor hat weitere Infos aus einem internen Intel Dokumenten geleakt. Das Thema wird uns wohl noch eine Weile begleiten.
While Intel has confirmed elevated voltages impact the increase in Vmin, investigation continues in order to fully understand root cause and address other potential aspects of this issue.
 
@Maxminator
Das Buildzoid Video zeigt, warum sogar Supermicro selbst die K in ein Blade steckt.
Würde es einen potenten 14100K für einen Bruchteil des 14900K mit gleicher Einzelkerneistung geben, würden diese wohl dagegen selbst in vielen Office und manch Datenbanksystemen reihenweise eingesetzt. Wenn dann noch 2 Kerne auf 5.9 Ghz takten würden, das Produkt wäre gefragt.

Übrigens eine gefühlt schnelle und nicht Hardcore trockene eine Stunde Buildzoid Video.

 
  • Gefällt mir
Reaktionen: JarlBallin
Wenn man 1+1 zusammenzählt, drängt sich langsam folgende Hypothese auf:

Die betroffenen CPUs sind ganz simpel die Feldausfälle, die dieses "Fertigungsproblem" (via oxidation?) haben.

Es klingt auch stark danach, als wenn das Problem bis zur Entdeckung (stark verzögert durch Feldausfälle, der Horror jeder Fertigung) in ALLE Wafer unwissentlich eingebaut wurde. Je nach Laufzeit und Betriebsbedingungen kommen jetzt immer mehr CPUs dazu. Das Microcode Update, soll jetzt nur dafür sorgen, dass man noch Zeit gewinnt um das Gras wachsen zu lassen.
 
  • Gefällt mir
Reaktionen: JarlBallin, knupanse und Kadett_Pirx
Maxminator schrieb:
gerade geschaut: meinen i7 13700k habe ich im Oktober 2022 gekauft. Heißt es meine CPU ist NICHT von der Problematik betroffen?
doch meine ist vom November und betroffen. Gestern die Zusage bekommen, dass ausgetauscht wird.
 
  • Gefällt mir
Reaktionen: Tanzmusikus
@Woody17
Das wurde von Intel aber schon ausgeschlossen und soll auch nur die 13. Generation betreffen.
We can confirm that the via Oxidation manufacturing issue affected some early Intel Core 13th Gen desktop processors. However, the issue was root caused and addressed with manufacturing improvements and screens in 2023. We have also looked at it from the instability reports on Intel Core 13th Gen desktop processors and the analysis to-date has determined that only a small number of instability reports can be connected to the manufacturing issue.
 
Woody17 schrieb:
Es klingt auch stark danach, als wenn das Problem bis zur Entdeckung (stark verzögert durch Feldausfälle, der Horror jeder Fertigung) in ALLE Wafer unwissentlich eingebaut wurde.
Intel hat mehr als eine Fab. Gut möglich, dass nur eine betroffen war und deshalb nicht alle ausfallen.

Und wie @Techniker Freak schreibt wurde das ja auch schon gelöst.
 
  • Gefällt mir
Reaktionen: inge70
Wenn mal einige das Buildzoid Video komplett gesehen hätten.
Offensichtlich lies die betroffene Firma Minecraft-server auf den Supermicro Blades laufen. Das läuft wohl
unter Linux und mit ständigen 6Ghz Single-Core Boost. Die Ausfallquote in 3 Monaten lag bei 30 % und
nach Abschalten des 6Ghz Boost sank die Quote unter 5 %.
Alle Single-Core instabilen CPUs konnten aber Multicore Benchmarks inklusive Y-Cruncher bestehen.
Die Schlußfolgerung ist, das bei Der 6Ghz Boost Funktion zu hohe Spannungen angelegt werden und das
die CPUs im 24/7 Betrieb recht schnell verschleissen lässt.
Da wird wohl Intel nichts übrig bleiben als die betroffenen Modelle viel besser zu selektieren um die
Auslieferung solch VCore hungriger Modelle zu verhindern.
Könnte durchaus ein Selektions- und kein Produktionsproblem sein. Aber bessere Selektion kostet wahrscheinlich deutlich mehr Geld.
 
  • Gefällt mir
Reaktionen: Tanzmusikus und Apocalypse
Eben nachgeschaut auf Twitter.
Da sind Intel/Intel News/Intel Gaming auffallend schweigsam mit neuen Posts,
2-3 mal was über "AI", aber sonst das eiserne schweigen zu CPU News.
 
  • Gefällt mir
Reaktionen: Kadett_Pirx
Zurück
Oben