News Instabile K-CPUs: Intel Core i9 13. & 14. machen auch im Server große Probleme

maximus_hertus schrieb:
Aktuell und das ist nur meine Spekulation, wird Intel versuchen, das ganze mehr oder weniger auszusitzen. Alle mit Problemen wird man eine neue CPU per RMA anbieten und irgendwann redet jeder nur noch über ARL
Intel hat halt auch nicht mehr unbegrenzt Zeit das Ganze auszusitzen. Wenn das Thema die ganze Zeit vor sich hin blubbert, werden bei Vorstellung von Arrow Lake halt alle nur darüber reden: Ist das Problem in dieser Generation gefixt? Mit einem Prozessorbug mit ungeklärter Ursache in der Vorgängergeneration den Marktstart der neuen Generation durchzuziehen wäre halt schon nahe dran am Marketing-Harakiri.
 
  • Gefällt mir
Reaktionen: Raykus, floTTes, Dittsche und eine weitere Person
Das Problem beschränkt sich nicht nur auf die K Modelle. Nur tritt es dort früher auf.
Laßt einfach eine 14900 CPU mal 24 Std am Tag und das Wochen und Monate richtig rechnen.

Meinem persönlichen Eindruck nach "altern" die CPUs je nach Modell und Nutzung mehr oder weniger stark.
 
  • Gefällt mir
Reaktionen: floTTes
Das ist schlimmer als FX und Netburst, Instabilität ist nämlich schlimmer als suboptimale Geschwindigkeit oder Effizienz. Ohje Intel.
 
  • Gefällt mir
Reaktionen: Coeckchen, up.whatever, floTTes und 3 andere
maximus_hertus schrieb:
Jup, bzw. deine Kunden. Sie arbeiten sicherlich nicht 24 Stunden am Tag und 7 Tage die Woche? Die CPUs deiner Kunden werden nicht 24/7 ausgelastet?

Doch, zum Teil schon. U.a. sind darunter Systeme gewesen, die für recht aufwendige Videoinstallationen bei Kunstausstellungen genutzt wurden. Die laufen einmal angeschaltet einfach durch. Und mitunter nicht unter optimalen Bedingungen (unklimatisierte Technikräume, keine Innenreinigung, kein Entfernen von Staub und anderen "Dingen").
 
  • Gefällt mir
Reaktionen: incurable
stefan92x schrieb:
Gar nicht mal unbedingt. Sooo viele Gameserver dieser Art werden auch nicht betrieben, das ist schon eine ziemlich kleine Nische im Servermarkt, für die sich eigentlich auch keiner interessiert. Da kommt nur jetzt mal Aufmerksamkeit drauf, weil man dadurch einen Vergleich zu den Desktop-Systemen mit Problemen hat.
Weiss ich jetz nich so ob es soooo wenig sind, wenn man bedenkt wie gross der Gamingmarkt inzwischen ist. Aber nun gut. Das werden wir wohl nicht auflösen können, ich finde leider keine Zahlen dazu wieviele Server die großen Anbieter so hosten :D Glaub jedoch wenn einer deswegen alles austauscht würden andere das auch tun und in den Bestellungen würde das schon irgnend nem Data Scientist auffallen. ^^
 
Pokerclock schrieb:
Ausnahmslos alle Mainboards wollten von Anfang an Knallgas. Das Asus ProArt hat dabei den Vogel komplett abgeschossen mit >500 A.
Das schockiert und ärgert mich:
Ich bin jemand, der gibt gerne Geld für gute Hardware aus, aber ich hab dann echt nicht die Lust lange daran herumzufummeln, ich will, dass sie "out of the box" gut läuft.
Wenn dann irgendwelche Boards außerhalb der Specs fahren nervt mich das. Ich kauf auch keine OC GPUs mich interessieren 0,1% mehr Leistung nicht, lieber eher UV Versionen, aber sowas gibts nicht (ich hätte gerne eine Herstellerseitige 4090 @275W, getestet und mit Garantie statt mit selbst damit befassen zu müssen)
 
  • Gefällt mir
Reaktionen: metallica2006, floTTes, AlphaKaninchen und eine weitere Person
Waelder schrieb:
Ebenso kann niemand sagen ob die Dunkelziffer viel höher ist oder doch nur alles hochgespielt wird, die letzten Jahre war bei Problemen meist zuerst die GPU, RAM-config - vor der CPU als Verdächtiger zu sehen(zumindest meinem Gefühl nach), dürfte bei vielen nach wie vor so sein...
Tja wären die Fehlermeldungen eindeutig den CPUs zuzordnen dann ja, aber wie hier z.B. weißt die Fehlermeldung ein Problem mit dem GPU Treiber hin, Schuld ist aber die CPU: https://forums.warframe.com/topic/1405008-instability-on-recent-intel-processors/

Wer von euch würde hier auf die CPU tippen? Ich nicht. Daher bin ich mir sicher, dass die Dunkelziffer wesentlich höher ist. Die schlagen nur alle beim Entwickler oder Nvidia auf (im Falle von Warframe).
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Alexander2 und pvcf
Wilfriede schrieb:
Dass dies so ausufert hätte ich nie gedacht. Mein Beileid an die Intel Besitzer. Zumindest wer die grossen Desktop CPU‘s gekauft hat.
Das traurige ist ja, das du (zumindest ich) ja nen K Prozessor gekauft hast, weil du davon ausgehst das sie aufgrund ihrer besseren Qualität ein K Prozessor wurden. Genau dieses Vertrauen hat Intel zumindest bei mir jetz verloren. Bei den golden Chips für einen KS mag ich mir das Misstrauen der Leute jetzt gar nicht ausdenken.
 
  • Gefällt mir
Reaktionen: floTTes
catch 22 schrieb:
die sind weit, sehr weit von dem Entfernt, was auf Consumer Boards außerhalb der Basis Spezifikationen einstellbar sind
... was wie bereits geschrieben völlig irrelevant ist, weil der Hersteller der Boards sehr wohl Zugriff auf die entsprechenden Optionen haben.
 
Pokerclock schrieb:
vom "professionellen" Serveranbieter

Die Anführungszeichen kannst du dir in dem Zusammenhang sparen. Diese Serveranbieter sind im wahrsten Sinne des Wortes Profis, denn sie betreiben diese Rechner nicht nur zum Spaß, sondern verdienen ihr Geld damit. Und deswegen kann man sicher davon ausgehen, dass sie so viel Geld in Messequipment, Analysesoftware und Arbeitsaufwand für Protokolle usw. stecken, wie nötig und sinnvoll, um ihre Einkommensquellen möglichst reibungslos und zuverlässig am Laufen zu halten.

Ich denke, an viel bessere Werte wird man nicht heran kommen, außer man baut ein riesiges, wissenschaftliches Labor mit tausenden Test-Rechnern auf und fährt monatelange Dauer-Stresstests damit. Den Aufwand betreibt höchstwahrscheinlich nicht mal Intel selbst. Auch Intel wird sich in erster Linie auf Protokolle von Server-Betreibern und anderen, professionellen Nutzern stützen, die viele Rechner mit den betroffenen Intel-CPUs im Einsatz haben. Es ist ein echter Glücksfall, dass es offenbar solche professionellen Anwendungsfälle auch für die K-CPUs gibt, die ja eigentlich eher an Consumer gerichtet sind. Gäbe es nur die zusammenhanglosen Einzelfall-Beschreibungen von bei Privatnutzern willkürlich ausfallenden Rechnern, ohne genaue Kenntnis der Umstände, würde man die Ursache der Probleme sehr viel schwerer herausfinden.
 
  • Gefällt mir
Reaktionen: M11E, Dgini, Rockstar85 und 9 andere
Wenn alle Tech Youtuber bei Produktvorstellung einstimmig sagen, die 13900K, 14900K sind nicht zu kühlen, ziehen zu viel Strom ist das eben kein INTEL Bashing.

Die Dinger sind ab Werk zu heftig overclockt und darum fließt zu hoher Strom durch die kleinen Leiterbahnen.
Wie jeder nachlesen kann, sind das tickende Bomben, die früher oder später instabil werden.

Viele laufen sogar einige Monate bis langsam die Stabilitätsprobleme einsetzen.
Dann kann man sie mit UV, UC, BIOS Update, E-Core Abschaltung, max. Multiplikator usw. eine Weile noch am Leben halten. Aber zwangsläufig kommt man irgendwann an die Stelle wo es nicht weiter runter und die CPUs sind dann Schrott.

Hätte ich so ein Ding, würde ich es schnellstens loswerden und auf Vorgänger (12000er) oder gleich AMD setzen.
 
  • Gefällt mir
Reaktionen: LuxSkywalker und JarlBallin
Der Nachbar schrieb:
Als hätte intel keinen Zugang zum Elektronenrastermikroskop oder könnte nicht seine Produkte nachträglich im eigenen intel Labor prüfen, auch der Konkurrenz.;)
Du glaubst tatsächlich, dass Intel das nicht längst gemacht hat? Die arbeiten mit Hochdruck daran, den Fehler zu finden. Wenn es ein Design Fehler ist, der sich durch mehrere Generationen schleicht, noch dazu im Server landet, ist das Ausmaß ein ganz anderes.
 
  • Gefällt mir
Reaktionen: floTTes
BAR86 schrieb:
Das schockiert und ärgert mich:
Ich bin jemand, der gibt gerne Geld für gute Hardware aus, aber ich hab dann echt nicht die Lust lange daran herumzufummeln, ich will, dass sie "out of the box" gut läuft.

Hier kann ich Dir grundsätzlich die Boards von Asrock empfehlen. Teilweise stellen die selbst das Temp-Limit von sich aus runter. AMD-Vorgabe > 90 Grad, Asrock Auto-Einstellung > 75 Grad. Man wundert sich dann nur, wo die Performance abgeblieben ist. :ugly:
 
  • Gefällt mir
Reaktionen: Raykus und BAR86
Pokerclock schrieb:
Irgendwas muss ich also anders machen als die "professionellen" Serverbetreiber...
Wie es aussieht, hast du nur 14 Systeme anstatt 500.
Vermutlich sind deine Systeme noch nicht so stark degradiert. In dem Falle steht es noch bevor.
Ich drücke dir die Daumen, dass es anders kommt, als die Karten stehen.
 
  • Gefällt mir
Reaktionen: floTTes, JarlBallin und Helge01
LencoX2 schrieb:
Wenn alle Tech Youtuber bei Produktvorstellung einstimmig sagen, die 13900K, 14900K sind nicht zu kühlen, ziehen zu viel Strom ist das eben kein INTEL Bashing.
Blah-blubb ist das. Wie Wendell, der sein Video mit einem völlig schamlosen "we all know Intel's got a problem with the 13900k and the 14900k being unstable" eröffnet. 🤷‍♂️
 
incurable schrieb:
... was wie bereits geschrieben völlig irrelevant ist, weil der Hersteller der Boards sehr wohl Zugriff auf die entsprechenden Optionen haben.
Optionen, die bei Consumer Boards durch Intels Gnaden frei standen verändert zu werden, nicht aber bei Server Boards. Insbesondere bei B2B / Server Hardware gilt: wer sich nicht punktgenau an die Vorgaben hält, bettelt darum von seinen Kunden, wie auch denjenigen, die die Vorgaben stellen (Intel für seinen Intel Chipsatz in diesem Fall) vor Gericht mehrfach täglich lang gemacht zu werden!
 
  • Gefällt mir
Reaktionen: floTTes und LuxSkywalker
TigerNationDE schrieb:
Weiss ich jetz nich so ob es soooo wenig sind, wenn man bedenkt wie gross der Gamingmarkt inzwischen ist
Aber nicht jedes Game braucht solche Server, viele laufen auch mit ganz "normalen" Servern. Der Einsatz von Desktop-CPUs ist halt da auch eine Nische.
 
  • Gefällt mir
Reaktionen: TigerNationDE und Monarch2
Wenn man mal Fakten die bekannt sind Analysiert kann man interessante Rückschlüsse daraus ziehen.

1. Weis Intel was diese Probleme verursacht welche ca. 50% der CPUs nach einiger Zeit befällt?
Ich tendiere zu ja sie wissen woran das liegt!
Ein Indiz welches diese These bestätigen würde ist das Intel den Start von Arrow Lake ohne Verzögerungen im Q4 durchführen wird. Das kann man nur wenn man sich zu 100% sicher ist das die Probleme nicht weiter vererbt wurden in die Neue CPU Generation.

2. Was unterscheidet die anfälligen 13/14900K/S CPUs von ihren kleineren Varianten was mit dieser Problematik zusammenhängen könnte?
Da könnte man Dinge wie höhere Spannungen bzw. Temperaturen usw. ins Feld führen.
Dem Widerspricht aber die Hohe Ausfallrate in Serverfarmen wo die CPUs mit Intel Standartwerten laufen also wesentlich weniger Spannungen als bspw. ein 14700K in einem Konsumer Rechner.

Für vielversprechender erachte ich da den Ansatz:
a.) Die Probleme treten meist erst nach einiger Zeit auf u. verschlimmern sich Zusehens.
b.) Es sind vermutlich nicht alle CPUs davon betroffen sondern in etwa 50%

Das lässt mich auf ein Produktionsproblem schließen welches man über Seriennummern eindeutig zuordnen könnte. Leider hab ich diesbezüglich nichts im Netz gefunden darum kann ich wie wir alle nur Spekulieren.

Nehmen wir mal an die 13/14900K/S CPUs werden nur in wenigen Fabriken u. in denen Exklusiv gefertigt in verschiedenen Standorten Asien/USA. Nehmen wir weiter an das man in den Fabriken sagen wir mal in Asien (Da dort ja die Ersten Fälle der CPU Instabilität Problematik gemeldet wurden "Südkorea").
Irgend etwas "anders" gemacht hat bei der Fertigung vielleicht um die Chipausbeute zu verbessern. Oder es Verunreinigungen in irgend einem Substrat oder ähnliches gab was man nicht gleich bemerkt hat.

In solch einem Scenario hätten wir viele der Offenen Fragen erklärt!
Fragen wie warum nur die 13/14900K/S betroffen sind u. weshalb nur ca. 50% davon
Auch das Grenzwertige verhalten des Intel Supportes das solch eine CPU mit diesem Defektmuster nur ein einziges mal reklamiert werden kann.
Das können sie nur machen wenn sie genau wissen:
a.) Welche CPUs sind davon betroffen (Seriennummer = Fertigungsstandort)
b.) Sie wissen das die Ersatz CPU zu 100% diesen Fehler nicht mehr aufweisen.
 
  • Gefällt mir
Reaktionen: inge70
Pokerclock schrieb:
Intel kannte bis zuletzt selbst nicht genau, was sie denn nun für Powerlimits "empfehlen".
und
BAR86 schrieb:
schon vor über 3 Monaten ein neues Baseline-Profil ausgeliefert)
Warum kommt denn diese Fehlinformation denn immer noch hier nach dieser Zeit? Das wurde doch jetzt schon oft genug zitiert. Und wir sind endlich weiter in dem was wir wissen.
Pokerclock schrieb:
Ich sehe keinen Nachweis (ein Bild von einem Server-System hätte dicke gereicht)
Das ist in einem Datacenter. Da kommst du nicht einfach so an die Racks. Das macht das Datacenter schon selbst. Und du hast nur den Remotezugriff, den wir auch im Video sehen. Dank IPMI auch auf BIOS Ebene. Und bekommst vom Datacenter auch noch andere Daten wie zB den Stromverbrauch von der Steckdose den die zusätzlich messen und bereitstellen. Powerlimits sollten also am Board liegen und am Admin / hat Wendell unter Kontrolle. Genau wie im Video angesprochen und auch nicht anders als RAM Takt.
Pokerclock schrieb:
Im Gespräch mit Gamersnexus hat man sich da noch über den "niedrigen" RAM-Takt von DDR5-4200 lustig gemacht. 128 GB laut Postscreen bedeuten Vollbestückung. Intel-Vorgabe sind DDR5-3600 (!) bei Vollbestückung und damit startet das Board dann auch im Failsafe. DDR5-4200 kann laufen, muss aber nicht. Sich darüber auch noch aufzuregen, dass das nicht läuft, zeugt von Unwissen über die Intel-Spezifikationen.
Du hast recht, dass Die Boards, die zu hohen RAM Takt ab Werk einstellen, auch ohne das OC angeschaltet wurde Kunden an viel zu hohe Zahlen für 4 Module gewöhnt haben. Aber: mir ist nicht klar ob was Wendell sagt zu 4200 zu dem Screenshot mit 128 GiB passt. Könnten auch andere Systeme sein.
Weiterhin gilt:
1721047561423.png


Wonach mit 14th gen auch 4000 in-Spec ist mit 1R. Die 3600 sind also nicht das Limit für 4 DIMMs für 128 GiB. Aber ja, 4200 wäre oberhalb der Specs für 4 DIMMs.
Was aber die meisten damit noch vergessen, ist dass der 2 Slot schon Geschwindigkeit kostet, selbst wenn nicht genutzt. Und fast jeder Depp geht davon aus, dass 5600 mit 2 DIMMs in-Spec ist, selbst auf Boards mit 4 Slots. Dem ist aber nicht so. Die allermeisten Boards schalten es aber einfach an, auch ohne XMP. Und auch schon auf Alder Lake. Selbst bei 14th gen wäre also das Limit für 2 DIMMs im besten Fall 4400.


BAR86 schrieb:
Es gilt es noch herauszufinden, ob letztlich alle CPUs betroffen sind, oder bei manchen Typen nur einige.
Ist im Video. Wendell sagt das (ich meine) rund 50% der CPUs gar nicht betroffen sind (bis jetzt) und die anderen über die Zeit sichtbar abnehmen.

incurable schrieb:
Das stimmt nicht. Prozessoren funktionieren nicht ohne das passende Ökosystem
Da es aber CPUs gibt, die (bis jetzt) nicht betroffen sind und andere die betroffen sind (mit der Zeit dann stärker), muss es ja aber einen direkten Zusammenhang mit den CPUs geben, die sich physikalisch irgendwo unterscheiden.

peru3232 schrieb:
gibt es nur eine Ursache: zu viel Power.
Im Video thematisiert. Ist nicht der Fall. Betrifft auch CPUs die deutlich unterhalb der Wattzahlen laufen, mit denen Alder Lake bis jetzt keine Probleme gemacht hat.
Weby schrieb:
Diese haben doch eine limitierte TDP ab Werk
Auch im Video thematisiert. Da die Server auch mit niedrigeren TDPs betroffen sind und mit den hohen Fehlerraten, wird das auch diese PCs betreffen.

stefan92x schrieb:
Das können die CPUs auch, aber denen fehlen halt viele übliche Serverfeatures,
Und das wäre? Der Punkt von den W680 Boards ist ja unter anderem das du sogar ECC Support kriegst, mit bestimmten Consumer CPUs. Nur ist es eben unbuffered ECC, weshalb die RAM Latenzen nicht hoch gehen im Vergleich mit dem klassischen buffered ECC Speicher in Servern. Der Ersatz für die alten HEDT Platformen.
 
  • Gefällt mir
Reaktionen: Rockstar85 und JarlBallin
LencoX2 schrieb:
Wie es aussieht, hast du nur 14 Systeme anstatt 500.
Vermutlich sind deine Systeme noch nicht so stark degradiert. In dem Falle steht es noch bevor.
Ich drücke dir die Daumen, dass es anders kommt, als die Karten stehen.

Ganz ehrlich, ich würde es mir wünschen, wenn mal ein System solche Symptome zeigen würde. Keiner im Bekanntenkreis kann das Problem nachstellen. Ich auch nicht. Befreundete Händler auch nicht. Kontakte zu Testredaktionen auch nicht.

Ich habe mal bei einem Großhändler aus Dachau angefragt, ob die Informationen zur RMA herausgeben können. Mal gucken, ob was kommt.
 
Zurück
Oben