News Instabile K-CPUs: Intel Core i9 13. & 14. machen auch im Server große Probleme

StardustOne schrieb:
wo ist also das Problem? Der Schaden wird nur grösser wenn nichts getauscht wird
So lang nicht der Grund für die Probleme bekannt ist, bringt blindes Austauschen gar nichts.
 
  • Gefällt mir
Reaktionen: stevefrogs
Axxid schrieb:
Ich hatte mich jetzt erst einmal gefragt welche Server denn mit K-Prozessoren laufen….
Die Ausfallzahlen sehen ja noch schlimmer aus als gedacht. Wer hätte schon ahnen können, dass man nicht konstant nahezu 300W durch CPUs jagen kann.
Die Systeme sind auf W680 und nicht auf Z690/790. Da gibts idR kein OC, somit liegt die Wahrscheilichkeit sehr hoch, dass die Standard Intel Werte mit 125W/150W Dauerhaft und 253W/288W Peak als Turboboost hinterlegt sind.

Es stellt sich mir im allgemeinen die Frage wieso man auf diese Intel "Server" setzt. Vor allem die letzten Generationen haben gezeigt wie viel Leistung notwendig ist und was im Baseclock über bleibt. P/E Cores haben die Komplexität zunehmend erhöht, denn wenn ich Kunde wäre, dann würde ich mich auf alle Fälle eher auf P Cores freuen als auf E Cores :daumen:
Da kann und sollte ein AMD Zen 3 oder Zen 4 (und in Kürze Zen 5) über Dauer eine kostengünstigere Variante sein und wie man nun erkennt, auch die stabilere Variante aufgrund weniger Support.

Schwierige Zeiten für Intel und evtl. schöne Zeiten für AMD
 
  • Gefällt mir
Reaktionen: Zarlak, floTTes und nyster
Ich weiß von einem Spielehersteller der an die Hoster seines Games nen Brief verfasste daß man wenn möglich auf AMD wechseln soll.
Er hostet auch selbst Server diese wurden alle umgestellt.
 
  • Gefällt mir
Reaktionen: nyster und JarlBallin
Inxession schrieb:
Aber die Stimmen mehren Sich.

Vielleicht auch deshalb, weil man als betroffener nicht direkt von einem Defekt aus geht, wenn das System mal abstürzt?
DAS ist für mich als Enthusiast das große Problem. Jeder Fehler der mir jetzt unterkommt, ein Bluescreen, ein Spielabsturz, whatever. Ich schieb jetzt alles auf die CPU. Find das echt ungeil. Hoffe immer das nicht viele andere so einen Tick haben wie ich, befürchte aber das unter den Techies da einige sind die das ähnlich fühlen ^^
Wenn nicht, gut für euch :D
 
  • Gefällt mir
Reaktionen: Coeckchen, ChrisMK72 und Inxession
emulbetsup schrieb:
Der FDIV-Bug wird in der Regel überbewertet. Vorallem führte der Fehler nicht zu Abstürzen oder machte die PCs langsamer.

Probleme gab es höchstens für Software, die die Genauigkeit brauchte, weil sich hier dann „Rundungsfehler“ summierten.

Der Vergleich zum TLB Bug ist da schon passender, wenn die Vermutungen stimmen, denn dann wird man Takt raus nehmen müssen oder ggf. Sogar per Mikrocode bestimmte „Funktionen“ deaktivieren müssen.

Das würde nämlich dann bedeuten, dass die Kerne eben diese Taktraten nicht mit machen, wie sie angesetzt waren.
 
  • Gefällt mir
Reaktionen: Protogonos, Rockstar85, xXDariusXx und 2 andere
Benj schrieb:
Die sollen sich nicht mit Intel anlegen. Level1techs bieten so ziemlich exklusiv brauchbare KVM-Switches an, die auch für 144 Hz, 4K usw. geeignet sind. Ich brauche die in Zukunft noch. :-D

Aber mein erster Gedanke war: i9 K-Modelle in Servern? Wie passt denn das zusammen?
Gibt Server die brauchen maximale Single Core Leistung bei denen CPUs mit vielen Kernen nutzlos sind.
Deshalb die K-CPUs weil man die Leistung nicht von einem niedrig taktenden Xeon bekommt.
 
  • Gefällt mir
Reaktionen: Rickmer und Benj
TigerNationDE schrieb:
Jeder Fehler der mir jetzt unterkommt, ein Bluescreen, ein Spielabsturz, whatever.
Zumindest bei mir würde das ein seltsamen Fehler mit FF xIV erklären, den ich seit dem nicht mehr habe mit dem 7800X3D.
 
  • Gefällt mir
Reaktionen: Floppes, Alexander2, xXDariusXx und 5 andere
incurable schrieb:
Herstellervorgaben

Diese "Vorgaben" durch Intel waren jahrelang eher Empfehlungen, und Intel gewährte den Partnern explizit und nachweislich maximalen Selbsterachtungsspielraum.
 
  • Gefällt mir
Reaktionen: Alexander2, nyster, LuxSkywalker und 3 andere
Ich frag mich ja ehrlicherweise, ob die sache irgendwas mit der ganzen Sicherheitssache rund um Windows zu tun haben könnte. Kernisolierung und was wir da nicht alles haben. Ich persönlich hab das eh alles aus, aber die meisten werden wohl daran nicht rumfummeln. Nur sone Idee, so tief steck ich nicht in der Materie. Aber wenn die Dinger halt die Leistung von Games beeinflussen, müssen sie ja auch irgendwie permanent CPU Power abgreifen denk

Kommt mir halt so vor als gäbs viele dieser Probleme erst seit diesen ganzen Techniken
 
  • Gefällt mir
Reaktionen: Ruebennase
Dai6oro schrieb:
Mal sehen ob Intel den Fehler überhaupt finden möchte.

Ich bin mir zu 110% sicher, dass mindestens ein Ingenieur bei Intel das Problem und die Ursache seit Monaten oder Jahren kennt und derzeit einen "Told you - Moment" durchlebt.

Derzeit spricht vieles für einen Defekt im Ringbus oder Cachesystem, der sich nicht so einfach beheben lässt. Laut Buildzoid hängt der Bus an der vcore und es könnte sein, dass die Raptorlake p cores in den i9 und i7 CPUs für die 6 ghz singlecore boosts den Bus mit ~1,5v vcore grillen. Schon beim ersten Boot auf einem neuen Board bekommt die CPU 1,5 bis 1,65v im BIOS bevor man überhaupt was einstellen kann. D.h. mit dem ersten Start hat die CPU ggf. direkt einen weg.

Intel traut sich da wohl nicht ran und wills aussitzen, weil das echt ne komplett besch... situation ist. Intel müsste über BIOS updates harte Spannungslimits einführen, was mehrere hundert MHz singlecore boost kostet, das sind mindestens 10% performanceverlust, nachdem man sowieso schon neue powerlimits / Profile eingeführt hat - offenbar als nebelkerze.

es könnte aber auch sein, dass das Problem nur über Zeit oder Siliziumqualität und kaum über Spannung skaliert, dann könnte man die CPUs nur wegschmeißen, wenn sie verbraucht sind.

bleibt spannend, aber Intel ist so leider keine Empfehlung mehr.

Ich hoffe, dass der Fehler nicht auf arrowlake übertragen wurde, aber ich gehe mal nicht davon aus. Das wäre echt ein Skandal in der Entwicklungsabteilung
 
  • Gefällt mir
Reaktionen: Fritzler, Protogonos, Dittsche und 18 andere
Gigaherz schrieb:
Klar kann man das. Nur eben nicht mit 13th und 14th gen desktop lol.
Epycs, Xeons und TR ziehen das ja ohne Probleme durch.
Jepp, allerdings ist die Wattzahl pro mm² Chipfläche von Bedeutung. Die letzt von dir erwähnten Chips haben eine größere Fläche und dadurch weniger Watt pro mm². Bedeutet: Die werden punktuell nicht so heiß.
Es geht hier allerdings um die Alder Lake Dies... und da sind es wohl zuviel Watt pro mm² wenn die bis zum Limit ausgereizt werden, bzw. das Limit für einwandfreie Funktionalität ist dann bereits überschritten.
Auftretende Hot Spots sorgen dafür dass Schaltkreise nicht mehr zuverlässig funktionieren.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Chuzam
yoshi0597 schrieb:
Es stellt sich mir im allgemeinen die Frage wieso man auf diese Intel "Server" setzt. Vor allem die letzten Generationen haben gezeigt wie viel Leistung notwendig ist und was im Baseclock über bleibt. P/E Cores haben die Komplexität zunehmend erhöht, denn wenn ich Kunde wäre, dann würde ich mich auf alle Fälle eher auf P Cores freuen als auf E Cores :daumen:

hätte amd einen 7950x3d mit vcache auf beiden chiplets, würde man wohl die CPUs für gameserver einsetzen. Aber amd will halt nicht.

jetzt wechseln wohl einige auf den 7950x, aber der x3d mit zwei vcached chiplets wäre halt deutlich besser.
 
StardustOne schrieb:
Es gab übrigens mal den Bug im Pentium und da wurden alle Intel Pentium Prozessoren anstandslost ausgetauscht, wo ist also das Problem? Der Schaden wird nur grösser wenn nichts getauscht wird, nämlich der Reputationsschaden.
Der, übrigens vom Mathematiker der den Fehler entdeckt hat für die breite Nutzermasse als nicht relevant für ein Auftreten angesehen hat um eine Austauschaktion zu starten.;)

Beim Raptor Lake Problem bewegt man sich auf einem anderen Level, wenn sich dieser Fehler durch die großen Modelle zieht.
Ich könnte mich aus dem 3DC zitieren, aber die Raptor CPUs sind schnell genug um auch in Zukunft weiter genutzt zu werden. Auch im Gebrauchtmarkt weiterverkauft zu werden, nur zum welchen Preis?
Die zukünftige Software wird selbst fordernder und belastet die CPU stärker. Damit steigt die Wahrscheinlichkeit eines Auftretens des Fehlers einer anscheinend fehlerfreien CPU. UE5 ist bei Entwicklern selbst beliebt und lasse mal für das beliebte Fortnite ein anspruchsvolleres Update kommen und eine vorbelastete CPU mit Fehlern aussteigen.

Das könnte intel härter treffen als die vermarktete AMD Bulldozer Kernaussage, wenn Raptor Lake nicht die verkauften Geschwindigkeiten und damit Leistung erreicht oder die CPU einfach kaputt geht.
 
  • Gefällt mir
Reaktionen: Rockstar85 und floTTes
Benj schrieb:
Aber mein erster Gedanke war: i9 K-Modelle in Servern? Wie passt denn das zusammen?
Es handelt sich halt speziell im Gameserver. Für den Einsatzzweck ist eine möglichst hohe Performance pro Kern nicht ganz unwichtig. Und besonders kritische Systeme sind es auch nicht, so dass man mit Aussetzern im normalen Rahmen durchaus leben kann.
Server-CPUs sind daher nicht unbedingt für Gameserver geeignet, da die in der Regel deutlich niedriger getaktet und damit eine geringere Performance pro Kern haben.

Außerdem sollten auch Desktop-CPUs nicht weniger stabil/zuverlässig sein als die Server-CPUs - zumindest mit Standardparemetern. Denn am Ende sind beides die gleichen Chips, nur mit unterschiedlichen Parametern und evtl. unterschiedliches Binning.
 
  • Gefällt mir
Reaktionen: Baal Netbeck
Da hab ich ja richtig Glück gehabt mit meinen 13900k. OC und UV laufen ohne Probleme. Bei meinen vorherigen system, welches von AMD war, musste ich nen halbes Jahr warten bis ein Treiber rauskam, bei dem das System nichtmehr im idle abstürzt, außerdem war die voreingestellte Spannung bei den turbo Cores zu niedrig. Bei meinem aktuellen System musste ich lediglich 2 Wochen auf ein Biosupdate warten, welches mein XMP Profil unterstützt, ansonsten keine Probleme oder whea Einträge.
P.S. hab keine limits bei Leistung und Stromstärke gesetzt, bzw sind auf den höchsten Wert.
 
Zuletzt bearbeitet:
Ich sehe das Video mittlerweile sehr kritisch. Es fehlen schlicht Nachweise und Informationen, wie letztlich die Server betrieben wurden. Thermisch (Desktop-Gehäuse, Racks?) wie elektrisch. Es wird immer auf niedrige Powerlimits verwiesen. Dabei gibt es keinerlei Nachweise dazu und Intel kannte bis zuletzt selbst nicht genau, was sie denn nun für Powerlimits "empfehlen".

Die genannten Serverbetreiber haben dabei gar keinen direkten Zugriff auf die Systeme. Vermutlich sind die Systeme auch nur angemietet, denn sonst gäbe es diesen Technikerposten gar nicht. Der (externe) Techniker macht alles hardwareseitige und dazu gehört auch das Einstellen der Powerlimits. Ganz nach dem Motto Stille Post: Techniker sagt es dem Serverbetreiber, dieser wiederum sagt es Wendell. Und der uns...

Der beste Nachweis war der Postscreen des Asus-Boards. Im Gespräch mit Gamersnexus hat man sich da noch über den "niedrigen" RAM-Takt von DDR5-4200 lustig gemacht. 128 GB laut Postscreen bedeuten Vollbestückung. Intel-Vorgabe sind DDR5-3600 (!) bei Vollbestückung und damit startet das Board dann auch im Failsafe. DDR5-4200 kann laufen, muss aber nicht. Sich darüber auch noch aufzuregen, dass das nicht läuft, zeugt von Unwissen über die Intel-Spezifikationen.

Schaut man sich die Boards mal genauer an, dann erkennt man eine luftstromoptimierte VRM-Kühlung. Das ist alles kein Problem, wenn da genügend Luft drüber geht. Einen Nachweis dazu gibt es nicht. In Kombination mit einem nicht nachgewiesenen Powerlimit kann es auch sein, dass schlicht die VRM-Kühlung versagt hat.

Mich interessiert die Sache nun aber doch. Habe das im Video genannte Board mal bestellt und hoffe auf ein möglichst altes BIOS. 14900K ist auch unterwegs. Ich bin mal gespannt, was da speziell beim ersten Start an Powerlimits eingestellt wird.
 
  • Gefällt mir
Reaktionen: Raykus, floTTes, gesperrter_User und eine weitere Person
So wie die Sache für mich aussieht ist das das Ergebnis davon wenn ein Chiphersteller die Brechstange nicht nur ansetzt sondern zu viel Kraft anwendet (zu hohe el. Spannung u. zu hohe Taktfrequenz für zu lange Zeit),
dann biegt es sich nicht nur sondern bricht.
Möglicherweise werden die Chips nicht streng genug selektiert und es werden Modelle als Core i9 K verkauft obwohl diese Null Betriebsreserve nach oben haben.
 
  • Gefällt mir
Reaktionen: boypac007
Ist ja nur zu hoffen, dass was sie in der 13. und 14. Gen geändert haben was den Fehler verursacht von der 12. jetzt nicht auch noch auf die 15. mitnehmen, weil das geht dann ganz bös aus.
 
Dai6oro schrieb:
Mal sehen ob Intel den Fehler überhaupt finden möchte.
Du denkst also, Intel möchte einen unbekannten Fehler in ihrer Architektur einfach so drin lassen, der womöglich mehrere Generationen von CPUs durchgeschleift werden würde, bis er durch Zufall irgendwann mal beseitigt wird? Intel arbeitet mit Hochdruck daran, den Fehler zu finden. Wenn sich der Fehler auch in Server CPUs wiederfindet, und dann noch zwei drei Generationen durch, ist Intel am Ende.
 
  • Gefällt mir
Reaktionen: Raykus und floTTes
Zurück
Oben