News Instabile K-CPUs: Intel Core i9 13. & 14. machen auch im Server große Probleme

6kbyte schrieb:
müssen sie fast schon schweigen, weil viel zu viel (Geld) dabei auf dem Spiel steht.
Zu sagen: joa keine Ahnung was da los ist, das kostet noch viel mehr. Denn das Vertrauen in alle Generationen schwindet dahin. Besonders im Serverbereich eine Katastrophe.
Und wenn es an die Mainboard Hersteller oder Server Hersteller gemeldet werden würde um zu sagen: hey Leute, keine Panik, haben es gefixt und rennt, dann würde es davon ein Leak geben.

Das als Naivität abzustempeln, ja kann man machen. Ich habe genug mit großen Firmen und Unternehmen zu tun gehabt, bei allen lief es komplett anders.

Meines Erachtens kommt sowas immer von Leuten, die in dem Bereich nie gearbeitet haben. Kann mich ja auch irren, aber meist ist es eben so.
 
stefan92x schrieb:
Ich würde es eher so sehen: Wenn Intel wüsste, wie das Problem zu lösen ist, würden sie es kommunizieren. Aber vielleicht sehen sie halt auch unterm Mikroskop zwar wunderbar das Fehlerbild, aber haben eben (noch?) keine gute Lösung. Dann wären wir im Graubereich der Abwägung, was man wie weit gehend kommuniziert.
Grade das schafft aber im Hinblick auf die nächste Intel Generation ein Problem weil für alle die die vorhaben diese zu kaufen ist das nun eine Gewissensfrage weil sie nicht wissen ob sie das Problem vererbt bekommen werden und nun kommt Ende des Monats AMD's nächste Generation was bei nicht reinen Intel Fanboys die Entscheidung die nächste Intel Generation zum Upgrade oder generellen Neukauf eines kompletten PC's zu nutzen nun direkt zu AMD treiben wird.

Klar sind wir hier in den Foren eine Minderheit und die Konsumenten Verkäufe von Intel werden trotzdem gut sein weil ein DAU liest in der Regel nicht hier und kauft weiterhin das was er Jahrelang hatte, wieder. Trotzdem denke ich wird sich das in den Zahlen bei Intel spürbar bemerkbar machen (insbesondere wenn die nächste Generation wirklich kommt und Intel bis dahin noch keine Erklärung & Lösung dafür hat, weil aktuell geht man von Dezember aber nur in kleinen Dosen aus das Intel auch liefern kann!) und was Firmen angeht wird das so richtig Übel werden wenn sie jetzt schon hinter vorgehaltener Hand die Kunden zum Ryzen Systemen lenken.
 
  • Gefällt mir
Reaktionen: Rockstar85 und JarlBallin
Donnidonis schrieb:
Ich behaupte mal, Intel ist in ihren Foundries sehr viel besser mit Test Equipment Ausgestattet, als ein Youtuber.
Ich gehe auch mal sehr stark davon aus, dass die Chiphersteller entsprechend umfangreich ausgestattete Testlabore inkl. passendem Personal hat. Ohne das könnte man moderne CPUs vermutlich auch gar nicht herstellen.

GN hatte vor gut einer Woche gerade ein Video mit einer Tour durch die Testabteilung und Labore von AMD, wo man sehr gut sieht, was da an Equipment und Analysemöglichkeiten vorhanden ist.

 
  • Gefällt mir
Reaktionen: JarlBallin und squadric
mibbio schrieb:
Ich gehe auch mal sehr stark davon aus, dass die Chiphersteller entsprechend umfangreich ausgestattete Testlabore inkl. passendem Personal hat.
Davon MUSS man ausgehen. AMD wird es nicht haben, brauchen die ja auch in dem Umfang nicht, denn die haben keine Fertigung. Zu behaupten Intel hätte es nicht und wäre zu blöd das zeig zu bedienen, zeigt mir einfach mir, dass die Leute wohl nie auch mir eine Sekunde in solchen Bereichen gearbeitet haben und einfach nur gegen jemanden schießen wollen.

Aber so ist es heutzutage eben. Das ist das, was die Leute hören lesen und sagen wollen. Ist halt besser als faktenbasiert zu arbeiten.
 
  • Gefällt mir
Reaktionen: JarlBallin
Donnidonis schrieb:
Zu behaupten Intel hätte es nicht und wäre zu blöd das zeig zu bedienen, zeigt mir einfach

Bin mir sehr sicher, dass der Beitrag Sarkastisch gemeint war, und Du es nur überlesen hast...
 
Der Nachbar schrieb:
Das hätte AMD völlig bloss gestellt, wenn man das nicht in den Griff bekommen hätte, nachdem AMD genau selbst sehen konnte im welchen Bereich die CPU durch war und auch welche steuernde Softwarekomponente dafür verantwortlich sein könnte. Die Fehlermöglichkeiten wurden von mehreren Tech Youtubern durchgegangen.
Und woher willst du wissen, ob AMD in der Richtung nicht auch schon selbst Analysen angestellt hat und GN einfach nur schneller war? Den die Technik, das so im Detail zu untersuchen, hat auch AMD, wie das von mir verlinkte Video von GN und deren Besuch in den Testabteilungen/Laboren von AMD zeigt.
 
MaverickM schrieb:
Bin mir sehr sicher, dass der Beitrag Sarkastisch gemeint war, und Du es nur überlesen hast...
Bin mir sehr sicher, dass er es nicht war. Die anderen Beiträge zeigen doch deutlich, wie der User drauf ist.
 
mibbio schrieb:
Und woher willst du wissen, ob AMD in der Richtung nicht auch schon selbst Analysen angestellt hat und GN einfach nur schneller war?
Er schrieb "hätte". Denn AMD hat sich ja nicht blamiert, sondern kam eben selbst auch schnell mit der Erklärung und Lösung an.
 
  • Gefällt mir
Reaktionen: JarlBallin
6kbyte schrieb:
Solange das nicht der Fall ist, müssen sie fast schon schweigen, weil viel zu viel (Geld) dabei auf dem Spiel steht.
sollte jemals raus kommen, dass Intel wusste, woran es liegt, aber nichts unternommen hat um das Problem zu beheben, oder zumindest sowas wie "wir haben zum jetzigen Zeitpunkt keine Lösung um das Problem nachhaltig zu beheben. Wenn das Problem bei ihnen auftritt, bitte unter folgender E-Mail Adresse melden, damit wir die nächste gleichwertige CPU verschicken können. Alternativ bieten wir bei vorliegenden Kaufbelegen den Rückkauf der CPU plus eine kleine Entschädigung für das wegen unserer CPU dann unnutze Mainboard an (hierfür ist es erforderlich, dass das Board eingeschickt wird). Dieses Angebot ist Zeit X / maximal 24 Monate gültig. Wer sich einmalig für eine Ersatz CPU entscheidet, verzichtet auf die Möglichkeit des Rückkauf der CPU und die Entschädigung für das Mainboard zu einem späteren Zeitpunkt." zu sagen, kann es für Intel noch viel viel teurer kommen, US Zivilrecht und vor allem in erster Linie über Nacht zerstörtes Kundenvertrauen (ist die nächste Generation auch davon Betroffen? was ist mit der danach?) für eine sehr sehr lange Zeit (vor allem im B2B) sei dank.

Nicht vergessen, solche Scheiße passiert, jedem! Die Frage ist einzig, wie er damit umgeht. Informationen bewusst zurückzuhalten oder gar zu lügen, ist der beste Weg um den Karren tatsächlich in den Dreck zu setzen.
 
  • Gefällt mir
Reaktionen: Tanzmusikus
Gut, dann geselle ich mich mal zu den Intel-Fanboys. Das war ein recht aufregender Test dieses Boards.

https://www.asus.com/de/motherboard.../helpdesk_bios?model2Name=Pro-WS-W680M-ACE-SE

Produktion 12/2023. Es war das 14. Gen Release BIOS 2208 installiert. Ich habe nicht mehr gemacht als die Defaultsettings zu laden. Tja: iccMAX 500 A. PL1/PL2 253 Watt. PL1 hat sich dann wiederum verringert über eine aktivierte "Auto" Zusatzoption "Motherboard Capability" auf nur noch 175 Watt laut HWinfo.

Von 125 Watt habe ich nie etwas heute gesehen. Also, wer da auch immer alles von 125 W bei W680 ist Standard philosophiert hat, kompletter Blödsinn.

Die Tatsache, dass das Board 500 A zulässt, lässt mich jeden Kommentar anzweifeln, der Elektromigration durch falsche bzw. zu hohe Mainboardeinstellungen als mögliche Ursache für die CPU-Ausfälle negiert. Oder anders ausgedrückt - auch weil im YT-Video die notwendigen Zusatzinformationen fehlen - die (vermutlich einfach nur wiederholten) Aussagen von Wendell bzw. den Serverbetreibern kann ich so nicht ernst nehmen. Punkt. Wenn die Aussagen zu den Powerlimits schon zwischen falsch und schwammig schwanken, wer sagt mir das der ganze Rest zu den hardwarerelevanten Aussagen richtig sind?

Die VRM-Kühlung kam im offenen Aufbau hervorragend mit allem zurecht. Leider konnte genau der VRM-Sensor nicht mit den bekannten Tools ausgelesen werden. Nur im BIOS selbst. Ich denke aber, dass die VRM-Kühlung bis 253 Watt funktionieren wird bei guter und direkter (!) Belüftung. Zwischenzeitlich habe ich 1,528 Volt auf den Kernen gesehen. Na, ob das gesund ist, auf Dauer?

Wie sich später herausstellte, waren auch 280 Watt konstant drin, denn:

BIOS-Update auf die Version 3602 brachte Intel Default Settings, die Standard aktiviert waren: 307 A, PL1 253 Watt PL 2 253 Watt. Dieses Mal waren es echte 253 Watt, denn die wundersame Grenze von 175 Watt bei PL1 war plötzlich verschwunden. Noch mehr Leistung und Hitze als vorher. Cool! Also wer auf Besserung nach dem BIOS-Update hoffte, wurde hier bedauerlicherweise enttäuscht.

Ganz neu war die Option eines Asus OC Profils. Ja korrekt. Das Workstation- aka Serverboard bekam ein echtes OC-Profil. Wer das aktivierte, bekam erst einmal eine eindringliche Warnung vor verringerter Lebensdauer und Stabilität. Und was wurde eingestellt? 511,75 A PL1 175W (dieses Mal echte) PL2 253W. Richtig gutes Feature. Durch das geringe PL1 war der effektive Kerntakt langsamer als mit den Intel Default Settings (253 Watt). Toll! Doch woher kennen wir diese Settings? Richtig, das sind die Settings der älteren BIOS-Versionen. Was vorher Standard war, ist nun "Lebensdauer- und Stabilitätsverringernd". Schwarz auf weiß bzw. grau auf blau. Vom Mainboardhersteller verbrieft.

Die ganz Harten konnten auch 4095 Watt PL1/PL2 einstellen. Hat da noch wer behauptet, das geht überhaupt nicht mit den Boards? Falsch! In der Spitze 336 Watt herausgepresst, mit 40 €-Luftkühlung. Im Durchschnitt 280 Watt...

Ich stelle den Verdacht in den Raum, dass die angesprochenen Serveranbieter teilweise oder ganz von Anfang an die zerstörerischen Default-Powersettings nutzten und sich so - wie alle betroffenen Consumer auch - ihre CPUs gehimmelt haben. Bei 24/7-Betrieb kann das durchaus schnell gehen. Wendell hätte es gut getan einfach mal ein eines der betroffenen Boards zu nehmen und sich selbst ein Bild zu machen, ob die Aussagen der Serveranbieter so plausibel sein können. Er hätte das gesehen, was ich gesehen hätte und hätte mindestens noch einmal nachfragen müssen. Hat er leider nicht getan.

it's actually useful w680 was created to
go along with motherboards designed for
maximum stability neither Asus nor super
micro motherboards really support giving
tons of extra power to the CPU or doing
insane overclocking for things on a
desktop so I really don't think both
Asus and super micro have colored really
far outside the lines on this
motherboard and I really don't think
Super Micro or Asus have just lazily
copy paste the voltage settings from
their desktop motherboards to the server
class motherboard boards

1zu1 aus dem YT-Transkript kopiert. Diese Aussage ist falsch und das konnte ich schlicht durch die Inbetriebnahme des im Video gezeigten Asus-Boards widerlegen. Daran sieht man sehr gut, dass er die Aussagen der Server-Betreiber nur wiedergibt, aber nichts persönlich verifiziert hat.

Was ich mir von Wendell wünsche würde, wäre ein Recap bei den Serveranbietern in Bezug auf neue Systeme, die ausschließlich mit den neuen BIOS-Versionen genutzt wurden. Wird vermutlich nicht passieren. Aber hey, ich hatte meinen Spaß.

Das Testsystem liegt noch auf dem Workbench und macht gerade RAM-Tests. Scheine Glück gehabt zu haben 4x 16 GB laufen mit DDR5-5600. Wer noch etwas getestet haben möchte, einfach melden!
 
  • Gefällt mir
Reaktionen: Besterino, xexex, amico81 und 2 andere
Schön, das du das alles herausgefunden hast und so für das Board ein paar sachen klarstellen kannst.

Am ende Spielt es keine rolle, alles in spec, alles was du eingestellt hast. von manueller Spannungs und Taktanpassung hab ich ja nichts gelesen? Oder habe ich das überlesen?
 
Pokerclock schrieb:
Ich find das ja grundsätzlich cool, dass du das austestest, nur erschließt sich mir die Übertragbarkeit auf die Aussage zu der großen Stichprobe bei den Datencentern nicht.
Du hast selbst vermutet, dass er die Aussage der Serveranbieter einfach wiedergibt. Das würde bedeuten, dass diese die CPU mit niedrigem Powerlimit betreiben, wie sie behaupten, keine Ahnung haben wie man eine Motherboard konfiguriert, was bei einem professionellen Anbieter eher unwahrscheinlich ist, oder ihn absichtlich anlügen, was ich nicht nachvollziehen kann, da es dafür kein Motiv gibt.
Was ist es denn deiner Meinung?
 
guru_meditation schrieb:
Was ist es denn deiner Meinung?

Ich tippe auf Elektromigration, zum Teil Probleme mit dem voreingestellten RAM-Takt und in der Tat keine Veränderungen bei den Default-Settings durch die Serverbetreiber. Warum sollten sie das insbesondere bei den ersten Systemen dieser Art getan haben? Die W680-Boards laufen ähnlich wie die Consumer-Boards. Beim Takt und der Spannung gibt es gar keine Unterschiede. Bei der Stromstärke auch nicht. Alleine der Schnitt bei 253 Watt Gesamtleistungsaufnahme ist bemerkenswert. Das ändert aber nichts daran, dass sich jeder Kern für sich alleine gönnen darf, was er sich auch auf jedem Consumer-Board genehmigen würde. Dieser propagierte Unterschied zwischen W680 und allen anderen S1700-Chipsätzen existiert schlicht nicht.

Für meine Behauptung mit dem RAM-Takt bräuchte man tatsächlich mehr CPUs, um die Güte der Speichercontroller beurteilen zu können. Das Beste, was ich mit meinen 14 Stück (jetzt 15 Stück) 13./14. Gen i9 Systemen bei 128 GB bzw. 192 GB Vollbestückung gesehen habe, war DDR5-4800. Das schlechteste DDR5-4400.

Die Sache mit den Intel Default Settings ist wohl nicht in Wendell's Recherchen mit eingeflossen (BIOS-Versionen waren ab April verfügbar). Wenn ich Zugriff auf diese Masse an CPUs hätte, würde ich natürlich schauen, ob die 307 A PL1/2 253/253W + die sonstigen Intel-Empfehlungen die Lösung sind. Wenn nein, kann man das Thema Elektromigration durch falsche Board-Einstellungen tatsächlich vergessen.
 
Sam Miles schrieb:
Wie meinst du das? Wenn du den Laptop zuklappst oder am Desktop die "Mond" Taste drückst, geht der nicht in den Schlafmodus?

Der "Modern Standby" ist eine neue bzw. überarbeitete Variante. Das Verhalten ist ähnlich, jedoch nicht identisch. Leider funktioniert dieser bei 9/10 Laptops mit den neuen Intel CPUs nicht richtig (Daran ist auch Microsoft schuld), einfach mal danach googeln. Die 10. Generation nutzt noch die zuverlässige, klassische Variante.

Meistens wachen die Geräte in der Tasche auf, obwohl alle Timer und externen Geräte abgeschaltet sind. Außerdem kommt es häufig vor das Gerät mit schwarzem Bildschirm starten und die Lüfter stundenlang mit 100% laufen bis man das ganze bemerkt. Worst-case: Laptop überhitzt.

Lösung: Ruhezustand (Suspend to Disk) -> Aufwachen dauert circa 10-20 Sekunden

https://www.makeuseof.com/windows-modern-standby-flaws/

 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Sam Miles
guru_meditation schrieb:
was ich nicht nachvollziehen kann, da es dafür kein Motiv gibt.
Du suchst nach Motiven? Echt? Nicht nachvollziehbare oder gar falsche Aussagen zu einem bekannten Problem in bare Münzen zu wandeln, ist für dich kein Motiv? Alleine dieses von @Pokerclock zitierte Teil spricht Bände, welche unterirdischer Blödsinn in Videos heutzutage verbreitet wird.
I really don't think
Super Micro or Asus have just lazily
copy paste the voltage settings from
their desktop motherboards to the server
class motherboard boards
Würde mir jemand sowas sagen, egal in welchen Kontext, würde ich den auf der Stelle auslachen, denn scheinbar hat er noch nie ein Supermicro oder ASUS "Servermainboard" aus der Nähe gesehen.
 
Zuletzt bearbeitet:
Das von Wendell bezeichnete"server class motherboard" ist dabei nicht einmal eines und wird nicht einmal von Asus so beworben. Das einzige, was da Server ist, ist der Management-Port. Selbst die für Racks luftkanaloptimierte Anordnung hat Asus vergeigt. Denn genau da haben sie bei dem Board die fette ATX-Buchse hingeballert. Garantiert luftstromoptimiert!!!111elf

Um das zu erfahren, hätte man nicht einmal das Board kaufen müssen. Das Ansehen der Produktbilder der Verpackung hätte genügt. Aber selbst dafür hat's dann nicht mehr gereicht.
 
xexex schrieb:
Würde mir jemand sowas sagen, egal in welchen Kontext, würde ich den auf der Stelle auslachen

Und was genau ist da jetzt deiner Meinung nach zum "auslachen"?
 
Pokerclock schrieb:
Gut, dann geselle ich mich mal zu den Intel-Fanboys.
Das war mir und anderen sicher auch schon die ganze Zeit klar sonnst würdest du nicht so viel hier herum spekulieren.
Pokerclock schrieb:
Ich stelle den Verdacht in den Raum, dass die angesprochenen Serveranbieter teilweise oder ganz von Anfang an die zerstörerischen Default-Powersettings nutzten und sich so - wie alle betroffenen Consumer auch - ihre CPUs gehimmelt haben. Bei 24/7-Betrieb kann das durchaus schnell gehen.
Das kann sogar stimmen. Nur glaubst du das sie das nachdem die CPU's in Sharen Probleme machen dies weiter tun und nicht dann nachdem es paar mal aufgetreten ist , die Einstellungen im Bios anpassen bzw. austesten was passiert wenn sie sogar Manuell die Einstellungen zurück fahren? Das was Wendel da wiedergibt ist ja der Status Quo JETZT und nicht wie es mal war als die ersten CPU's getauscht wurden. Für mich hat das was er dort aussagt weiterhin Bestand. Du aber unterstellt den Firmen dauerhafte Unfähigkeit nachdem sie nachweisen konnten das egal was sie einstellen die CPU's trotzdem Probleme verursachen. Womit wir bei deinem Ersten Satz des Fanboys wären... Alles abstreiten und in Frage stellen weil es kann ja nicht so sein. Die Frage ist nur warum machst du das? Um Intel in Schutz zu nehmen? Die CPU's haben erwiesener maßen Probleme. Und auch diese Board sind immer EGAL WAS IM BIOS "Ab Werk" MAL EINGESTELLT WAR "in Spec". Also wessen Schuld ist das?
 
  • Gefällt mir
Reaktionen: Alexander2, guru_meditation und JarlBallin
MaverickM schrieb:
Und was genau ist da jetzt deiner Meinung nach zum "auslachen"?
"Denken" hat nichts mit Journalismus zu tun, vor allem wenn man ein heikles Thema anspricht und mit seinen Vermutungen völlig daneben liegt. ASUS oder Supermicro sind kein HP, Dell oder Fujitsu, wo du froh bist im UEFI die Bootreihenfolge einstellen zu können, sondern erlauben dir genau das alles einzustellen was du auch bei einem Desktopboard einstellen könntest. Das ist unterstes Stammtischniveau, ich hörte, ich glaube, ich weiß es zwar nicht, aber es könnte ja....

Nicht falsch verstehen an dieser Stelle, ich halte von Supermicro durchaus einiges, sie bauen Mainboards in alles Formaten für die ungewöhnlichsten Nischenanwendungen und lassen eben zu, jeden kleinsten Fitzel konfigurieren zu können. Auch ASUS hatte ich in einigen kleinen Projekten verbaut gehabt, eben für irgendwelche Spielereien, wo ein "richtiger" Server nicht infrage kam.

Nur zu behaupten es seien "Server Grade Mainboards", wo die Hersteller es nicht zulassen unsinnige Werte zu konfigurieren, ist schlichtweg Blödsinn. Die Boards haben durchaus Features die man für einen Server benötigt und mögen vielleicht nicht bei ersten Start die größte OC Keule rausholen ohne genaue Informationen was, wer und wann konfiguriert hat, sind solche Behauptung völlig haltlos.
 
Zuletzt bearbeitet:
Zurück
Oben