News Instabile K-CPUs: Intel Core i9 13. & 14. machen auch im Server große Probleme

Pokerclock schrieb:
Ich tippe auf Elektromigration, zum Teil Probleme mit dem voreingestellten RAM-Takt und in der Tat keine Veränderungen bei den Default-Settings durch die Serverbetreiber. Warum sollten sie das insbesondere bei den ersten Systemen dieser Art getan haben? Die W680-Boards laufen ähnlich wie die Consumer-Boards. Beim Takt und der Spannung gibt es gar keine Unterschiede. Bei der Stromstärke auch nicht. Alleine der Schnitt bei 253 Watt Gesamtleistungsaufnahme ist bemerkenswert. Das ändert aber nichts daran, dass sich jeder Kern für sich alleine gönnen darf, was er sich auch auf jedem Consumer-Board genehmigen würde. Dieser propagierte Unterschied zwischen W680 und allen anderen S1700-Chipsätzen existiert schlicht nicht.

Für meine Behauptung mit dem RAM-Takt bräuchte man tatsächlich mehr CPUs, um die Güte der Speichercontroller beurteilen zu können. Das Beste, was ich mit meinen 14 Stück (jetzt 15 Stück) 13./14. Gen i9 Systemen bei 128 GB bzw. 192 GB Vollbestückung gesehen habe, war DDR5-4800. Das schlechteste DDR5-4400.

Die Sache mit den Intel Default Settings ist wohl nicht in Wendell's Recherchen mit eingeflossen (BIOS-Versionen waren ab April verfügbar). Wenn ich Zugriff auf diese Masse an CPUs hätte, würde ich natürlich schauen, ob die 307 A PL1/2 253/253W + die sonstigen Intel-Empfehlungen die Lösung sind. Wenn nein, kann man das Thema Elektromigration durch falsche Board-Einstellungen tatsächlich vergessen.
Ich finde es bemerkenswert mit welch einer Dreistigkeit du dir anmaßt über die Kompetenz mehrerer Serverbetreiber und Techniker zu urteilen. Erst hast du selbst festgestellt, dass das Asus Bios standardmäßig eben nicht auf 4.096 W eingestellt ist, dann das die VRM anscheinend doch nicht das Problem sind.

Glaubst du, die Techniker tauschen die CPUs regelmäßig aus Spaß aus?
Es wurde sogar explizit erwähnt, dass die Betreiber ihre CPUs und Ram heruntertakten und trotzdem damit nur das Problem der Instabilität hinauszögern.
Das ist dir einfach vollkommen egal, die Techniker unterschiedlicher Data-Center sind inkompetent und fertig.
Alles klar ;)
 
  • Gefällt mir
Reaktionen: knupanse, MaverickM, Alexander2 und 3 andere
Basshinzu schrieb:
Ich finde es bemerkenswert mit welch einer Dreistigkeit du dir anmaßt über die Kompetenz mehrerer Serverbetreiber und Techniker zu urteilen.

Ich stelle in erster Linie die im Video angemaßte journalistische Tätigkeit infrage. Aussagen nachplappern ist kein Journalismus.

Basshinzu schrieb:
Erst hast du selbst festgestellt, dass das Asus Bios standardmäßig eben nicht auf 4.096 W eingestellt ist, dann das die VRM anscheinend doch nicht das Problem sind.

Korrekt. Das war Sinn der Sache. Hätte mir gewünscht, dass das schon Wendell gemacht hätte. Ich bin mir aber nach wie vor nicht sicher, ob die VRM-Problematik auch für die Supermicro-Boards gilt. Die sind im Vergleich zum Asus noch einmal deutlich abgespeckt.

Basshinzu schrieb:
Es wurde sogar explizit erwähnt, dass die Betreiber ihre CPUs und Ram heruntertakten und trotzdem damit nur das Problem der Instabilität hinauszögern.

Ich lese/sehe nirgends etwas von DDR5-3600. Nur abfällige Bemerkungen zu DDR5-4200 (im GN-Interview) bei Vollbestückung wie langsam das doch sei. Dabei liegt selbst das weit über Intel-Spec.

Basshinzu schrieb:
Das ist dir einfach vollkommen egal, die Techniker unterschiedlicher Data-Center sind inkompetent und fertig.
Alles klar ;)

Sie erwecken für mich allen Anschein. Man beachte den Postscreen im Video und hier im Artikel. Dort, wo verpixelt wurde, steht normalerweise die BIOS-Version (siehe Anhang). Warum hat man das gemacht? Der Verdacht liegt im Raum, dass ein uralt BIOS verwendet wurde. Möglicherweise sogar noch älter als das Release BIOS für den 14900K.

Bei den erwähnten Server-Betreibern kommt mir immer mehr der Verdacht auf, dass das typische Schwerlastregal-Serveranbieter sind. FFM ist keine 30 km von hier entfernt. Ich war schon bei so manchen "Serveranbieter". Man stelle sich eine klimatisierte Lagerhalle vor, mit Reihen aus Schwerlastregalen. Daraufstehend massenweise LC-Power-Gehäuse. Darin billigste Desktop-Technik gekühlt durch einen simplen Gehäuse-Lüfter und einem Boxed-Kühler bzw. etwas Ähnlichem, weil man Tray gekauft hat. Hier kann man schön sehen, was darunter zu verstehen ist:


Das im Video ist dagegen aber noch echtes Gold. Aber immer noch meilenweit von den Hochglanz-Serverzentren wie bei Hetzner entfernt, die hier gedanklich natürlich als Maßstab mitschwimmen.

Quellenschutz schön und gut, aber eine Beschreibung wie genau die Systeme aufgebaut sind, hätte ich erwartet. Aber wenn Wendell von LC-Power-Gehäusen und Schwerlastregalen erzählt hätte, dann wäre die Story von den großen und kompetenten Serveranbietern wohl verpufft.
 

Anhänge

  • Screenshot 2024-07-18 091244.png
    Screenshot 2024-07-18 091244.png
    332,1 KB · Aufrufe: 68
  • Gefällt mir
Reaktionen: //differentRob und xexex
Basshinzu schrieb:
Ich finde es bemerkenswert mit welch einer Dreistigkeit du dir anmaßt über die Kompetenz mehrerer Serverbetreiber und Techniker zu urteilen.
Ach komm! Des ganze Video hätte keinen Schwein interessiert, wenn da nicht was von "Datacenter" und "Servern" aufgetaucht wäre. Dabei kann sich heute jeder Hintz und Kunz so nennen, eine Webseite aufziehen und so tun als wäre da Professionalität dahinter.

Am Ende sitzen da zwei Hansel herum, die Server aus billiger Hardware zusammenschustern und es den Kunden anbieten. Da muss so nicht sein, aber mehr als oft schon so gesehen und so ein Video ist doch kostenlose Werbung, für einen sonst völlig unbekannten Krüschelladen.

Würdest du dahinter einen großen Serveranbieter vermuten?
https://surfplanet.de/

Ich halte mich mit den Details zurück, aber kann dir versichern, das ist soweit davon entfernt wie der Tante Emma Laden um die Ecke, von Rewe oder dem Edeka Konzern.
 
Ach is schon niedlich das hier die Intel Marketing Mitarbeiter hier rein pushen das es nie und nimmer am Prozessor liegen kann... Alle anderen sind unfähig, nur Intel is unfehlbar.


Den gleichen Müll wie mit Nvidias Schmelztiegel-Stecker damals und heute.

Einfach alles auf die Nutzer schieben, dann is man fein raus.
Und wie man sieht, es funktioniert.


Würde AMD so ne Aktion bringen, die würden windelweich gekloppt werden von allen IT Seiten.


Die CPUs fallen aus wie Zähne eines Methheads.
Wir haben selbst schon Laptops als auch die U-series gehabt wo die CPU im Stock Betrieb versagt.

Ganz einfacher Produktionsfehler/Designfehler.
 
  • Gefällt mir
Reaktionen: knupanse, Alexander2 und guru_meditation
Pokerclock schrieb:
...


Das im Video ist dagegen aber noch echtes Gold. Aber immer noch meilenweit von den Hochglanz-Serverzentren wie bei Hetzner entfernt, die hier gedanklich natürlich als Maßstab mitschwimmen.

...

Host-Unlimited hat klein angefangen, sich jedoch über die Jahre verbessert. Hatte dort mal einen Spieleserver für drei Euro gemietet und keine Probleme bemerkt (War mir egal ob dieser abstürzt). Der Aufbau im Schwerlastregal ist fragwürdig, zumindest werden KVM-over-IP Adapter verbunden, wodurch das ganze ansatzweise einem "Desktop PC Server" entspricht. Mich stört der fehlende ECC RAM, würden sogar diverse Budget Mainboards unterstützen.


Mittlerweile kann man passende Hardware sehr günstig kaufen, z. B. das Gigabyte MC12-LE0 ist ein brauchbares Workstation/Serverboard mit IPMI und wird manchmal neu ab 59 Euro angeboten. Die meisten AM4 CPUs unterstützen DDR4 ECC RAM und laufen einwandfrei mit Proxmox und VMware. Mit dem passenden 1U Kühler passt das auch problemlos in ein 19" Gehäuse und kann sauber verbaut werden. Für Privatanwender und kleine Firmen ausreichend, für ein Mini Rechenzentrum sicherlich besser als normale Desktop Mainboards.

AMD Ryzen 7 5800X, 8C/16T, 3.80-4.70GHz 150 Euro <- z. B. auch bei OVH verfügbar
AMD Ryzen 9 5950X, 16C/32T, 3.40-4.90GHz 300 Euro

Intel Xeon E-2414, 4C/4T, 2.60-4.50GHz 250 Euro <- Läuft zumindest stabil 😂


In der oberen Liga nimmt man natürlich hochwertige Serverhardware mit redundanten Netzteilen, da liegt man jedoch schnell bei mindestens 3000 Euro für einen brauchbaren Supermicro Server.

Wer die neuen K-CPUs von Intel kauft und als stabilen 24/7 Server betreiben möchte, hat die Probleme verdient. AMD bringt aktuell neue Pseudo-EPYC Serien heraus welche hohe Singlecore Leistung bieten, ideal für diverse Spieleserver.
 
Selbst wenn die keine dedizierte Serverhardware benutzen: so what? Es geht hier doch vor allem um eine möglichst große Stichprobe mit gleicher Hardwareausstattung, die auch von den Specs gleich und konservativ (spätestens nach dem Auftauchen von den Problemen) betrieben sein sollte, was auf ein generelles Problem der CPU hinweist.
Dieses Rumreiten auf "das ist keine Serverhardware", oder "das kann auch außerhalb der Specs betrieben werden" sind alles Nebelkerzen, die vom eigentlichen Problem, einer wahrscheinlichen Fehlkonstruktion im Chipdesign, speziell dem Ringbus, ablenken soll, weil ... ja keine Ahnung.
Ich verstehe nicht warum hier so mit dieser Vehemenz auf den Messenger, anstatt auf den Verursacher (Intel) eingeprügelt wird. Aber ich hab ja schonmal geschrieben, dass ich generell das Fanboy-sein nicht nachvollziehen kann.
 
  • Gefällt mir
Reaktionen: Rotznase6270, LamaMitHut, Alexander2 und 2 andere
xexex schrieb:
"Datacenter" und "Servern" aufgetaucht wäre.
Blödsinn, mich jedenfalls hat schon das thumbnail abgeholt aus interesse, wie der krimi weitergeht und ganz sicher auch viele andere.
 
  • Gefällt mir
Reaktionen: MaverickM, JarlBallin und guru_meditation
Off-Topic, aber:

crogge schrieb:
z. B. das Gigabyte MC12-LE0

Ehh, schickes Board. Leider nur ein m.2 Slot und nur Gigabit NIC. Gibt es so etwas auch mit zwei m.2 Slots? NIC ließe sich ja leicht nachrüsten.
 
Gamefaq schrieb:
Du ignorierst meine Antwort dazu bzw. was genau dazu im Video gesagt wird?

Nein, ich ging davon aus, dass Beiträge im Thread vorher gelesen werden.

Aber gerne noch einmal mit Transkript aus dem Interview mit GN:

okay some of it
is also down to ddr5 memory speeds and
so some of the machines we've been able
to bring back into stabil
by using ddr5 4200 oh my God

Das "oh my god" stammt im Übrigen von Steve.

Im Umkehrschluss wurde offenkundig sogar ein RAM-Takt bei Vollbestückung (siehe die 128 GB im Postscreen) > DDR5-4200 verwendet. Alles weit außerhalb der Intel-Spec. Man macht sich sogar noch lustig darüber. Dabei sind nicht einmal DDR5-4200 garantiert und abhängig von der Güte des Speichercontrollers. Kann funktionieren, muss aber nicht.

DDR5-4200 ist das, was das Asus-Board auch bei mir automatisch eingestellt hat. Ich muss also davon ausgehen, dass dies auch dort geschah. Wenn nun also sogar noch höhere Frequenzen vorher genutzt wurden, ist der Gedanke nicht weit, dass die sogar XMP aktiviert haben (bei W680 gar kein Problem). Bei Vollbestückung, in einem 24/7 "Server", gegenüber Business-Kunden.

Und dann wird sich beschwert, dass die Systeme nicht stabil laufen? Klar, ist am Ende Intel's Schuld, dass das nicht stabil läuft. Ist ja auch ein Intel-Speichercontroller, der versagt bei Einstellungen, die er laut Intel gar nicht können soll.

Du, von meiner Seite ist das Thema durch. Ich habe nachvollzogen, was ich konnte und so manche Aussage als falsch und/oder nicht verifiziert entlarvt. Trittbrettfahrer-Aktion mit ungeklärten Unzulänglichkeiten im eigenen Server-Betrieb, die der Einfachheit halber alle Intel zugeschoben wurden. Mehr ist da auf YT mit Bezug zur Hardwareebene nicht zu sehen.

Den ewig konzernhassenden Personenkultler wird man nicht zum Umdenken bewegen können. Man kann schon froh sein, wenn keiner von denen anfängt einen im IRL zu canceln, weil man es gewagt hat, die Showmänner auf YT zu hinterfragen. Der Rest kann sich seinen Teil dazu denken.
 
  • Gefällt mir
Reaktionen: Loomes, xexex und //differentRob
MaverickM schrieb:
...

Ehh, schickes Board. Leider nur ein m.2 Slot und nur Gigabit NIC. Gibt es so etwas auch mit zwei m.2 Slots? NIC ließe sich ja leicht nachrüsten.

Leider nicht für den Preis, man erhält jedoch für 15 Euro Dual M.2 PCIe Adapter Karten und 30 Euro Quad M.2 Adapter Karten. Auf dem Gigabyte Board kann man im BIOS "Bifurcation" aktivieren, z. B. x4/x4/x4/x4 für die Quad x16 Adapter. Somit erhält man zum Sparpreis 4x PCIe 4.0 M.2 Slots (Selbst getestet).

Dann verbleibt noch der PCIe 4.0 x4 Slot um z. B. eine 20 Euro 2.5 Gbit LAN-Karte zu nutzen, von der Geschwindigkeit her wäre selbst 2x 10 Gbit mit diesem Slot möglich. Eine Alternative für schnelleres LAN befindet sich am Ende des Beitrags.

TL;DR: Für 50 Euro erhält man vier zusätzliche M.2 x4 PCIe 4.0 Slots und 2.5 Gbit LAN. Der Gesamtpreis liegt damit weiterhin, mehrere hundert Euro unter vergleichbaren Serverboards mit IPMI.


Wer möchte, kann den langsamen Onboard M.2 PCIe 3.0 x1 Slot für diverse Basteleien nutzen, z. B. für eine M.2 2.5 Gbit LAN-Karte oder vier zusätzliche SATA Anschlüsse.
 
  • Gefällt mir
Reaktionen: MaverickM
Pokerclock schrieb:
Nein, ich ging davon aus, dass Beiträge im Thread vorher gelesen werden.
Geht postwendend an dich zurück das Bild des BIOS stammt ursprünglich nicht aus GN Beitrag sondern aus Wendels Video und da hat er es erklärt! Ich habe es dir nochmals geschrieben und du ignorierst das um hier Propaganda über GN und ihr Verschwörung gegen Intel und die Welt für mehr Clicks daraus zu schlussfolgern.

Warst du schonmal auf der Webseite von GN? Weist du das sie diese komplett WERBEFREI halten damit du dort flüssig lesen kannst? Ihr Einnahme Quallen sind Patreon wo du und ich spenden kannst , YouTube Videos und ihr Merch Shop um sich zu finanzieren deswegen sprechen sie das in den Videos so oft an. Aber bitte mach weiter mit deiner Propaganda. Wie immer in der Welt wenn einem die Argumente ausgehen muss der vermeintliche Gegner diskreditiert und die Verschwörung ausgerufen werden. Mehr Fanboy als das geht praktisch nicht mehr.
 
  • Gefällt mir
Reaktionen: eratte und JarlBallin
Gamefaq schrieb:
Geht postwendend an dich zurück das Bild des BIOS stammt ursprünglich nicht aus GN Beitrag sondern aus Wendels Video und da hat er es erklärt!

Das Interview ist eine Zusammenfassung von Wendell's Aussagen im Video garniert mit ein paar Extra-Aussagen wie z.B. zum RAM.

Gamefaq schrieb:
Wie immer in der Welt wenn einem die Argumente ausgehen muss der vermeintliche Gegner diskreditiert und die Verschwörung ausgerufen werden. Mehr Fanboy als das geht praktisch nicht mehr.

Ruhig Brauner. Du schreibst mit jemanden, der gerade seine Dr.-Pepper-Dose auf einem GN-Untersetzer liegen und das Schraubendreher-Set im Handschuhfach liegen hat. Immer schön reflektiert bleiben und nicht so viel persönlich nehmen. ;)
 
Pokerclock schrieb:
Du, von meiner Seite ist das Thema durch. Ich habe nachvollzogen, was ich konnte und so manche Aussage als falsch und/oder nicht verifiziert entlarvt. Trittbrettfahrer-Aktion mit ungeklärten Unzulänglichkeiten im eigenen Server-Betrieb, die der Einfachheit halber alle Intel zugeschoben wurden. Mehr ist da auf YT mit Bezug zur Hardwareebene nicht zu sehen.
Du bist entlarvt. Deine Mutmaßungen sind an Lächerlichkeit schwer zu überbieten. Ebenso denkst du, weil du ein paar Intelsysteme gebaut hast, jetzt kompetenzmäßig über allen anderen stehen zu müssen.
Viel Spaß noch in deiner Bubble
 
Basshinzu schrieb:
Du bist entlarvt. Deine Mutmaßungen sind an Lächerlichkeit schwer zu überbieten.
Wiso entlarvt ? Ich neige dazu seinem Schlussfolgerungen zu folgen aber kannst gerne dein "entlarvt" näher erläutern und mich überzeugen

In meinen Augen wollte er ja nur aufzeigen das diese YouTube , soziale Medien , Internet Bericht Erstattungen von Superlativen lebt und gerne in gewisse punkten zu Übertreibungen neigt .... Mit Klicks ist halt verdammt viel Geld zu generieren
 
Neues Vid von GN mit weiteren Puzzlesteinchen, Ausfallraten und Theorien
 
  • Gefällt mir
Reaktionen: ChrisMK72
Grade das Video geschaut. Die Zahlen die da genannt werden und das nur von einem großen Abnehmer von Intel gehen ja in die Millionen an defekten CPU's aber der Knaller ist wie viele CPU Versionen betroffen sind...von wegen nur i9...Junge Junge das Entwickelt sich zum Super Gau für Intel.

Wie er im Video sagte wie soll man so noch guten Gewissens Intel Empfehlen wenn man nicht weiß wie lange die CPU halten wird?
Wenn Intel nicht bald eine Lösung präsentiert wird sich die nächste Ryzen Generation wie geschnitten Brot verkaufen. Weil es ist doch auch nur noch eine Frage der Zeit bis auch bei den Firmen die Fertig PCs verkaufen die Anweisung von Oben kommt primär Ryzen Systeme zu verkaufen. Denn egal wie gut Intels Ruf war. Die Händler haben doch irgendwann nur die Wahl die Intel Systeme wegen dem erhöhten Support Aufkommen höher zu bepreisen und gleichzeitig weniger zu empfehlen oder direkt zur Sicherheit nur noch AMD anzubieten.

Warum? Es nützt ihnen nichts das sie von Intel die CPU's problemlos ersetzt bekommen obwohl es so viele sind aber die Massiv gestiegene Arbeitszeit (für die Retouren der Kunden die alle getestet /umgebaut/neu versendet werden müssen) des eigenen Kundenserviceteams bezahlt ihnen Intel nicht. Das kostet Geld was alle Anbieter (wie die Server Anbieter die gegen über den Ryzen System in dem anderen Video bei Intel Systemen mal eben 1000% bzw. das 10fache drauf gehauen haben um ihre Intel Support Kosten zu decken) dann im VK bei Intel Konsumenten Fertig Systemen auch draufschlagen werden weil sie es müssen wenn sie nicht Minus machen wollen.... Denn die Preise sind ja so gewählt das man die typischen 0,x bis 1% an Retouren bearbeitet und seine Support Mitarbeiter dafür durch die Verkaufspreise bezahlt bekommt...typische Mischkalkulation halt die nun nicht mehr stimmt und daher angepasst werden muss.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: or2k, Dai6oro, jtr00 und 3 andere
Gamefaq schrieb:
Die Zahlen die da genannt werden und das nur von einem großen Abnehmer von Intel gehen ja in die Millionen an defekten CPU's
selbst wenn die im Idealfall "nur" 10% bei den in Frage kommenden Prozessoren übertrieben sind und es "lediglich 2,5 bis 5%" (also ein viertel bis zur Hälfte der 10%) wären, sind das noch immer 150000 bis 300000 mögliche Problemfälle alleine bei 13th Gen. Prozessoren (die womöglich weniger betroffen sein könnten als 14th Gen, bedenkt man, dass es erst mit der 14th. Gen. wirklich aufgefallen ist?) bei nur einem Anbieter, die ON TOP auf die regulären Hardware Ausfälle drauf kommen.
Das ist nicht wenig
 
Gamefaq schrieb:
Wie immer in der Welt wenn einem die Argumente ausgehen muss der vermeintliche Gegner diskreditiert und die Verschwörung ausgerufen werden.
Lieder ist das so, und leider sind es meist immer die selben die das "anwenden". Und da das keine Forenneulinge sind kann es auch nur Absicht sein. Gerade das diskreditiert ist gängig wenn einen die "Ergebnisse" der Quelle nicht passen.
 
  • Gefällt mir
Reaktionen: JarlBallin
GN macht eine Zusammenfassung der aktuell auf ihrem Tisch liegenden Theorien und Berichte. Das wichtigste, hierbei ist, dass GN (im Gegensatz zu Wendell) ganz klar vorher folgendes sagt:

a good job of covering different aspects of this and we want to be extremely clear and transparent again that we are


in the process of validating the claims we've received that means they are not validated so uh we cannot blindly trust


any one of them it's going to take some time with that said

Das schließt natürlich auch Wendell als Quelle ein. Und der aus ihrer Sicht wahrscheinlichsten Theorie gehen sie nun nach, mit der Beauftragung eines Labors. Dauert aber natürlich.

So wie GN es hier gemacht hat, wird das richtig gemacht und nicht ein halbgares Video mit nachgeplapperten Aussagen vom Schwerlastregal-Serveranbieter. Und dann die Aussage mit "ja wir konnten die Ausfallrate von 50 % auf 25 % reduzieren"... Wunderheilung oder doch mal auf XMP bei Vollbestückung und 500 A verzichtet?

Die Größenordnung des genannten OEM ist eine ganz andere Welt als die 3 (mutmaßlichen) Schwerlastregal-Serverbetreiber.

Auch wenn ich derzeit keinerlei Probleme mit diesen Systemen und CPUs habe, neue werde ich vorerst keine mehr anschaffen. Und wenn ein Kunde diese unbedingt möchte, darf der sich vorher genau diese Berichte angucken, bevor ich ihm ein AMD-System anbiete oder eben gleich den Auftrag ablehne, wenn er das AMD-System nicht möchte.
 
  • Gefällt mir
Reaktionen: or2k und //differentRob
Zurück
Oben