Spontane Reboots Mainboard + NVME und MCE Fehler

Y-Chromosome

Commander
Registriert
Aug. 2008
Beiträge
2.918
Hallo,
nun brauche ich auch einmal Hilfe von euch.
Ich habe mir folg. Komponenten für meine NAS gekauft:
Pentium Gold G5400
Fujitsu D3644-B Mainboard
2x8GB DDR4 2400MHz ECC (laut C246 Liste von Fujitsu)
Pm981 256GB NVME SSD

Das ist im Prinzip ein aufgefrischter c't Server-Bauvorschlag.

System hat auch gleich gebooted (Firmware 1.60 aktuell) und ich konnte sofort von meinem Boot-Stick die Centos8 Netzwerkinstallation starten, die auch durchlief.
Beim ersten hochfahren ist mir folgende Meldung aufgefallen:

Code:
kernel: smpboot: CPU0: Intel(R) Pentium(R) Gold G5400 CPU @ 3.70GHz (family: 0x6, model: 0x9e, stepping: 0xa)
kernel: mce: [Hardware Error]: Machine check events logged
kernel: mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 8: ae00000000801136
kernel: mce: [Hardware Error]: TSC 0 ADDR 8b445140 MISC 47040000086
kernel: mce: [Hardware Error]: PROCESSOR 0:906ea TIME 1581443081 SOCKET 0 APIC 0 microcode b4
kernel: mce: [Hardware Error]: Machine check events logged
kernel: mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 9: ae00000000801136
kernel: mce: [Hardware Error]: TSC 0 ADDR 8b445100 MISC 43040000086
kernel: mce: [Hardware Error]: PROCESSOR 0:906ea TIME 1581443081 SOCKET 0 APIC 0 microcode b4

Nachdem mir Google jetzt nichts wirklich perfekt treffendes geliefert hat, habe ich Fedora 31 getestet mit dem selben Ergebnis.
Das System fährt hoch, doch startet es unter "Belastung" wie cockpit, ssh, und dnf update in unregelmäßigen abständen neu.

Hat vielleicht jemand von euch ähnliche Probleme schon gehabt, bzw. benutzt die Hardware?

Den Speicher habe ich mit memtest 8.3 schon 4h geprügelt und es traten natürlich keine Fehler auf.
Um die CPU auszuschließen (gehe zu 70% von einem CPU-Defekt aus) habe ich mir einen weiteren G5400 bestellt.
 
Welche Kernel Version?
Die Bay Trail CPUs haben einen nervigen Bug, der sowas verursacht. Da gab es dann einen grub parameter der einen bestimmten Energiesparmodus deaktiviert.

Ich weiß aber gerade nicht ob dein Gold dazu gehört.
 
Der G5400 ist ein Coffee-Lake.
Centos8 verwendet Kernel 4.18.x und Fedora 31 den Kernel 5.3.7 (kann ja nicht updaten, aber der sollte aktuell genug sein)
 
Update:
Habe vorgestern noch Fedora 31 auf eine HDD installiert. In dieser Kombination traten die spontanen Reboots nicht auf.
Also habe ich sogleich eine andere SSD bestellt (Samsung 970 Evo Plus) doch leider treten mit dieser ebenfalls die Reboots auf.
Ich warte jetzt noch auf die Ersatz-CPU und sollten die Fehler dann immer noch vorhanden sein, werde ich das Mainboard retourieren, falls euch nichts einfällt.

Update II:
Die Ersatz-CPU ist eben gekommen. Leider ist das Fehlerbild identisch. Kaum starte ich etwas, was die SSD belastet, startet das System neu. Habe testweise auch nochmals anderen Speicher (nicht-ECC DDR4 3200 G.Skill) ausprobiert. Es ändert sich nichts.

Werde jetzt einmal das Board reklamieren. Was anderes fällt mir nicht ein ...

Update III:
Habe jetzt einmal das Netzteil getauscht und siehe da, das System läuft jetzt seit 4h stabil. Der CPU Fehler ist nicht weg, aber scheint wohl keine großen Auswirkungen zu haben, da im Betrieb keine weiteren MCE Fehler im Log auftauchen.
 
Zuletzt bearbeitet:
Zurück
Oben