Single Bit ECC-Fehler & MemTest

Bohnenhans

Captain
Registriert
Okt. 2022
Beiträge
3.100
Hallo auch,

bei einem meiner Server waren im BIOS Eintragungen, dass es einen Single Bit ECC Fehler gab - und zwar nicht nur einen sondern es waren 6 Stück drin verteilt über ~ 2 Monate (letzter vor ~ 2 Wochen)

Die Fehler waren aber nie "am Stück" sondern oft viele Tage dazwischen.

Also MemTest rausgekramt (4.37) und lass das jetzt laufen.

Weiss jemand ob das Single Bit Fehler erkennt - oder weil die ja vom System korrigiert werden, bekommt das davon gar nichts mit?

Oder gibt es da was besseres?

Im BIOS werden die Fehler wohl unabhängig davon erfasst.

System ist eien Xeon E3 1225 V2 auf einem Asus P8B-M (mit IPMI) Ram sind 32 GB DDR3 ECC-1600 unb.
 
Ups ich meinte MemTest86 Sorry :) daber danke für den Hinweis wusste gar nicht dass es das auch ohne 86 gibt xD
 
um genau zu sein gibt es memtest86 von passmark und das klassische memtest86+, das jedoch eine ganze zeit lang nicht weiterentwickelt wurde. 4.37 wäre auch für memtest86+ veraltet, probier da die aktuelle version oder memtest86 (ohne +)
 
ja hab mal die 10.2 geholt - das Mainboard ist halt glaub ~ 10-12 Jahre alt - wusste nicht ob da UEFI Boot geht deshalb einfach meinen "Klassik-Memtest Stick" rausgekramt - tut aber wenn man alle HDD Bootquellen ausschaltet (die sind glaub NON-UEFI installiert) xD

Echt irgendwie komisch dass die Single Bit Fehler nicht permanent sind sondern so doch relativ selten und verteilt, denn glaube ZFS nutzt immer das komplette Ram als Cache wenn man viel hin- und herkopiert.


Na ich lass das jetzt ein paar mal durchlaufen und dann mal schauen was dabei rauskommt.....
 
Zuletzt bearbeitet:
Hmmm bisher hat der MemTest wohl nichts auffälliges gefunden mal sehen wie das weitergeht


Memtest+ wird wohl aiuch wieder weiterntwickelt - die aktuellste Version ist von Dezember 2022

Werde ich danach einfach auch mal testen was soll's xD die 6 Einträge im BIOS waren ja vermutlich keine Zufälle.
 

Anhänge

  • ramtest_1_2.jpg
    ramtest_1_2.jpg
    57,1 KB · Aufrufe: 177
Memtest86 10.2 lief fehlerfrei durch (4 Duchläufe komplett)

Allerdings im Bios war dann folgendes zu sehen

Für ECC RAM scheint MemTest86 also nicht unbedingt immer zu funktionieren - obwohl das SMBIOS gefüllt war mit Meldungen
 

Anhänge

  • errors.jpg
    errors.jpg
    103,6 KB · Aufrufe: 191
  • errors_2.jpg
    errors_2.jpg
    121,8 KB · Aufrufe: 193
Zuletzt bearbeitet:
Der C204 ist zumindest damals bei 1155 Sockel vermutlich der Standardchipsatz bei 1-CPU Xeon basierten Servern gewesen, zwar ne Weile her aber trotzdem..... (die passenden CPUs sind ja bereits 22nm mit PCIE 3.0) also auch nicht sooooo uralt.

Naja muss ich halt was anderes suchern damit ich das evtl per Script ab und zu auslesen kann es ist ja offensichtlich im BIOS gespeichert.

Und so lange bis ich was gefunden habe, mit dem sich das Auslesen lässt halt ab und zu im BIOS nachsehen - hab mal den laut BIOS defekten RAM ersetzt.

Hehe habe bisher halt immer nur mit MEMTest etc gestestet und gedacht och jo die finden das schon, bin da nur zufällig in die SMBios Event logs reingegangen - war ja auch nix Auffälliges im Betrieb, geloggt im BIOS wurden auch immer nur korrigierbare 1 Bit Fehler, andere gab es nicht
 
Zuletzt bearbeitet:
Zurück
Oben