Supermicro X11SSL-F Pentium G4560 ECC funktioniert nicht

LastChosenOne

Lt. Junior Grade
Registriert
Mai 2014
Beiträge
353
Hallo Zusammen,

ich hab vor kurzem ein Supermicro X11SSL-F, einen Pentium G4560 und 8GB Kingston DDR4 ECC 2400 Arbeitsspeicher gekauft.
Habe auch ein BIOS Update auf die neueste Version (X11SSLF8.523 ) und ein IPMI update gemacht, bekomme ECC aber nicht zum laufen (was aber der Grund für diese Plattform war).
Derzeit hab ich Debian Stretch installiert mit den edac-utils. Habe aber auch schon Ubuntu 18.04.1, memtest86 und memtest86+ ausprobiert und es heißt immer dass ECC deaktiviert ist.

Habe auch schon im Internet gesucht aber nichts gefunden. Habe das Mainboard Handbuch durchsucht aber da steht auch nichts.
Im BIOS gibt es auch keine ECC option.
Ich habe auch schon alle RAM Slots auf dem Mainboard ausprobiert aber machte keinen Unterschied.
z.Z. Habe ich den RAM Riegel im DIMM Slot A1, wobei der laut dem Handbuch im B2 sein sollte.

Die kernel module option "ecc_enable_override=1" habe ich auch getestet aber bringt nichts.

# dmidecode 3.0
Getting SMBIOS data from sysfs.
SMBIOS 3.0 present.

Handle 0x002E, DMI type 16, 23 bytes
Physical Memory Array
Location: System Board Or Motherboard
Use: System Memory
Error Correction Type: Single-bit ECC
Maximum Capacity: 64 GB
Error Information Handle: Not Provided
Number Of Devices: 4

Handle 0x002F, DMI type 17, 40 bytes
Memory Device
Array Handle: 0x002E
Error Information Handle: Not Provided
Total Width: 72 bits
Data Width: 64 bits

Size: 8192 MB
Form Factor: DIMM
Set: None
Locator: DIMMA1
Bank Locator: P0_Node0_Channel0_Dimm0
Type: DDR4
Type Detail: Synchronous
Speed: 2400 MHz
Manufacturer: Kingston
Serial Number: EF1ECFE7
Asset Tag: DIMMA1_AssetTag(18/33)
Part Number: 9965684-005.A00G
Rank: 1
Configured Clock Speed: 2400 MHz
Minimum Voltage: 1.2 V
Maximum Voltage: 1.2 V
Configured Voltage: 1.2 V

Handle 0x0030, DMI type 17, 40 bytes
Memory Device
Array Handle: 0x002E
Error Information Handle: Not Provided
Total Width: Unknown
Data Width: Unknown
Size: No Module Installed
Form Factor: Unknown
Set: None
Locator: DIMMA2
Bank Locator: P0_Node0_Channel0_Dimm1
Type: Unknown
Type Detail: None
Speed: Unknown
Manufacturer: Not Specified
Serial Number: Not Specified
Asset Tag: Not Specified
Part Number: Not Specified
Rank: Unknown
Configured Clock Speed: Unknown
Minimum Voltage: Unknown
Maximum Voltage: Unknown
Configured Voltage: Unknown

Handle 0x0031, DMI type 17, 40 bytes
Memory Device
Array Handle: 0x002E
Error Information Handle: Not Provided
Total Width: Unknown
Data Width: Unknown
Size: No Module Installed
Form Factor: Unknown
Set: None
Locator: DIMMB1
Bank Locator: P0_Node0_Channel1_Dimm0
Type: Unknown
Type Detail: None
Speed: Unknown
Manufacturer: Not Specified
Serial Number: Not Specified
Asset Tag: Not Specified
Part Number: Not Specified
Rank: Unknown
Configured Clock Speed: Unknown
Minimum Voltage: Unknown
Maximum Voltage: Unknown
Configured Voltage: Unknown

Handle 0x0032, DMI type 17, 40 bytes
Memory Device
Array Handle: 0x002E
Error Information Handle: Not Provided
Total Width: Unknown
Data Width: Unknown
Size: No Module Installed
Form Factor: Unknown
Set: None
Locator: DIMMB2
Bank Locator: P0_Node0_Channel1_Dimm1
Type: Unknown
Type Detail: None
Speed: Unknown
Manufacturer: Not Specified
Serial Number: Not Specified
Asset Tag: Not Specified
Part Number: Not Specified
Rank: Unknown
Configured Clock Speed: Unknown
Minimum Voltage: Unknown
Maximum Voltage: Unknown
Configured Voltage: Unknown

# edac-ctl --status
edac-ctl: drivers are loaded.

Irgendwelche Ideen? Mir fällt nichts mehr ein.

Schon einmal Danke im Voraus.
 
Der Speichercontroller sitzt in der CPU. Also musst Du auch eine CPU kaufen, die ECC unterstützt ... das Board alleine reicht nicht. Diese CPU hatte das nicht immer. Ggf. kann die das noch nicht.
 
Wenns da doch steht --- verwundert mich, dass neuerdings normale Pentiums ECC können sollen.
Unbuffered scheint ja auch richtig zu sein.
 
Habe mich grad eben nochmal schlau gemacht. Ja der G4560 kann das JETZT, konnte dies aber nicht von Anfang an. Anscheinend ist er aber von Anfang an grundsätzlich dazu fähig gewesen, muß aber per Microcode also sprich BIOS unterstützt werden. Das hat Intel erst später implementiert.

Stellt sich also die Frage ob das BIOS des Boards in Verbindung mit der CPU grundsätzlich dazu fähig ist. Zum anderen steht der verwendete Speicher nicht auf der (allerdings ziemlich mageren) Kompatibilitätsliste. Das kann natürlich auch sein, dass sich Speicher und Board nicht so recht mögen. 100% Sicherheit gibt es da halt leider nie.
 
Den hier habe ich bestellt.
bzw. diese Konfiguration hier, nur anderes Gehäuse und anderer CPU Kühler.

So funktioniert das System ja ohne Probleme, nur wenn ich mir schon ein 180€ teures Mainboard hole für ECC dann sollte es auch funktionieren.
 
Genau, eigentlich sollte ECC aktiviert sein aber warum wird es nirgendwo erkannt? Selbst wenn Debian alte Pakete hätte sollte es bei Ubuntu doch erkannt werden?
Eigentlich sollten dann auch mehr Infos im boot log sein aber bei mir ist hald garnichts.

Und selbst wenn es aktiviert ist bleibt die Frage ob Fehler nur erkannt werden oder auch behoben? :S

Update: Habe vorhin den Support von Supermicro angeschrieben und ihnen das Problem erklärt.
Die Lösung: Einen RAM Riegel benutzen der in der Kompatibilitätsliste des Mainboards steht....

Update 2:
Es gibt ein kleines Programm das dir die Rohdaten ausliest von /dev/mem.
According to Intel's datasheet:
0: ECC disabled
1: ECC is active in I/O; ECC logic is not active In this case.
2: ECC is disabled in I/O, but ECC logic is enabled.
3: ECC active in both I/O and ECC logic

# ./test
5004-5007h: 0 0 0 0
5008-500Bh: 11 31 0 0

Sieht hier genauso aus als wäre ECC deaktiviert.

Update 3:
Habe es wie hier beschrieben mal versucht.
Habe einen USB Stick mit einem Windows10 1803 boot medium erstellt und gestartet, bin dann in die Systemreparaturoptionen gegangen. Von dort aus cmd geöffnet und "wmic memphysical get memoryerrorcorrection" eingetippt.
Habe dann eine "5" zurück bekommen das heißt, dass single bit ECC funktioniert.
Value Meaning
0 (0x0) Reserved

1 (0x1) Other

2 (0x2) Unknown

3 (0x3) None

4 (0x4) Parity

5 (0x5) Single-bit ECC

6 (0x6) Multi-bit ECC

7 (0x7) CRC

Vielen Dank an alle. =)
 
Zuletzt bearbeitet:
Zurück
Oben