jemandanders
Commander
- Registriert
- Mai 2019
- Beiträge
- 2.978
Hallo
Ich möchte die ECC Funktion des Arbeitsspeichers und des Mainboards überprüfen.
Bzw die Meldung an das Betriebssystem ob Fehler auftreten und korrigiert werden.
Hintergrund ist schlicht, das ich frühzeitig Bescheid wissen möchte, wenn Fehler auftreten.
Vorgegangen bin ich wie bei Hardware Canucks beschrieben
https://hardwarecanucks.com/cpu-motherboard/ecc-memory-amds-ryzen-deep-dive/5/
Ich komme aber mit den Optionen von stress-ng nicht so wirklich klar. Es sind einfach zu viele und mir ist nicht ganz klar wie ich mit welchen Optionen den Speiche mal so richtig unter Druck setzen kann, damit "endlich" mal Fehler auftreten und ich die Dokumentation der ECC Funktion überprüfen kann.
Ich brauche also passende Parameter hierfür, oder eine andere Methode.
Ich habe mal ein bisschen herumgesucht und das hier gefunden
https://stackoverflow.com/questions/45317515/stress-ng-ram-testing-commands
Die vorgeschlagene Befehlszeile habe ich schon etwas abgeändert
@X570-I:~$ stress-ng --vm 19 --vm-bytes 95% --vm-method rowhammer --verify -t 10m -v
Ergebnis ist immer:
1@X570-I:~$ edac-util --v
mc0: 0 Uncorrected Errors with no DIMM info
mc0: 0 Corrected Errors with no DIMM info
edac-util: No errors to report.
dmesg gibt folgendes aus:
Die Option rowhammer, welche für mich ja nicht schlecht wäre bringt scheinbar auch nix.
Ich habe meinen Speicher Undervoltet und die Timings sind auch schon so langsam jenseits von Gut und Böse. (15 - 15 - 15) bei 1,1V.
Es werden bis jetzt aber keine Fehler dokumentiert. Eigentlich sollte man doch erwarten, das dann so langsam Fehler auftreten, welche dann auch dokumentiert werden..
Speicher ist der Kingston KSM26ED6/16ME zusammen mit Ryzen 3700x auf Asus Pro WS X570-ACE
Wenn AMD die ECC Funktion nicht richtig implementiert haben sollte, wäre das natürlich auch möglich.
Ich hatte jedoch vor dem Kauf extra bei Asus nachgefragt und diese nochmals bei AMD in Taiwan. Die Auskunft war, das die aktuellen Ryzen 3000 Desktop CPUs die Speicherkorrektur implementiert haben. Nur halt ohne Verifikation. Die normalen APUs dagegen nicht.
Ich hätte ja auch eine Pro CPU gekauft. Nur wo???
Ich bin vorerst mit meinem Latein am Ende und hoffe auf gute Ratschläge.
Ich möchte die ECC Funktion des Arbeitsspeichers und des Mainboards überprüfen.
Bzw die Meldung an das Betriebssystem ob Fehler auftreten und korrigiert werden.
Hintergrund ist schlicht, das ich frühzeitig Bescheid wissen möchte, wenn Fehler auftreten.
Vorgegangen bin ich wie bei Hardware Canucks beschrieben
https://hardwarecanucks.com/cpu-motherboard/ecc-memory-amds-ryzen-deep-dive/5/
Ich komme aber mit den Optionen von stress-ng nicht so wirklich klar. Es sind einfach zu viele und mir ist nicht ganz klar wie ich mit welchen Optionen den Speiche mal so richtig unter Druck setzen kann, damit "endlich" mal Fehler auftreten und ich die Dokumentation der ECC Funktion überprüfen kann.
Ich brauche also passende Parameter hierfür, oder eine andere Methode.
Ich habe mal ein bisschen herumgesucht und das hier gefunden
https://stackoverflow.com/questions/45317515/stress-ng-ram-testing-commands
Die vorgeschlagene Befehlszeile habe ich schon etwas abgeändert
@X570-I:~$ stress-ng --vm 19 --vm-bytes 95% --vm-method rowhammer --verify -t 10m -v
Ergebnis ist immer:
1@X570-I:~$ edac-util --v
mc0: 0 Uncorrected Errors with no DIMM info
mc0: 0 Corrected Errors with no DIMM info
edac-util: No errors to report.
dmesg gibt folgendes aus:
[ 4.897321] EDAC amd64: Node 0: DRAM ECC enabled.
[ 4.897323] EDAC amd64: F17h_M70h detected (node 0).
[ 4.897357] EDAC MC: UMC0 chip selects:
[ 4.897358] EDAC amd64: MC: 0: 0MB 1: 0MB
[ 4.897359] EDAC amd64: MC: 2: 8192MB 3: 8192MB
[ 4.897362] EDAC MC: UMC1 chip selects:
[ 4.897362] EDAC amd64: MC: 0: 0MB 1: 0MB
[ 4.897363] EDAC amd64: MC: 2: 8192MB 3: 8192MB
[ 4.897364] EDAC amd64: using x8 syndromes.
[ 4.897364] EDAC amd64: MCT channel count: 2
[ 4.897413] EDAC MC0: Giving out device to module amd64_edac controller F17h_M70h: DEV 0000:00:18.3 (INTERRUPT)
[ 4.897420] EDAC PCI0: Giving out device to module amd64_edac controller EDAC PCI controller: DEV 0000:00:18.0 (POLLED)
[ 4.897421] AMD64 EDAC driver v3.5.0
Die Option rowhammer, welche für mich ja nicht schlecht wäre bringt scheinbar auch nix.
rowhammer
try to force memory corruption using the
rowhammer memory stressor. This fetchestwo 32 bit integers from memory andforces a cache flush on the twoaddresses multiple times. This has beenknown to force bit flipping on somehardware, especially with lower fre‐quency memory refresh cycles.
Ich kann mir das einfach nicht vorstellen, das nicht ein einziger Fehler auftreten sollte.Ich habe meinen Speicher Undervoltet und die Timings sind auch schon so langsam jenseits von Gut und Böse. (15 - 15 - 15) bei 1,1V.
Es werden bis jetzt aber keine Fehler dokumentiert. Eigentlich sollte man doch erwarten, das dann so langsam Fehler auftreten, welche dann auch dokumentiert werden..
Speicher ist der Kingston KSM26ED6/16ME zusammen mit Ryzen 3700x auf Asus Pro WS X570-ACE
Wenn AMD die ECC Funktion nicht richtig implementiert haben sollte, wäre das natürlich auch möglich.
Ich hatte jedoch vor dem Kauf extra bei Asus nachgefragt und diese nochmals bei AMD in Taiwan. Die Auskunft war, das die aktuellen Ryzen 3000 Desktop CPUs die Speicherkorrektur implementiert haben. Nur halt ohne Verifikation. Die normalen APUs dagegen nicht.
Ich hätte ja auch eine Pro CPU gekauft. Nur wo???
Ich bin vorerst mit meinem Latein am Ende und hoffe auf gute Ratschläge.
Zuletzt bearbeitet:
(Fehler korrigiert)