Memtest86 Fehler

Sp1derschwein

Lt. Junior Grade
Registriert
Dez. 2014
Beiträge
338
Hallo,

ich habe für jemanden einen PC zusammengebaut und noch einen Memory Test laufen lassen, um sicherzustellen, dass der RAM fehlerfrei ist. Während des Test 13 kam folgende Meldung: [NOTE] RAM may be vulnerable to high frequency row hammer bit flips. Ich habe gelesen, dass diese Meldung bei vielen Modulen auftritt und man sie für unkritische Nutzung ignorieren kann, jedoch kamen danach noch mehrere Fehler, die mich doch unsicher machen: IMG_2437[1].JPG
Sollte ich den RAM umtauschen. Es handelt sich diesen RAM in Kombination mit einem i3-6100 und einem MSI H170M-A Pro. Was haltet ihr von den Fehlern?

Vielen Dank im Voraus
 
Das sind alles die gleichen Rowhammer Fehler. Alles Test 13.
 
HominiLupus schrieb:
Das sind alles die gleichen Rowhammer Fehler. Alles Test 13.

Sind sie also unbedenklich oder sollte ich lieber den RAM tauschen?
 
Diese Fehler sind nicht unbedenklich und deuten entweder auf defekten RAM oder inkompatible UEFI-Einstellungen hin:

Starting from MemTest86 v6.2, potentially two passes of row hammer testing are performed. On the first pass, address pairs are hammered at the highest possible rate. If errors are detected on the first pass, errors are not immediately reported and a second pass is started. In this pass, address pairs are hammered at a lower rate deemed as the worst case scenario by memory vendors (200K accesses per 64ms). If errors are also detected in this pass, the errors are reported to the user as normal. However, if only the first pass produces an error, a warning message is instead displayed to the user.

Also, der Row Hammer-Test besteht aus zwei Teilen: Im ersten Teil wird der Test mit der maximalen Geschwindigkeit durchgeführt, die die Hardware hergibt, kommt es hier zu Fehlern, wird ein zweiter Teil mit reduzierter Geschwindigkeit angehängt. Kommt es nun nicht mehr zu Fehlern, bleibt die Anzeige "Errors: 0", unten kommt jedoch der Hinweis mit "Note: Your RAM may be vulnerable to..."

Würde die Module mal einzeln testen und schauen, ob es nach wie vor zu Fehlern kommt.
 
Zuletzt bearbeitet:
Im UEFI habe ich nur den richtigen Takt für den RAM eingestellt, ansonsten ist alles normal eingestellt. Reicht es, wenn ich nur den Test 13 jeweils einem Modul wiederhole?
 
Jein, jede UEFI-Änderung sollte mit der vollständigen Test-Batterie gegengecheckt werden; als ersten Anhaltspunkt, um einen konkreten Fehler zu beheben, kann man es jedoch so machen, d. h. wenn dann keine Fehler mehr kommen kann man anschließend zur Prüfung noch alle Tests z. B. über Nacht laufen lassen bevor man das System normal verwendet.

Sollten die Module einzeln bei null Fehlern bleiben, mal die DDR4-Spannung in sehr kleinen Schritten erhöhen, von 1,200 V auf 1,215 V usw., aber nicht übertreiben.
 
Zuletzt bearbeitet:
Ich habe jetzt bei beiden Module bei 1.2V jeweils den Test 13 anlaufen lassen und es kamen wieder die gleichen Fehler. Bei 1.25V passiert es auch noch.
 
Zuletzt bearbeitet:
Haben die Module ein XMP-Profil, das man über das UEFI laden könnte?
 
Im UEFI steht, dass XMP nicht unterstützt wird.
 
- Wurden bei dem einzelnen Testen alle vier Steckplätze des Mainboards probiert?

- Ist auf dem Mainboard die aktuellste UEFI-Version installiert?
 
Bisher habe ich nur den ersten und den dritten verwendet. Das aktuellste UEFI habe ich installiert.
 
Dann mal noch #2 und #4 probieren. Aber deutet schon ziemlich auf defekten RAM hin, sofern die UEFI-Timings den RAM-Riegeln enstprechen.
 
In Slot 2 und 4 treten ebenfalls Fehler auf. Soll ich den RAM einfach zurückschicken und anderen bestellen?
 
Sieht leider meiner Erfahrung nach ganz nach schlechten Chips aus, in einem Kit stammen die ja meistens direkt aus einer Charge, eventuell war da die Qualitätssicherung nicht so streng, wobei mich da Crucial enttäuscht, da die eigentlich auch Chip-Hersteller und nicht nur Fertiger wie Corsair, Kingston & Co. sind, also eigentlich die besten Teile bekommen sollten.

Vielleicht schaut noch der Nutzer Holt vorbei und hat noch eine Idee, ich habe bei DDR4 selber nur Erfahrung mit ECC-Modulen, wo die Row Hammer-Späße für'n Popo sind.

Bei DDR3 hab ich bzgl. Row Hammer negative Erfahrung mit Corsair gemacht (DDR3L 2133 MHz, selbst bei 1333 MHz anfällig für die stärkere Row Hammer-Attacke), dafür postive mit Kingston und GeIL, bei beiden auch nach 24 h null Probleme auch nicht bei den härteren Row Hammer-Tests (jeweils vier Module getestet). Da das keine Hersteller sondern Fertiger sind, kann man leider nicht sicher sagen, dass deren Module generell nicht betroffen sind.

Ich würde eventuell Samsung als nächstes testen, da die Chip-mäßig das Know How für gute Qualität haben sollten, aber so ist's eigentlich auch bei Crucial...

Bleibt einem als Endkunde eigentlich nur den Stinkefinger an Intel zu zeigen, dass sie ECC bei den Mainstream-Plattformen wegstreichen.
 
Zuletzt bearbeitet:
In dem Preisbereich habe ich bei Mindfactory keine Samsung-Speicher gesehen, die in einem ähnlichen Preisbereich sind, und ich würde gerne dort bestellen, da es wohl mit dem Umtausch leichter wäre. Sind die G.Skill oder diese Kingston empfehlenswert? Die G.Skill stehen zumindest auf der Kompatibilitätsliste des Mainboards.
 
Die Kompatibilitätslisten sind leider auch ziemlich für'n Popo, da sie bei Veröffentlichung bereits veraltet sind und selbst bei einer Modul-Reihe unterschiedliche Chip-"Modelljahre" verbaut werden können, als erhebliche Unterschiede an den Innereien vorhanden sein können, die eventuell Probleme verursachen.

Die beiden verlinkten werden sich nicht viel nehmen, wenn's einer von den beiden sein muss, würde ich aus dem Bauch heraus Kingston nehmen.
 
JBG schrieb:
Bleibt einem als Endkunde eigentlich nur den Stinkefinger an Intel zu zeigen, dass sie ECC bei den Mainstream-Plattformen wegstreichen.
Da und auch sonst volle Zustimmung und ja, ECC RAM ist heute nötiger den je, die RAMs sind hart am Limit. Man hat zwar bei DDR4 schon eine CRC für die Datenübertragung mitgegeben, offenbar wären Fehler bei den nun offiziel erlaubten Frequenzen einfach zu häufig aufgetreten, denn sonst rührt sich die Industrie da nicht wenn es um Consumer-HW geht. Ob das ausreicht wird man sehen.

Wobei man nicht einmal Intel den Stickefinger zeigen muss, der Z170 Chipsatz kostet 47$, der C236 mit 49$ gerade 2$ mehr und bietet dafür sogar 8 statt 6 SATA Ports. Ebenso kostet ein C232 mit 34$ auch gerade eben diese 2$ mehr als der H170 für 32$, aber schaut man sich die Preise für die Mainboards ab, glaubt man das gar nicht und daher muss der Stinkfinger zuallerest wohl anderen als Intel gezeigt werden. Die NAS Hersteller wären da ganz oben auf meiner Liste, die sind zum Teil richtig pervers, so werden da Atom C2xxx SoC die ECC RAM unterstützen und schon ab 43$ zu haben sind, also nicht teurer als viele Celeron SoCs sind, dann in als Enterprise NAS beworbenen Geräte mit nur 8 fest verlöteten RAM Chips für horrendes Geld an den Man gebraucht, da hört es dann echt auf, zumal die klassischen Server-HW Anbieter wie HP schon die Einstiegsserver für rund 200€ oder sogar weniger mit Xeon Chipsätzen, ECC unterstützenden CPUs und ECC RAM anbieten.

Klar wäre es toll wenn Intel jeder CPU, jedem Chipsatz und jedem SoC auch ECC RAM Unterstützung mitgeben würde, aber offenbar verlangt der breite Markt danach noch überhaupt nicht, sondern will lieber andere geile Features wie eben die CPUs massiv übertakten (dann ist es um die Stabilität im Betrieb sowieso mies bestellt, da fallen RAM Fehler auch nichts mehr auf :evillol:) oder beim NAS die tollsten, neusten CODECs und Apps fürs Smartphone. Wer dagegen Wert auf einen stabilen Betrieb des Rechners und auf die Integrität seiner Daten legen, muss halt eher in den Nischen der Märkte nach seiner HW suchen.

Sp1derschwein, tausche die RAMs um und hoffe das die nächsten besser sind, mehr als testen kannst Du nicht machen. Du hast Consumer-HW, die hat nur den Anspruch meistens problemlos zu laufen.
 
Zuletzt bearbeitet:
Gibt es eigentlich eine Datenbank mit fehlerfrei gegen Row Hammer getesteten Modulen? Wäre auch bei Reviews sinnvoller als Geschichten wie 3.200 MHz bei 1,7 V o. ä.
 
Nein, zumal diese Liste (genau wie QVL Memory Listen) keinerlei Aussagekraft hätte, außer dass es ein einziges Mal unter diesen Bedingungen geklappt hat.
Manche Hersteller wechseln Chips wie Unterwäsche, so eine Liste würde nur alles verfälschen.

Zudem kommt es auch nicht nur auf den RAM an sondern auf das gesamte Speichersubsystem aus Board, Controller und Modul.

Ich hatte einige Anfragen von Kunden wegen dem (alten) Row Hammer Test. Aber auch von den Speicherherstellern kam meist (wenn überhaupt was kam) die Info zurück: Der (alte) Test ist Unsinn. Deswegen wurde der Test ja auch abgeschwächt.

Wenn man es darauf anlegt bekommt man mit jedem DIMM ohne ECC oder andere Fehlerkorrektur irgendwann einen Fehler. Es ist unvermeidbar. Die Frage ist nur wie lange und intensiv man ihn dafür foltern muss.
 
Zurück
Oben