Willkürliche Neustarts, memtest86 zeigt Fehler auf allen Riegeln immer auf gleichen Kernen. CPU defekt?

Was ist Hammer Test?

Wenn es nach Rowhammer geht, dann sind alle Speichermodule der Welt defekt.
 
Nickel schrieb:
Eigtl. nicht, denn eher das XMP bringt Fehler weil das OC ist.
Und im XMP ist auch die Spannung (VDimm) für's OC (3200er DDR4) hinterlegt,
was in der Regel 1.35V sind.
Ohne XMP, also beim SPD (Jedec) ist der DDR4 Standard 1.20V
und das schaffen in der Regel auch alle Module locker - DDR4 2133/2400MHz @1.20V.
Kannst aber mal probieren, wenn du einzel testest, ohne XMP,
hier dann manuell die VDimm des XMP 1.35V zu geben,
weil ohne XMP ist diese 1.2V, weil das SPD muss JEDEC Konform sein (@1.20V)
Vermutlich liegt es am CMOS-Reset nach dem ersten Memtest mit XMP und allen Riegeln, dass der so zickt und nun Fehler im Einzeltest ausgibt (meine Vermutung). Hast du eine Idee woher die schwerwiegenden Prozessorkern-Hardwarefehler in der Windows Ereignisanzeige kommen könnten? Diese konnte ich ja noch erkennen, als mein Windows noch länger als ein paar Sekunden lief.
 
Bitte keine Vollzitate, ist nicht erwünscht von den MODs.
Newby-TV schrieb:
. Hast du eine Idee woher die schwerwiegenden Prozessorkern-Hardwarefehler in der Windows Ereignisanzeige kommen könnten?
Den müsste man mal sehen, sollte aber wohl nicht sein sowas.
Newby-TV schrieb:
Vermutlich liegt es am CMOS-Reset nach dem ersten Memtest mit XMP und allen Riegeln,
Vermutungen und Spekulationen bringen dich nicht weiter.
Was du aber auch noch machen könntest, , macht man, wenn RAM überhaupt nicht erkannt wird,
ein BIOS-Reset (CmosClear) mit nur einem RAM Modul in Slot "DimmA2".
Nach dem CmosClear dann auch einmal so durchstarten, mit nur dem einen Modul in Slot "A2".
Ergänzung ()

Wie sieht's eigtl. aus mit dem BIOS (Update)?
Bios Version "7C35v1A" bringt z.B. "- Improved memory compatibility" mit.
Das ist dann in den darauffolgenden Updates auch enthalten.
 
Kleines Update: Memtest hatte in Phase 2 bisher einen Fehler gefunden (4Riegel ohne aktivem XMP) - Hab ich nun erstmal abgebrochen, da ich den Abend lieber nutze, um kurzfristige Tests zu fahren. Ubuntu versucht zu starten - Kam beim Laden nur ein DRM Timeout. Darauf hin Windows booten lassen und Prime95 gestartet (Ging nun auf einmal wieder). Small FFT crashed nach 2 Sekunden -> Neustart. Large FFTs crashed nach ca. 6 Sekunden -> Neustart. Smallest FFTs lief bisher ohne crash. Hab nochmal die schwerwiegende Hardwarefehler aus dem Windows Ereignisdienst gezogen -> Siehe Anhang
Ergänzung ()

Nickel schrieb:
Bitte keine Vollzitate, ist nicht erwünscht von den MODs.

Den müsste man mal sehen, sollte aber wohl nicht sein sowas.

Vermutungen und Spekulationen bringen dich nicht weiter.
Was du aber auch noch machen könntest, , macht man, wenn RAM überhaupt nicht erkannt wird,
ein BIOS-Reset (CmosClear) mit nur einem RAM Modul in Slot "DimmA2".
Nach dem CmosClear dann auch einmal so durchstarten, mit nur dem einen Modul in Slot "A2".
Ergänzung ()

Wie sieht's eigtl. aus mit dem BIOS (Update)?
Bios Version "7C35v1A" bringt z.B. "- Improved memory compatibility" mit.
Das ist dann in den darauffolgenden Updates auch enthalten.
Bios ist auf der neusten Version: 7C35v1G4
 

Anhänge

  • IMG_20211122_173452.jpg
    IMG_20211122_173452.jpg
    597,2 KB · Aufrufe: 247
  • IMG_20211122_173521.jpg
    IMG_20211122_173521.jpg
    802,8 KB · Aufrufe: 251
Was ist mit meiner Ergänzung obendrüber bezüglich BIOS Update?
Ziehe dies in Erwägung, wegen "- Improved memory compatibility"
und auch wegen den "WHEA (CPU) Fehler" in der Ereignisanzeige.
 
Smallest FFT ist nun auch erfolgreich nach wenigen Sekunden abgeraucht.
Ergänzung ()

Nickel schrieb:
Was ist mit meiner Ergänzung obendrüber bezüglich BIOS Update?
Ziehe dies in Erwägung, wegen "- Improved memory compatibility"
und auch wegen den "WHEA (CPU) Fehler" in der Ereignisanzeige.
Bios ist auf der neusten Version: 7C35v1G4
 
Zuletzt bearbeitet:
Das "Windows 11 Support Beta Bios" hätte ich dir nicht empfohlen.
Schon paar mal von Problemen gelesen nach solchen Bios Updates.
Hattest du die Probleme schon vorher, auch mir der vorherigen BIOS Version?
Diese Veränderungen für Windows 11 kann man selbst im BIOS einstellen wenn man's braucht.
 
Hab erst geupdatet, nachdem die ersten Probleme auftraten mit dem System.
 
Wenn man nach „Cache Hierarchy error“ sucht findet man viele Treffer, nur leider keine konkreten Lösungshinweise. Aber die Symptome, die die Leute beschreiben, sind ähnlich.
 
Hier könnte man wohl noch vor Ort helfen.
Evtl. bleibt dir nur eine kompetente PC-Werkstatt
oder eben Hardware tauschen - aber das wäre hier ja schon fast auf gut Glück tauschen.
Ist schon alleine sehr merkwürdig mit den RAMs, dass diese einzel Fehler bringen
aber zusammen nicht.
Dann noch diese WHEA Fehler bzgl. der CPU trotz BIOS Update.
Klarer Fall für den Fachmann.
Alles weitere wird wohl nur noch Spekulationen hier,
aber kannst ja mal noch abwarten.
Bringt aber eher nichts mehr, Zeitverschwendung.
 
Nickel schrieb:
Hier könnte man wohl noch vor Ort helfen.
Evtl. bleibt dir nur eine kompetente PC-Werkstatt
oder eben Hardware tauschen - aber das wäre hier ja schon fast auf gut Glück tauschen.
Ist schon alleine sehr merkwürdig mit den RAMs, dass diese einzel Fehler bringen
aber zusammen nicht.
Dann noch diese WHEA Fehler bzgl. der CPU trotz BIOS Update.
Klarer Fall für den Fachmann.
Alles weitere wird wohl nur noch Spekulationen hier,
aber kannst ja mal noch abwarten.
Bringt aber eher nichts mehr, Zeitverschwendung.
Nach nun 1,5 Wochen mit vielen Tests und keinen klaren Ergebnissen bin ich auch an dem Punkt angekommen gedanklich. Werde morgen den Rechner mal zum Fachmann geben. Hoffentlich ist es nur das NT. Alles andere wäre bei den aktuellen Preisen echt mies. Wie sieht das mit Gewährleistung grundsätzlich aus? Im März wären die 24 Monate durch. Nur weiß ich nicht, wie man das den Herstellern klar machen soll, dass es kein Selbstverschulden ist.
 
Newby-TV schrieb:
Hoffentlich ist es nur das NT.
Ganz bestimmt nicht.
Da hättest du andere Symptome, statt Fehler in Memtest86.
Ergänzung ()

Wenn ich die Möglichkeit hätte, CPU tauschen, RAM mal tauschen.
CPU, ist ja eigtl. was am seltesten mal kaputt geht, was man eher selbst kaputt macht.
Aber was es hier auf CB im Forum schon an angeblich defekten Ryzen CPUs gab ist unglaublich,
von daher...
Ergänzung ()

Hast du "SMART ACCESS MEMORY (SAM)" aktiviert im BIOS?
Schalte das mal ab, ob sich was ändert.
Ergänzung ()

Wobei, SAM sollte wohl eh nicht funktionieren bzw aktivierbar/vorhanden sein.
Dein System unterstützt das gar nicht und zudem auch noch eine NVidia Grafikarte.
Vergiss es.
Ergänzung ()

Hmm, Mainboard unterstützt es wohl doch:

Bios
"- Support S.A.M technology (Re-size BAR function) to enhance GPU performance for AMD Radeon RX 6000 series".

Weiß jetzt nicht ob das mit deiner CPU funktionieren würde, aber nicht mit einer NVidia Karte.
Schau lieber mal nach im BIOS, ob du da eine Einstellung diesbezüglich findest und auch deaktiviert ist.
 
Zuletzt bearbeitet:
Silver Server schrieb:
Der Memtest testet den Arbeitsspeicher nicht die CPU. Wenn da Fehler angezeigt werden dann ist der Arbeitsspeicher defekt.

Sorry, aber das ist Käse!
Der Speichercontroller sitzt bei aktuellen Systemen in der CPU. Gibt es da Probleme in der Kommunikation zwischen CPU und Speicher, dann werden sehr wohl Speicherfehler auftreten, auch wenn der Speicher alleine zu 100% ok ist!

Zum Thema:
Es wurde ja schon korrekterweise angesprochen, dass ggf. die Speicherspannung erhöht werden sollte. Die erwähnten 1,4V halte ich jedoch für zu hoch. Max. 1,37-1,38V sollten als Test reichen, um die Speicherversorgung des Mainboards als Fehlerquelle auszuschließen. Hilft auch das nicht und wurde das Bios aktualisiert, kann auch die CPU die Fehlerquelle sein.
 
Moin zusammen,

über Nacht habe ich nun memtest nochmal auf optimaler Konfiguration durchlaufen lassen. Wie bereits beim aller ersten Test mit allen Riegeln (XMP1-Profil aktiv - 4 Module) KEINE Fehler. Fehler scheinen also nur dann zu entstehen, wenn die Speichermodule zu wenig Saft bekommen (XMP deaktiviert) und einzelnd getestet werden.
Ergänzung ()

Nickel schrieb:
Ganz bestimmt nicht.
Da hättest du andere Symptome, statt Fehler in Memtest86.
Ergänzung ()

Wenn ich die Möglichkeit hätte, CPU tauschen, RAM mal tauschen.
CPU, ist ja eigtl. was am seltesten mal kaputt geht, was man eher selbst kaputt macht.
Aber was es hier auf CB im Forum schon an angeblich defekten Ryzen CPUs gab ist unglaublich,
von daher...
Ergänzung ()

Hast du "SMART ACCESS MEMORY (SAM)" aktiviert im BIOS?
Schalte das mal ab, ob sich was ändert.
Ergänzung ()

Wobei, SAM sollte wohl eh nicht funktionieren bzw aktivierbar/vorhanden sein.
Dein System unterstützt das gar nicht und zudem auch noch eine NVidia Grafikarte.
Vergiss es.
Ergänzung ()

Hmm, Mainboard unterstützt es wohl doch:

Bios
"- Support S.A.M technology (Re-size BAR function) to enhance GPU performance for AMD Radeon RX 6000 series".

Weiß jetzt nicht ob das mit deiner CPU funktionieren würde, aber nicht mit einer NVidia Karte.
Schau lieber mal nach im BIOS, ob du da eine Einstellung diesbezüglich findest und auch deaktiviert ist.
SAM ist meines Wissens nach nur mit der aktuellen 5xxx Ryzen Reihe nutzbar in Kombination mit den 6xxx Grafikkarten von AMD.
 
Zuletzt bearbeitet:
Das weiß ich. Solltest aber trotzdem mal schauen im BIOS, ob da nicht fälschlicherweise (Bug) was aktiviert ist im BIOS bezgl. SAM .
 
Nickel schrieb:
Das weiß ich. Solltest aber trotzdem mal schauen im BIOS, ob da nicht fälschlicherweise (Bug) was aktiviert ist im BIOS bezgl. SAM .
Das ist deaktiviert. Ich nehme ganz stark mittlerweile an, da der Speicher keine Fehler verursacht, sofern die richtige Spannung anliegt, dass das Netzteil oder CPU einen weg hat. Heute Mittag bring ich den Rechner zum Fachmann, der dann mal die Komponenten tauschen und testen kann.
 
Newby-TV schrieb:
SAM ist meines Wissens nach nur mit der aktuellen 5xxx Ryzen Reihe nutzbar in Kombination mit den 6xxx Grafikkarten von AMD.
Nein auch die 3000er AMD CPUs können das aber nur auf 500er Chipsatz Boards:

1637662634599.png


https://www.amd.com/de/technologies/smart-access-memory

SAM ist auch bei den GPU von NVIDIA möglich, da muss man den Speicherbereich kontrollieren oden mit GPU-Z schauen.

Der Artikel ist zwar schon älter aber das wurde alles weiterentwickelt.

1637662837123.png


https://www.golem.de/news/resizable...-amd-und-nvidia-grafikkarten-2105-156232.html

Bei Problemen immer mal in den Zuverlässigkeitsverlauf schauen, sind dort Fehler drin?
Wenn ja stehen auch die technischen Daten dabei.
 
So, Rechner ist abgegeben. Soll am Freitag oder Samstag Feedback bekommen. Bin gespannt.
 
  • Gefällt mir
Reaktionen: Nickel
Zurück
Oben