Rechner stürzt ab und löst eine Machine Check Exception

Zu dem Ram F4-3600C16D-32GVKC findet sich kein Eintrag auf der QVL-List bei MSI.

Da mal links im Menü auf Kompatiblität klicken und dann auf Memory by RX3x00.
https://de.msi.com/Motherboard/support/MAG-B550-TOMAHAWK

Da taucht der RAM dann nicht auf.

Allerdings, zu Deinem Glück, taucht er in der Combo bei G.Skill unter der QVL für AMD B550 (Ryzen 3000 series CPUs) für das MSI MAG 550 Tomahawk auf .

https://www.gskill.com/qvl/165/184/1562831784/F4-3600C16D-32GVKC-Qvl

Also gehen müsste es hier schonmal, kann natürlich auch sein dass es ein versteckter Hardwarebug ist, d.h. wenn Du einen anderen Ryzen 3600 hernimmst könnte es laufen.
Aber versuch erstmal mit 3200 MHz, das klingt schonmal gut dass er das stabil nimmt und teste auch mit höherer DRAM-Voltage, vlt. hilft dass dann weiter.
Ergänzung ()

Weil ich mich heute mit dem DRAM-Temperaturen meines Systems rumgeschlagen hatte ob das stabil ist.

Ein Stresstest klammert manchmal Komponenten und Settings aus die im Deinem Usecase grade aktiv sein könnten.
Ergänzung ()

Btw: Das was der Eine aus dem Manjaro-Forum geschrieben hat:
rbmorse 20. September 2020 um 01:04 #3

First thing I’d try: If you’re running a D.O.C.P. profile on your memory in setup, disable that and see if system behavior improves. If it does, try testing each memory module individually, overnight if you’re using Memtest.
Second thing I’d try: Swap power supplies. I realize most people don’t have a spare power supply sitting around, but unless you have access to a good shop with a PSU load tester, there’s really no other way to check it (also: Make sure all the cable connections are tight and there is no sign of overheating at the connectors or scuffed insulations).

Riecht so als könnte es eventuell auch bei Dir in die Richtung gehen. In dem Thread wurde es allerdings so gelöst dass ein aktuellerer Linux-Kernel eingespielt wurde.
 
Zuletzt bearbeitet:
Der Kernel den ich verwende ist 5.9.16-1-MANJARO
Und den Parameter processor.max_cstate=5 werde ich hinzufügen.

Aber die C-States habe ich im BIOS deaktiviert.
 
Ich hab so im Bauch das Gefühl dass das NT der Gremlin ist.
Aber schau ob der mit 3200 MHz die nächsten Tage auch so rumkaspert und teste bei "Gut" nochmal mit XMP und höherer RAM-Spannung. Von VSOC usw. fange ich lieber erstmal nicht an, da wärste dann im RYZEN-RAM-Forum hier bei Computerbase besser aufgehoben. Die kennen dafür aber auch jeden Gremlin im Zusammenhang mit RAM und Ryzen.
Ergänzung ()

Und probier auch ruhig nochmal die Nummer mit Windows auf der anderen HDD, schaden kanns nicht.
Und versuche auch ruhig eine Live-Distro von Manjaro auf dem USB-Stick statt von der SSD laufen zu lassen.
 
Zuletzt bearbeitet:
Aber der be quiet NT-Rechner liefert einen maximalen Wattbedarf von 255. Vorausgesetzt ich habe alles richtig eingegeben.
 
Arif12 schrieb:
Ich frage mich manchmal, ob es an Linux liegt. Ich habe eine andere HDD-Festplatte wo darauf Windows installiert ist. Ich werde es mal testen. Solche Tests berauben sehr viel Zeit :o.

Der klassische Test ist irgentwelche fetten Projekte mit vielen Thread mit dem gcc zu kompilieren. Das schlug bei mir schon mal schneller an als memtest86. Lass sowas mal 1-2 Tage im Hintergrund durchlaufen.
Evtl. auch noch paralell auf einer mir dm-crypt/Luks verschlüsselten Platte Sachen sinnlos hin und herkopieren dann kommt auch die FPU und DMA dazu.

Sowas wie python -c "print (4376987.5**876398398)" oder xz -9 macht auch ordentlich Stress.

Kinder-RAM hat bei mir Hausverbot, das kackt zu schnell einfach ab wenn mal was richtiges auf der Kiste macht.
 
Zuletzt bearbeitet:
Der Rechner hat sich wieder rebootet...
Ergänzung ()

Habe mir die Spannungen im BIOS angeschaut. Der RAM benötigt 1.35V und kriegt 1.344V unter XMP Profil 2.
 

Anhänge

  • index.jpg
    index.jpg
    207,2 KB · Aufrufe: 285
Zuletzt bearbeitet:
Arif12 schrieb:
Der Rechner hat sich wieder rebootet...

Tausche den Speicher über Kreuz und schaue dann nach ob die MCEs dann auf einer anderen Bank kommen.

BTW: Stecken die Module in den Slots wie im Handbuch angegeben? Nicht das du lose Enden hast die reflektieren.
 
foofoobar schrieb:
Tausche den Speicher über Kreuz und schaue dann nach ob die MCEs dann auf einer anderen Bank kommen.

BTW: Stecken die Module in den Slots wie im Handbuch angegeben? Nicht das du lose Enden hast die reflektieren.
Ich habe mal die Module vertauscht, also von A2 zu B2 und von B2 zu A2, aber es kommt immer wieder der selbe Fehler.
Die Module befinden sich im Dual Channel wie im Handbuch beschrieben und ich habe Anschlüsse überprüft

Im Prinzip hat sich nichts verändert, obwohl das defekte Mainboard ausgetauscht wurde.
 
Arif12 schrieb:
Ich habe mal die Module vertauscht, also von A2 zu B2 und von B2 zu A2, aber es kommt immer wieder der selbe Fehler.
Die Module befinden sich im Dual Channel wie im Handbuch beschrieben und ich habe Anschlüsse überprüft
Die fett markierte und kursive Zahl ist immer gleich?
mce: [Hardware Error]: CPU 6 Machine Check: 0 Bank 5: bea0000000000108
 
  • Gefällt mir
Reaktionen: Arif12
Teste mal nur einen Riegel und dann den anderen.
 
  • Gefällt mir
Reaktionen: Arif12
foofoobar schrieb:
Die fett markierte und kursive Zahl ist immer gleich?
Ja. Den RAM habe ich nicht zu Mindfactory geschickt, weil ich die Module mit MemTest86 getestet habe.
 
Arif12 schrieb:
Habe mir die Spannungen im BIOS angeschaut. Der RAM benötigt 1.35V und kriegt 1.344V unter XMP Profil 2.

Die angezeigte Frequenz ist zu hoch.
Ergänzung ()

Arif12 schrieb:

Das der Fahler nicht mit wandert, spricht dagegen das es einer der RAM-Riegel ist.
 
Zuletzt bearbeitet:
Also hast Du jetzt, nachdem der Rechner lief, wieder das XMP Profil geladen und dann fand wieder ein Reboot statt?
 
Jossy82 schrieb:
Hast Du die Möglichkeit mal ein Netzteil mit gleich oder mehr als 550Watt gegenzutesten?
Das riecht irgendwie nach einem POWER-Problem, dass hier irgendwas rumspackt. 450Watt könnten hier ein Flaschenhals sein. Laut NT-Rechner von Bequiet würde dein 450er schon mit 92% im roten Lastbereich hängen, klar die zippeln sich dass schon so zurecht dass man immer über Bedarf kauft aber vielleicht haut Dir hier der Ryzen wirklich soviel Last in den Peak. (Meine Annahme, habe schon öfter gelesen dass so einige unerklärliche Probleme mit einem NT-Tausch gelöst wurden.)

Bei einer Grafikkarte mit 50W TDP? Eher unwahrscheinlich, dass da das NT zu schwach ist.
Klar, es kann eine Macke haben, aber an der Leistung liegt es definitiv nicht!
 
@Sound-Fuzzy Ja, denke ich mittlerweile auch; allerdings ist das eine der Komponenten die noch nicht gegengeprüft worden sind und 50 oder 100 mehr Watt schaden auch nicht. Dennoch wäre es nicht das erste mal dass ominöse Fehler ihren Ursprung in einem fehlerhaften NT haben. Zudem denke ich pauschal dass ein NT mit höherer Wattage auch mehr Fehlertoleranz und mehr Gegenmassnahmen hat. (Grade im 500 Watt Bereich der ja lange Brot- und Butter-Ware für die Hersteller gewesen ist.)

Ausserdem hatte ich zum Zeitpunkt des Zitats aufgrund eines Lesefehlers noch im Kopf dass er 2x Gpus hat und dementsprechend den Netzteilrechner bei Bequiet so konfiguriert. Nimmt man nur die Gpu 1x ist er ja auch im grünen Bereich bei der Auslastung.

Stelle ich dass korrekt ein ergibt sich ein Wattbedarf von 343 Watt für Non-OC und 360 Watt für das OC-Setting (Also mit auto-oc des Mainboards sprich PBO aktiv und falls die GPU ab Werk was drin hat.)

Aus dem Pool der vermuteten Möglichkeiten stehen für mich ein Problem mit der Spannungsversorgung (NT hat ne Macke, Kabel sitzen nicht richtig oder nicht korrekt) oder Fissimatenten bei der Konfiguration die nicht sauber greifen (Zu wenig Voltage auf RAM)

Wenn er Pech hat kann es auch sein dass sein 3900X entweder einen schwachen IMC hat oder dass das MSI-BIOS in der genutzten Version noch ein Problem erzeugt.

Oder er kommt nachher um die Ecke und sagt uns dass es doch die Linux-Distro war. :D

- Ferndiagnose halt, kann man nur rum munkeln. hat man nicht selbst die Pfoten dran. -
 
Jossy82 schrieb:
Stelle ich dass korrekt ein ergibt sich ein Wattbedarf von 343 Watt für Non-OC und 360 Watt für das OC-Setting (Also mit auto-oc des Mainboards sprich PBO aktiv und falls die GPU ab Werk was drin hat.)

Wie kommst Du auf 343W? Ich komme da nur auf 238W und somit nur 53% Auslastung bei seinem NT. Hast Du die falsche Grafikkarte eingegeben???
 
Die hier, einfach als config.txt speichern und beim Kalkulator einladen:
{"cpu":3,"cpu_socket":102,"cpu_model":8083,"gpu":[16,0,0,0],"gpu_model":[7964,0,0,0],"gpu_count":0,"ram":"1310","sata":"1319","pata":0,"fan":"1336","wk":0,"usb31":1,"overclock":null}
Ergänzung ()

Ah, ich hatte usb 3.1 Gen 2 Stromübertragung aktiviert, dass sollte wohl der Unterschied sein. Allerdings eine Option die schon auf aktiv gesetzt sein sollte für alle Eventualitäten. (Das MB kanns jedenfalls und eine Buchse ist vorhanden. Und alle modernen Smartphones haben ebenso solch einen Anschluss.)
 
Ich würde den RAM verkaufen und mir Crucial Ballistix RAM besorgen. Die sind für Ryzen CPUs optimiert.
 
Der Ram ist laut G.Skill kompatibel mit dem Board (QVL-Liste!). Da muss er nix neu kaufen. Ist ja auch kein zickiger Ryzen 1 oder Ryzen + verbaut sondern Ryzen 2 (3900x).
Ergänzung ()

@Arif12 Hier, heute neue News, da ist der aktuellste Linux-Kernel dabei, damit solltest Du gut Deine Manjaro Installation gegenprüfen können, einfach auf nen USB-Stick und mal als Live-System testen.

https://www.computerbase.de/2021-04/kaos-2021.04-die-essenz-aus-eigenen-quellen-und-kde-plasma/
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Arif12
Jossy82 schrieb:
Der Ram ist laut G.Skill kompatibel mit dem Board (QVL-Liste!). Da muss er nix neu kaufen. Ist ja auch kein zickiger Ryzen 1 oder Ryzen + verbaut sondern Ryzen 2 (3900x).
Ergänzung ()

@Arif12 Hier, heute neue News, da ist der aktuellste Linux-Kernel dabei, damit solltest Du gut Deine Manjaro Installation gegenprüfen können, einfach auf nen USB-Stick und mal als Live-System testen.

https://www.computerbase.de/2021-04/kaos-2021.04-die-essenz-aus-eigenen-quellen-und-kde-plasma/
Jo mach ich
Ergänzung ()

T.N. schrieb:
Also hast Du jetzt, nachdem der Rechner lief, wieder das XMP Profil geladen und dann fand wieder ein Reboot statt?
Der Rechner starte sich neu. Ich habe dann das XMP Profil 2 aktiviert und neu ins BIOS gebootet.
 
Zuletzt bearbeitet:
Zurück
Oben