Andauernde zufällige Neustarts

Phoenix0207

Cadet 1st Year
Registriert
Mai 2024
Beiträge
8
Problem gelöst, danke allen für die Mithilfe
Mein Problem war mit einem Wechsel des Netzteils gelöst, was genau das alte hatte kann ich zwar leider nicht sagen, jedoch habe ich keine Crashes mehr seit ich ein neues eingebaut habe.
Um alles andere auszuschließen empfehle ich jedem mit ähnlichen Problemen zuerst CPU und Grafikkarte zu testen oder (wenn möglich) durch eine andere die man rumliegen hat zu ersetzen und zu testen, ob das Problem immer noch besteht.
Fällt weder bei Wechsel der CPU noch bei Wechsel der Grafikkarte das Problem weg so liegt es höchstwahrscheinlich am Netzteil.


Ich empfehle zudem von SQ White Netzteilen die Finger zu lassen, da ich beim belesen rausfinden durfte das solche Probleme oft bei diesen Netzteilen auftreten. Lieber ein paar Euro mehr in die Hand nehmen und was vernünftiges von z.B. beQuiet! einbauen

1. Nenne uns bitte deine aktuelle Hardware:
  • Prozessor (CPU): AMD Ryzen 7 5700X
  • Arbeitsspeicher (RAM): Threadrippers 2x16GB (genauen Namen Grad nicht im Kopf
  • Mainboard: MSI 520 AM Pro
  • Netzteil: SQ White 600W
  • Gehäuse: …
  • Grafikkarte: AMD Radeon RX 6600
  • HDD / SSD: …
  • Weitere Hardware, die offensichtlich mit dem Problem zu tun hat (Monitormodell, Kühlung usw.):

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Mein PC startet sich häufig, jedoch nicht einschätzbar wann, neu.
Am meisten passiert es beim Spielen von CS2 und da aus dem Nichts. Brandaktueller Fall heute war auch dass er wieder abgestürzt ist, sich neu gestartet hat und sobald ich mich angemeldet habe das ganze 3-4 mal wiederholt hat.
Auffällig war auch das scheinbar ebenso wie CS auch Downloads die abstürze bestärken.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
Ich habe bereits alle möglichen Reparaturen und Scans durchlaufen lassen, als ich nicht mehr weiter wusste sogar den PC neu aufgesetzt.

Die Temperaturen sowohl von GPU als auch von CPU sind vollkommen im normalen Bereich, die CPU habe ich auch vorhin mal für 10 Minuten unter Volllast laufen lassen, hierbei keine Probleme.

Ich bin mittlerweile überfragt und hoffe auf nützliches Schwarmwissen

Update 09.05.:
weitere Problembehebungsversuche:
1. die einzige noch neuere Bios Version aufgespielt
2. Versucht auf einzelnem Riegel laufen zu lassen
3. mit Voltzahl und Taktrate experimentiert
4. alte Riegel testweise eingebaut
*alle ohne Erfolg
Prime 95 lief ca. 15 Minuten ohne Probleme, dann habe ich es beendet. Wenn ich Abstürze habe kommen diese im Normalfall wesentlich schneller.

Weitere Erkenntnis:
Am seltensten tritt das Problem im Leerlauf auf, meist nur wenn es vorher schon einen Absturz gab,
am häufigsten Tritt es auf, wenn ich CS2 spiele und währenddessen mit meinen Freunden per Discord mit cam rede.
 
Zuletzt bearbeitet:
Könnte sein dass das Netzteil Probleme macht, handelt sich dabei denn um ein Memory PC SQ-White? Das soll ja nicht so Pralle sein laut Google.de und hier auf Computerbase gibt es sogar einen Thread mit dem selben Problem und dem selben Netzteil: PC stürzt ständig ab, Netzteil Probleme?

Wenn die CPU und GPU Temperaturen in Ordnung sind und selbst eine Windows Neu-Installation nichts brachte bleibt ja nicht mehr viel, an einem veraltetem Bios-Build wird es nicht liegen, jedenfalls nicht wenn es bisher auch lief.
 
  • Gefällt mir
Reaktionen: Harpenerkkk, Azghul0815 und Ja_Ge
Es könnte auch die CPU sein.

Geh mal auf Start und tippe: Ereignisanzeige... Jetzt wartest du einen Moment. Gibt es vielleicht sowas wie, WHEA_LOG unter dem Punkt "Fehler"?
 
  • Gefällt mir
Reaktionen: Azghul0815
mainboard mit nackigen Spannungswandlern - da ist hoffentlich keine AiO auf der CPU.
Bei dem Fehlerbild könnte der RAM instabil sein oder das Netzteil ein Problem haben. Systemdatenträger wäre auch eine möglichkeit - bitte mal einen Screenshot von Crystal Diskinfo zeigen von allen Laufwerken (wo alle Werte sichtbar sind).
 
  • Gefällt mir
Reaktionen: Sinatra81
@Xero261286 Ja, es handelt sich um das von Memory PC da ich den PC von vornherein erstmal als Low end Gaming PC tun aufrüsten geholt habe, wo ich Grad eben voll dabei war.
Aber macht die Netzteil Theorie noch Sinn wenn es vorher knapp eine Woche funktioniert hat?
Ergänzung ()

@Andy4 Ereignisanzeige ist derzeit meine wahrscheinlich am meisten verwendete App...
Einziger Fehler der aussieht als gehöre er zu den Abstürzen ist

Schwerwiegender Hardwarefehler
gemeldet von Komponente Prozessorkern
Als Fehlerangabe dort "Memory Chache Exception"
Leider habe ich zu diesem Fehler nirgends eine genaue Definition gefunden, einige sagen es ist die CPU selbst, andere die GPU und wieder andere der RAM
Ergänzung ()

@duskstalker hast du hier ein Programm das Erfahrungsgemäß zuverlässig ist oder freie Auswahl?
 
Zuletzt bearbeitet:
Ich hatte ähnliche Probleme. Bei mir hat der Rechner entweden einen Reset durchgeführt, oder blieb einfach so kleben: Bild blieb, aber nichts tut was, keine Reaktion auf irgendwelche Eingaben.
Sehr frustrierend und passierte nur so ab und zu.

Im Endeffekt war es die Spannung für den Speicher. Ich habe 2x 32GB DDR4 und benutze XMP (also übertaktet) und irgendwie, irgendwann hat irgendwas die Spannung für den Speicher im BIOS auf 1.2V gesetzt. Das habe ich dann auf 1.4V gesetzt und seitdem keine Probleme (ist nur eine Woche, also ich hoffe jedenfalls keine Probleme mehr in der Zukunft.) 1.2V war auf jeden Fall zu wenig.

Was jetzt seltsam ist: als das noch auf 1.2V lief (wußte ich ja nicht) habe ich TM5 und Prime95 benutzt um alles zo testen und der Kiste so richtig den Garaus zu machen. Aber das lief alles ohne Probleme oder Fehlermeldungen. Es kann halt sehr tückisch sein. Stell' mal die Spannung auf 1.4V für den Speicher (DRAM) und schau mal ob es besser wird. Da es ein 5700 ist, sollte es ja DDR4 sein wo 1.4V durchaus OK sind.

Achso ja, noch dazu, mein Gigabyte board auf "Auto" für die Spannung legt auch zu wenig an. Wenn ich nicht 1.4V angebe, gibt's Ärger im den Fenstern.
 
  • Gefällt mir
Reaktionen: Phoenix0207
Phoenix0207 schrieb:
@duskstalker hast du hier ein Programm das Erfahrungsgemäß zuverlässig ist oder freie Auswahl?
Ich würde auch auf den RAM Tippen, aber bevor du dich dem Testen hingibst, mach doch mal einen Screenshot von ZenTimings (link führt zum Download) damit wir wissen worüber wir hier genau sprechen.
 
  • Gefällt mir
Reaktionen: LuxSkywalker
ZenTimings_Screenshot_28586867.0320953.png


Dazu sei gesagt das ich vorher noch ein wenig rumprobiert habe, genauer gesagt etwas mit der Voltzahl und Frequenz gespielt habe, egal was ich hier jedoch gemacht habe hat die Abstürze nur noch schneller hervorgerufen. Das Bild ist daher wieder von Standardeinstellungen.

Zudem habe ich in der Zwischenzeit noch meine alten Riegel (2x8 GB DDR 4) getestet, hier auch gleiches Problem.
@Ned Flanders
Ergänzung ()

Andy4 schrieb:
WHEA_LOG unter dem Punkt "Fehler"?
Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 6

Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.

Der einzige WHEA_LOG den ich bekomme ist jedes mal dieser. Das einzige was sich dabei ändert ist die Prozessor ID
 
Zuletzt bearbeitet:
VDIMM 1.2V ist halt nicht genug. Mach mal 1.4V.
 
pauschal kann man das nicht sagen. wenn das samsung c-die ram ist, kommt man mit 1,4v vdimm ggf. nicht mehr ins bios, weil das zeug spannug hasst wie die pest. bei c-die darf vdimm meiner erfahrung nach nicht über 1,25v raus, und die timings müssen stimmen, vorallem trfc. ich hatte schon mehrere kits mit c-die und jedes mal lief der krempel nicht ansatzweise ohne manuelles einstellen.

zumal das ein A-board ist, da kanns mit der speicherkompatibilität schon auch mal etwas klemmen.

wenn das problem mit dem ram skaliert und dann noch "Fehlertyp: Cache Hierarchy Error" auftaucht, würde ich mal schwer von einem problem im speichersystem ausgehen - sprich memory controller, infinity fabric, dram.

die nächste tat wäre mit hwinfo oder ähnlichem mal den hersteller der chips herauszufinden. in hwinfo einfach links "speicher" auswählen und rechts steht hoffentlich dann irgendwo "SDRAM Hersteller" - da sollte entweder SK Hynix, Samsung oder Micron stehen.

wenn da samsung steht, isses seeeeehr wahrscheinlich samsung c-die. wenn wir "glück" haben, isses sk hynix djr speicher, der läuft in der regel extrem zuverlässig.

was mir an dem screenshot aus zentimings noch auffällt, ist, dass die proc_odt mit 60 ohm für zen3 auf einem 500er board enorm hoch ist. bei mir laufen 2x16gb hynix cjr 3600 cl19 mit einer proc_odt von 43 ohm. eine zu hohe oder zu niedrige proc_odt sind nicht stabil.

es muss aber nicht der ram sein, es könnte auch die cpu sein. memory controller oder der infinity fabric können auch mal defekt sein, ist zwar eher unwahrscheinlich, aber lange nicht unmöglich.

was für den ram spricht, ist, dass prime95 läuft, aber "reale" anwendungen nicht. das liegt daran, dass je nach einstellung prime 95 den ram quasi garnicht belastet, sondern nur die cpu kerne und den cpu cache. hat man dann wiederum viele dram zugriffe, meldet sich ein instabiler ram sofort.

aber wie gesagt, jetzt erst mal schauen, was das genau für ein ram ist. wenns samsung c-die ist, kommt da sehr wahrscheinlich das problem her. quick & dirty fix wäre ein vergleichbares speicherkit von kingston kaufen, die verbauen ausschließlich hynix in dem binning. ansonsten manuelles einstellen von dem vorhandenen speicherkit.
 
duskstalker schrieb:
rechts steht hoffentlich dann irgendwo "SDRAM Hersteller"
Als SD Ram Hersteller ist SK Hynix angegeben
Ich habe auch spaßeshalber mal memtest laufen lassen, zwei Mal das gleiche Ergebnis:
Läuft bis zum "Random Data Test" bei diesem schmiert er dann immer bei ca. Der hälfte ab
 
Zuletzt bearbeitet:
Wie ist es denn wenn du das XMP aktivierst und dann auf 3200MHz runter gehst?

Die idee ist das durch das XMP einige der Spannungen VSOC, VDIMM und VDDG angepasst werden. Wenn eine davon zu niedrig ist dann könnte das einen Fehler provozieren.
 
Ned Flanders schrieb:
Wie ist es denn wenn du das XMP aktivierst und dann auf 3200MHz runter gehst
Wirkt im ersten Moment gut, Mem Test hat dieses Mal den Random Data Test durchziehen können und läuft noch weiter, ich melde mich nochmal nach längerem test

Das war's mir der Hoffnung, am Ende des Bitpattern Tests war er wieder weg
 
Also ich bezweifle mittlerweile dass das der RAM ist. Hast du eine andere CPU zum testen da?
 
ok also hynix ist schonmal gut, d.h. wir können jetzt mal vorsichtig davon ausgehen, dass der ram eigentlich laufen sollte. klar, kann immernoch defekt sein, aber prinzipiell ist hynix cjr/djr extrem gutmütig und läuft eigentlich immer.

es kann jetzt noch am board oder der cpu hängen. wie @Ned Flanders schon geschrieben hat, kanns auch ne teildefekte cpu sein, ist zwar unwahrscheinlich, aber kommt auch mal vor. aber zuerst würde ich gerne mal wissen, ob das board überhaupt die richtigen parameter einstellt, damit der ram laufen kann.

ich habe dir hier von meinem arbeitsrechner einen screenshot von meiner ramkonfig gemacht. ist ebenfalls am4 mit zen3 und hynix djr, aber dual ranked mit 2x32gb statt SR 2x16. das ist alles entwas anspruchsvoller als 2x16gb, d.h. für dich könnte es funktionieren, wenn du das einfach nur übernimmst.

also, folgender plan:

du machst ein bios reset, gehst ins bios, lädst XMP bzw. DOCP, stellst dann manuell den takt vom ram auf 3200MTs runter. das machst du am besten im "profi" modus im bios, damit du alle einstellungen siehst.

dann reboot, dann gehst du wieder ins bios und trägst alle daten ein, die ich grün markiert habe. das rot durchgestrichene kannst du ignorieren und auf auto lassen.

hier sind meine settings

ZenTimings_Screenshot highlights.png


mach dir n bild mitm handy oder drucks dir aus, oder machs auf nem anderen gerät auf, dass du das 1:1 abschreiben kannst. bei den timings musst du drauf achten, dass du wirklich das richtige einträgst, vorallem wenns lange namen sind, wie bspw tRDRDSD und tRDRDSC. wenn du da was vertauschst, bootet die kiste nicht mehr :D die können bei dir in einer anderen reihenfolge sein.

das meiste findest du beim ramtuning untermenü, aber spannungen usw. findest du im generellen OC menü.

BGS = Bank Group Swap
GDM = Gear Down Mode
CMD2T = Command Rate

GDM überschreibt Command Rate, ist quasi ein 1,5 Modus. Du stellst bei command rate 1 ein und aktivierst GDM.

vsoc ist spannung für den SoC, d.h. speichercontroller, infinity fabric. das ist eine der wichtigen spannungen. das sollte mindestens 1v sein, besser 1,025v oder1,05v bis etwa 1,1v. drüber bringt bei zen3 in der regel nix. ab 1,2v wirds gefährlich.

VDDG CCD und VDDG IOD setzt du einfach auf 1v.

Vdimm ist die spannung für die ram module, für hynix CJR/DJR reicht für 3600 in der regel 1,35 bis 1,4v - 1,38v sollte zu 99,99% laufen und ist nicht zu viel.

proc_ODT ist wahrscheinlich die wichtigste einstellung, die du unbedingt prüfen musst. bei mir am zockrechner mit cjr läuft das auf 43 ohm, bei mir am arbeitsrechner mit 48 ohm, beide rockstable. die 60 ohm sehen seeeeehr verdächtig aus. das war mit zen1 mal, aber mit zen3 liegt die proc_odt eigentlich immer im hohen 30er und 40er bereich.

vergiss auch das tRFC timing nicht. wenn der wert zu niedrig ist, läuft der ram nicht. 650 sollten gehen, aber teste auch mal 680 oder 700, wenns nicht geht.

wenn alles eingetragen ist, speicherst du erstmal ein profil für die bioseinstellungen und packst das auf einen usb stick, für alle fälle, sonst musst du alles wieder manuell eintragen.

jetzt einstellungen speichern und die kiste neu starten - nach dem starten stellst du den ramtakt und die teiler für den infinity fabric richtig ein - das sind die roten zahlen, die ich reingeschrieben habe. wenn du einen teilermodus einstellen musst, nimmst du "synchron" oder "1:1".

wenn das nicht läuft, erhöhst du die vSoC auf 1,1v und probierst die proc_odt zwischen 30 und 50 aus, der sweetspot wird um 40-48 herum liegen - gehe von der mitte aus, die extremen könnten nicht stabil sein und du musst einen bios reset machen.

wenn du feststellst, dass das problem auf irgendein parameter reagiert, den wir hier angepasst haben, kannst du auch den takt runternehmen. ramtakt=3200MTs (=DDR4 3200), die anderen frequenzen entsprechend auf 1600mhz setzen.

wenn nix hilft, hat irgendeine komponente ein problem.
 
@Ned Flanders @duskstalker
RAM und auch Festplatte kann ich mittlerweile weitestgehend ausschließen, ein Freund hat mir zwei Riegel und eine Festplatte von sich gegeben, gleiches problem. Bevor ich jetzt noch was in den Einstellungen ändere ist die Frage ob es nicht sogar lohnenswerter wäre das board zu wechseln? Dieses Board gehört ja nun leider wirklich zur Billigklasse und wäre sowieso das nächste was ich upgrade, ist das nicht vielleicht gleich schlauer?
 
duskstalker schrieb:
wenn das problem danach noch besteht, wirds aber vermutlich an der CPU liegen.
CPU vielleicht testweise vorher trotzdem tauschen? Einfach ums zu wissen? Immerhin ist die erst vor wenigen Wochen gekauft, daher auf jeden Fall in der Garantiezeit.
 
Zurück
Oben