Willkürliche Reboots und selbst der Profi weiß nicht weiter

TakatoDBanx

Cadet 1st Year
Registriert
Aug. 2024
Beiträge
13
Wunderschönen guten Tag,
Das ist mein erster Versuch mir über ein Forum Hilfe zu besorgen. Grundsätzlich behebe ich Probleme gerne selbst aber ich kann nicht mehr und glaube auch, dass das meinen Horizont überschreitet. Des weiteren hoffe ich, dass dieser Beitrag hier hin gehört und ihr vielleicht noch Vermutungen habt, was das Problem sein könnte.

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): AMD Ryzen 7 5800X3D 8-Core Processor
  • Arbeitsspeicher (RAM): 32GB
  • Modulteilenummer: G.Skill F4-3200C14-8GTZN
  • Mainboard: Gigabyte B550 Aorus Elite V2
  • Netzteil: 850 Watt be quiet! Straight Power 11 Modular 80+ Platinum
  • Gehäuse: be quiet! pure base 500
  • Grafikkarte: AMD Radeon RX 6950 XT (Navi21 KXTX) [ASRock]
  • HDD / SSD: Samsung SSD 980 PRO with Heatsink 2TB
  • Weitere Hardware, die offensichtlich mit dem Problem zu tun hat (Monitormodell, Kühlung usw.):

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):

Das Problem hatte ich in den vergangenen 2 Jahren einmal alle drei Monate und nun ständig.

Mein Problem sind willkürliche Neustarts meines PCs. Das bedeutet, dass der PC sowohl beim Starten von Spielen, in Spielen und auch beim Browsen(z.B.: Youtube) neustartet. Meiner bescheidenen Beobachtung nach, passiert dies auch nicht bei voller Leistung, sondern eher wenn vom Idle in die Vollen getaktet wird. Aufgefallen ist dies vor allem beim Starten von Spielen oder wenn ich in Youtube von Shorts auf ein Video wechsele.
Wichtig: Das passiert nicht immer.

Erste Vermutung war der Prozessor, denn nach jedem Neustart hatte ich einen WHEA 18 in der Ereignisanzeige. (Beim letzten Mal tatsächlich nicht) Da dieser auch immer erst nach dem Neustart geloggt wird, denke ich eher es handelt sich um eine Folge nicht aber die Ursache. Schließlich ist auch immer ein anderer Kern der Verursacher für den Fehler.
Ansonsten habe ich keine besonderen Auffälligkeiten, außer vielleicht diesen Eintrag aus der Ereignisanzeige:
1723151423667.png

Das macht nicht besonders viel Sinn, da die Temperaturen hier weit von kritischen Zuständen sind. Aber ich habe ehrlich auch nicht besonders viel Ahnung.
3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
Stresstests mit HWinfo, Prime95, TimeSpy -> keine Problem, läuft stabil
MemTest -> keine Fehler
Radeon Adrenalin geupdatet -> keine Ändeung
Chipsatztreiber (von Gigabyte) -> keine Änderung
Chipsatztreiber (von AMD) -> keine Änderung
Gigabyte BIOS 16c - 18b -> keine Änderung
BIOS Standardeinstellungen -> keine Änderung
Global C-States deaktivier -> keine Änderung
PBO deaktiviert -> keine Änderung
SoC auf 1.2V -> keine Änderung
C-States, PBO und 1.2V -> keine Änderung
CPU ausgetauscht (Garantie ;) ) -> keine Änderung
Windows Neuinstallation -> keine Änderung
Netzteil getauscht (vom Freund 650 Watt) -> keine Änderung
Mainboard getauscht (Neu bestellt) -> keine Änderung
minimal Setup, nur NVME (keine Sata usw.), nur ein Monitor, Maus und Tastatur -> keine Änderung
RAM durch getauscht und mit einzelnen Riegeln -> keine Änderung
Temperaturen sehen top aus:
CPU: 28 - 65°C
GPU: 42 -80°C
Lüfterkurve ist ein bisschen kacke aber sonst keine Auffälligkeiten

Und das schlimmste ist, der PC war bei einem "Profi".....konnte ebenfalls keinen Fehler finden (mehr oder weniger weil der Fehler so schlecht nachzustellen ist)
 
Wieviele RAM-Module sind verbaut und mit welchen Einstellungen werden sie betrieben?
 
4x8Gb
Mit und ohne XMP getestet. Das währen dann 3200 bzw. 2666 MHz glaube ich. Bin nicht daheim, kann es nicht nachschauen.
 
Genaue Bezeichnung der Ram Module, GSkill hat auch die tollen Aegis.

Memtest mit Memtest 86+ oder mit Windows?

Edit: 4x8Gb, mal mit 2*8 getestet?
 
Zuletzt bearbeitet:
Hallo, hast du mal das BIOS geupdatet?
 
  • Gefällt mir
Reaktionen: areiland
TakatoDBanx schrieb:
minimal Setup, nur NVME (keine Sata usw.), nur ein Monitor, Maus und Tastatur -> keine Änderung
Das ist schonmal ein gutes Vorgehen.
Es bleiben bei dir ja eigentlich nur noch RAM, Grafikkarte und SSD übrig.

TakatoDBanx schrieb:
und nun ständig.
Das ist eigentlich gut, das macht die Fehlersuche einfacher. Besser, als jedes Mal 1 Woche warten zu müssen.
Ich würde genau diese Teile der Reihe nach tauschen.
  1. RAM
  2. Grafikkarte
  3. SSD
 
Gigabyte BIOS 16c - 18b, diese und da zwischen
Ergänzung ()

SSD ist mittlerweile auch neu. Die wird es also eher nicht sein. Und RAM Module hatte ich ja zumindest untereinander getauscht und auch zwischenzeitlich nur mit 1 und 2 Modulen betrieben.
Also die Grafikkarte ja....?
 
Nur mal 2 RAM-Module in Slot 2+4
Sollte jetzt kein Beinbruch sein, ne Zeit lang nur 16GB zu nutzen.

Noch besser wäre natürlich 2x16GB NICHT-AEGIS
 
  • Gefällt mir
Reaktionen: TakatoDBanx
Sorry, erst nach dem Post gesehen... Steck auch mal die PCIe Stecker, die zur Grafikkarte gehen auf einen anderen Port am Netzteil
 
teste mal das minimalsetup außerhalb vom Gehäuse um wackler oder kurzschlüsse auszuschließen, bspw Front io / Power Button

der RAM ist Samsung B-die. Wenn die 4 Module nicht aus dem selben kit sind, könnte das ggf. auch ein Problem sein. Samsung B die lässt sich zwar gut übertakten und tunen, aber kann schon auch mal zickig werden, vorallem wenn die Module warm werden oder verschiedene Kits gemischt werden, das Board irgendwo ein timing falsch setzt oder so.

falls das gemischte Kits sind, such dir anhand vom Aufkleber ein Pärchen zusammen, aktiviere XMP, nimm den takt manuell runter und gib dem ram 1.4v vdimm. vsoc kannst du auf 1.05v stellen.
 
Ich vermute inkompatiblen RAM. Hatten vor Jahren mal einen Rechner in der PC-Werkstatt mit unerklärlichen Reboots. Es wurde der RAM aufgerüstet (vollbestückung), welcher nicht kompatibel war. Da die Reboots kaum reproduzierbar waren und Memtest auch keine Fehler erkannte war die Fehlersuche entsprechend frustrierend.
 
  • Gefällt mir
Reaktionen: DiedMatrix
coolyhat schrieb:
also bei mir hat geholfen im Bios die Dummy-Last zu aktivieren.
OK, klingt interessant, werde ich mal testen
LynxRK schrieb:
Sorry, erst nach dem Post gesehen... Steck auch mal die PCIe Stecker, die zur Grafikkarte gehen auf einen anderen Port am Netzteil
Drei Stecker muss ich nutzen und aktuell habe ich alle drei auf verschiedenen Lanes. Oder was meinst du
 
Erinnert mich an eine alte Story in der c't, da ging der PC spontan aus wenn sich der Besitzer auf seinen Stuhl gesetzt hat oder aufgestanden ist. Schuld waren damals falsch angeschlossene Kabel vom Front Panel in Verbindung mit hoher statischer Aufladung durch Boden, Teppich, Stuhlbezug oder so.

Hatten wir hier auch hier schon mal so ähnlich, da war es ein schlecht abgeschirmtes DisplayPort-Kabel in Verbindung mit statischer Aufladung durch den Bürostuhl.
 
Wenn man mal nach der Thermalzone "\_TZ.UAD0" sucht, findet man diverse ähnlich Meldungen, ebenfalls mit Gigabyte Aorus Boards.
Eventuell ein Sensorfehler auf dem Board?
 
Gerne testen ich nochmal das minimal Setup und die RAM Module. Die Module wurden in jeweils Zwei Kits aber auf einmal bestellt. Diese sind auch schon von Anfang an verbaut.
 
chatbot schrieb:
hoher statischer Aufladung durch Boden, Teppich, Stuhlbezug oder so.
Das wäre ein Albtraum
kartoffelpü schrieb:
Wenn man mal nach der Thermalzone "\_TZ.UAD0" sucht, findet man diverse ähnlich Meldungen, ebenfalls mit Gigabyte Aorus Boards.
Eventuell ein Sensorfehler auf dem Board?
War auch meine Vermutung, ein neues Board hätte das Problem nicht gelöst. Eins von AsRock, hab ich wieder zurückgeschickt
 
  • Gefällt mir
Reaktionen: coxon
Zurück
Oben