PC plötzlich im BIOS, verdacht auf SSD Überhitzung

lolum

Cadet 2nd Year
Registriert
März 2008
Beiträge
31
Hi

Ich habe einen neuen PC gebaut und alles lief gut.

Nach einigen Tagen (also heute), spielte ich Satisfactory und ging schnell vom PC weg. Als ich zurück kam, war ich im BIOS und auf dem Mainboard leuchtete die "BOOT" LED. Ich stellte auch fest, dass die SSD nicht mehr erkannt wurde. Nach einem Neustart ging aber alles wieder.

Danach habe ich die Temperaturen etwas überwacht und gesehen, dass die SSD je nach Anwendung zwischen 58°C und 65°C war (je nach Anwendung). Das war auch kein Stresstest, sondern einfach ein beobachten währen dem normalen Betrieb. Meine SSD sollte laut Spezifikationen maximal 70°C werden. Es ist also gut möglich, dass die SSD einfach zu heiss wurde.

Ich habe die Samsung 990 Pro 4 TB und die ist auch etwas eingeklemmt zwischen CPU und GPU. Die Belüftung ist da bestimmt nicht so toll. Zudem konnte ich nicht den Mainboard Kühler nutzen, weil die SSD bereits ein Heatsink hat.

Mein System:
Mainboard: MSI MPG B650 Edge WIFI
CPU: AMD Ryzen 9 7950X3D
CPU Kühler: Arctic Liquid Freezer III - 240
RAM: G.Skill Trident Z5 Neo 2x32 GB EXPO
Case: NZXT H9 Flow (weiss)
PSU: Corsair RM750x
GPU: Gigabyte GeForce RTX 4070 SUPER WINDFORCE OC (12 GB)
SSD: Samsung 990 Pro mit Heatsink (4000 GB, M.2 2280)
OS: Windows 11

Ich weiss nicht genau, was das beste vorgehen ist. Ich habe praktisch keinen Platz und durch die Bauart des Gehäuses (Glasfront) kann von vorne keine Luft zugeführt werden.

Es überrascht mich auch, dass eine SSD so heiss wird, ist das normal?

Hoffe ihr könnt mir ein paar gute Ratschläge geben :)
 

Anhänge

  • 001.jpg
    001.jpg
    183,8 KB · Aufrufe: 131
Glaub nicht das es ab der ssd lag. Normal würde die sich auch drosseln.
weiter beobachten.
Was sagt der Zuverlässigkeitsverlauf?
automatischen Neustart deaktivieren, damit du die Meldung (bluescreen) siehst.
 
  • Gefällt mir
Reaktionen: lolum, Schwobaseggl und madmax2010
Joa m.2 nvme ssds werden gut warm zwischen GPU und CPU. Meine lexar 790 Ebenfalls.
Was du machen kannst,
- Zuverlässigkeitsverlauf checken.
-smart werte checken.
-sollte die SSD wirklich zu warm werden, testweise Seitenteil offen lassen und Ventilator drauf blasen lassen.

Ich glaube aber nicht das es an der m.2 lag.
 
  • Gefällt mir
Reaktionen: lolum
Ein Foto mit Blitz wäre hilfreicher als die RGB Beleuchtung. :)

Der Kühler ist nicht groß, aber er sollte ausreichen und die Temps sind auch im Rahmen.
 
  • Gefällt mir
Reaktionen: lolum
Die Zuverlässigkeitsüberwachung sagt, dass zur Ereigniszeit Windows nicht Ordnungsgemäss heruntergefahren wurde. Die anderen Fehlermeldungen bei den anderen Tagen hängen mit Bildschirmproblemen zusammen und haben damit wohl nichts zu tun.
Screenshot 2024-12-26 224803.png

In der Ereignisanzeige habe ich während dieser Zeit einen kritischen Fehler gefunden:
002.png

Automatischer Neustart habe ich jetzt deaktiviert.

S.M.A.R.T scheint in Ordnung zu sein.

Auf der SSD ist der passive Kühler ab Werk drauf:
SAMSUNG_990_PRO_Heatsink_4_TB__SSD@@100011356_30.jpg

Kann es sein, dass es Probleme mit der Stromversorgung gab? Es hängen schon viele Geräte an nur einer Steckdose.
 
@lolum Temps nicht nur mit CDI prüfen, denn das zeigt nur die Temp vom Nand. Nimm HWinfo64 Sensorstab, Laufwerkstemp 3 ist die Temp vom Controller, der kann noch viel heißer werden als der Nand.
Die 70 max ° bezieht sich auf den Nand. Der Controller kann unter Vollast über 90° gehen, drosselt noch nix. Ist gefährlich. Besser drauf achten.
 
  • Gefällt mir
Reaktionen: lolum
lolum schrieb:
Kann es sein, dass es Probleme mit der Stromversorgung gab? Es hängen schon viele Geräte an nur einer Steckdose.
Mit den Geräten an der Steckdose kann das nicht zusammenhängen, außer du kannst irgendwo Funkenbildung beim Einstecken oder Abziehen von Steckern beobachten. Dann rate ich dringend die Leiste zu tauschen.

Wenn sich PCs einfach so ausschalten, ist die Wahrschenlichkeit recht hoch, dass dies mit dem Netzteil zusammen hängt. Hast du alle Kabel und Stecker noch mal geprüft? :)
 
  • Gefällt mir
Reaktionen: lolum
Jetzt ist einige Zeit vergangen und ich habe täglich Abstürze. Meistens einer, manchmal aber auch drei. Die Abstürze passieren ziemlich zufällig. Manchmal beim Zocken und auch schon mehrmals während ich weg war und der PC einfach nur ohne Belastung lief. Manchmal kommt ein Bluescreen und der ist auch verschieden. Oft habe ich aber ein Blackscreen.

Ein Bluescreen habe ich manchmal mit dem Stopcode MEMORY_MANAGEMENT und ein anderer mit UNEXPECTED_STORE_EXCEPTION.

Stecker habe ich geprüft.

Hier ein Bild, wie die Temperaturen nach einem Absturz aussehen:
Screenshot 2025-01-06 011414.png

Ich habe auch in einem Spiel, was bisher immer Problemlos lief, plötzlich "Memory could not be read" Abstürze (muss kein Zusammenhang haben):
Screenshot 2025-01-13 165937.png

Im Anhang ist ein HWMonitor Report, direkt nach einem Absturz.

Jetzt werde ich mal ein Memtest vorbereiten.

Wer hat eine Idee?
 

Anhänge

Poste Infos zu den Bluescreens (BluescreenView oder Win DBG), oder lade die dumps hoch.
Prüfe Speicher und Datenträger, wenn noch nicht geschehen, und kontrolliere die Ereignisanzeige.
 
  • Gefällt mir
Reaktionen: lolum
Ich hab nur 3 Minidump Files gefunden. Memtest86 liess ich 10 Stunden laufen mit dem Ergebnis 7 Passes und 0 Errors. SSD habe ich mit Samsung Magician gescannt ohne Erfolg. Jedoch habe ich noch nicht den sehr langen kompletten Scan gemacht.

Bluescreens bekomme ich häufig andere, bisher diese:
  • MEMORY_MANAGEMENT
  • UNEXCEPTED_STORE_EXCEPTION
  • NTFS_FILE_SYSTEM
  • SYSTEM_SERVICE_EXCEPTION
  • CRITICAL_PROCESS_DIED
  • SYSTEM_SERVICE_EXCEPTION
Minidump Files:
https://drive.google.com/file/d/14sviaGT--vXxO3hXkLO_Qh-z2C7C0B9c/view?usp=drive_link

In der Ereignisanzeige sehe ich, dass ich seit dem 24.12.24 im ganzen 22 Bluescreens hatte.

Screenshot 2025-01-24 111437.png

Hier sind weitere Informationen vom Bluescreen von heute Morgen:
Protokollname: System
Quelle: Microsoft-Windows-Kernel-Power
Datum: 24.01.2025 10:39:03
Ereignis-ID: 41
Aufgabenkategorie:(63)
Ebene: Kritisch
Schlüsselwörter:(70368744177664),(2)
Benutzer: SYSTEM
Computer: DESKTOP-1K8NM4S
Beschreibung:
Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde.
Ereignis-XML:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
<Provider Name="Microsoft-Windows-Kernel-Power" Guid="{331c3b3a-2005-44c2-ac5e-77220c37d6b4}" />
<EventID>41</EventID>
<Version>10</Version>
<Level>1</Level>
<Task>63</Task>
<Opcode>0</Opcode>
<Keywords>0x8000400000000002</Keywords>
<TimeCreated SystemTime="2025-01-24T09:39:03.0704039Z" />
<EventRecordID>9709</EventRecordID>
<Correlation />
<Execution ProcessID="4" ThreadID="8" />
<Channel>System</Channel>
<Computer>DESKTOP-1K8NM4S</Computer>
<Security UserID="S-1-5-18" />
</System>
<EventData>
<Data Name="BugcheckCode">59</Data>
<Data Name="BugcheckParameter1">0xc0000006</Data>
<Data Name="BugcheckParameter2">0x0</Data>
<Data Name="BugcheckParameter3">0x0</Data>
<Data Name="BugcheckParameter4">0x0</Data>
<Data Name="SleepInProgress">0</Data>
<Data Name="PowerButtonTimestamp">0</Data>
<Data Name="BootAppStatus">0</Data>
<Data Name="Checkpoint">16</Data>
<Data Name="ConnectedStandbyInProgress">false</Data>
<Data Name="SystemSleepTransitionsToOn">1</Data>
<Data Name="CsEntryScenarioInstanceId">2</Data>
<Data Name="BugcheckInfoFromEFI">true</Data>
<Data Name="CheckpointStatus">0</Data>
<Data Name="CsEntryScenarioInstanceIdV2">2</Data>
<Data Name="LongPowerButtonPressDetected">false</Data>
<Data Name="LidReliability">false</Data>
<Data Name="InputSuppressionState">0</Data>
<Data Name="PowerButtonSuppressionState">0</Data>
<Data Name="LidState">3</Data>
<Data Name="WHEABootErrorCount">0</Data>
</EventData>
</Event>

Hier sehr ihr, was vor und nach dem Bluescreen passiert:
Screenshot 2025-01-24 112508.png

Im Geräte Manager habe ich ein Unbekanntes PCI Gerät gefunden:
Screenshot 2025-01-24 113314.pngScreenshot 2025-01-24 113537.png

Habt ihr eine Idee?
 
Kernel Power 41 deutet es hin dass dein Netzteil nicht in Ordnung ist, was für ein Netzteil hast du denn und wie alt? Und was sagt der CrystalDiskInfo zu deinen Zustand SSD?
 
  • Gefällt mir
Reaktionen: lolum
CrystalDiskInfo sagt, dass alles perfekt ist. Ausser die 21 unerwarteten Abstürze. Diese passen zu den Bluescreens und ich denke sie sind eine Folge davon und nicht die Ursache:
----------------------------------------------------------------------------
CrystalDiskInfo 9.5.0 (C) 2008-2024 hiyohiyo
Crystal Dew World: https://crystalmark.info/
----------------------------------------------------------------------------

OS : Windows 11 Pro 24H2 [10.0 Build 26100] (x64)
Date : 2025/01/24 12:25:56

-- Controller Map ----------------------------------------------------------
- Standardmäßiger SATA AHCI- Controller [ATA]
- Standardmäßiger SATA AHCI- Controller [ATA]
- Microsoft-Controller für Speicherplätze [SCSI]
+ Standardmäßiger NVM Express-Controller [SCSI]
- Samsung SSD 990 PRO with Heatsink 4TB

-- Disk List ---------------------------------------------------------------
(01) Samsung SSD 990 PRO with Heatsink 4TB : 4000.7 GB [0/2/0, sq] - nv

----------------------------------------------------------------------------
(01) Samsung SSD 990 PRO with Heatsink 4TB
----------------------------------------------------------------------------
Model : Samsung SSD 990 PRO with Heatsink 4TB
Firmware : 4B2QJXD7
Serial Number : 000000000000000 (von mir unkenntlich gemacht)
Disk Size : 4000.7 GB
Interface : NVM Express
Standard : NVM Express 2.0
Transfer Mode : PCIe 4.0 x4 | PCIe 4.0 x4
Power On Hours : 2820 Std.
Power On Count : 357 mal
Host Reads : 24029 GB
Host Writes : 18274 GB
Temperature : 39 C (102 F)
Health Status : Gut (100 %)
Features : S.M.A.R.T., TRIM, VolatileWriteCache
Drive Letter : C:

-- S.M.A.R.T. --------------------------------------------------------------
ID RawValues(6) Attribute Name
01 000000000000 Critical Warning
02 000000000138 Composite Temperature
03 000000000064 Available Spare
04 00000000000A Available Spare Threshold
05 000000000000 Percentage Used
06 00000300F34E Data Units Read
07 00000248C6E3 Data Units Written
08 00001BE85617 Host Read Commands
09 000012762169 Host Write Commands
0A 000000000432 Controller Busy Time
0B 000000000165 Power Cycles
0C 000000000B04 Power On Hours
0D 000000000015 Unsafe Shutdowns
0E 000000000000 Media and Data Integrity Errors
0F 000000000000 Number of Error Information Log Entries

-- IDENTIFY_DEVICE ---------------------------------------------------------
0 1 2 3 4 5 6 7 8 9
000: 144D 144D 3753 5344 4A4E 5730 3043 3536 3230 204C
010: 2020 2020 6153 736D 6E75 2067 5353 2044 3939 2030
020: 5250 204F 6977 6874 4820 6165 7374 6E69 206B 5434
030: 2042 2020 4234 5132 584A 3744 3802 0025 0900 0001
040: 0000 0002 0D40 0003 9680 0098 0200 0000 0010 0000
050: 0000 0000 0000 0000 0000 0100 0000 0000 0000 0000
060: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
070: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
080: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
090: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
100: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
110: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
120: 0000 0000 0000 0000 0000 0000 0000 0000 0017 0307
130: 2F16 043F 0101 0163 0166 0000 0000 0000 0000 0000
140: 6000 817D 03A3 0000 0000 0000 0000 0000 0000 0000
150: 0000 0000 0000 0000 0000 0000 0000 0000 0023 0000
160: 0000 0001 013E 0164 0003 6000 0000 0000 0000 0000
170: 0001 0000 0000 0000 0000 0000 0000 0000 0000 0000
180: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
190: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
200: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
210: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
220: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
230: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
240: 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
250: 0000 0000 0000 0000 0000 0000

-- SMART_NVME --------------------------------------------------------------
+0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
000: 00 38 01 64 0A 00 00 00 00 00 00 00 00 00 00 00
010: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
020: 9C F3 00 03 00 00 00 00 00 00 00 00 00 00 00 00
030: 2E C7 48 02 00 00 00 00 00 00 00 00 00 00 00 00
040: 62 60 E8 1B 00 00 00 00 00 00 00 00 00 00 00 00
050: 4E 29 76 12 00 00 00 00 00 00 00 00 00 00 00 00
060: 32 04 00 00 00 00 00 00 00 00 00 00 00 00 00 00
070: 65 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00
080: 04 0B 00 00 00 00 00 00 00 00 00 00 00 00 00 00
090: 15 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0A0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0B0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0C0: 00 00 00 00 00 00 00 00 38 01 3F 01 00 00 00 00
0D0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0E0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0F0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
100: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
110: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
120: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
130: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
140: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
150: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
160: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
170: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
180: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
190: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1A0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1B0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1C0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1D0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1E0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
1F0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
Netzteil ist ein Corsair RM750x, gekauft am 21.12.2024.

EDIT: Habe jetzt einige AMD Treiber installiert und das unbekannte Gerät im Geräte Manager ist weg.
EDIT2: Habe das BIOS auf die neuste Version geupdatet.
 
Zuletzt bearbeitet:
lolum schrieb:
Die brauchen Genehmigung. Steck die bitte in ein ZIP-Archiv, und lade es hier hoch.
lolum schrieb:
n der Ereignisanzeige sehe ich, dass ich seit dem 24.12.24 im ganzen 22 Bluescreens hatte.
Da müsstest du nach "BugCheck" suchen. "Kernel Power" sagt nur dass der Rechner aus ging, ohne Heruntergefahren worden zu sein.
lolum schrieb:
Habe jetzt einige AMD Treiber installiert und das unbekannte Gerät im Geräte Manager ist weg.
Chipsatztreiber sind sehr wichtig, wenn's das war. Du solltest da schon explizit schreiben, WAS installiert wurde, woher, und in welcher Version.
aktuell für AM4/B650 und Win 10/11: 6.10.17.152 vom 21. Oktober
und BIOS 7E10v1I vom 07. Januar sollte installiert sein. -> Downloads

PS mir scheint dass der Speicher noch gar nicht mit memtest86 getestet wurde!? :o
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: lolum
Habe das Zip jetzt hier hochgeladen.

BugCheck habe ich bisher noch nicht gefunden in der Ereignisanzeige.

Ich habe diese hier installiert. Ich weiss aber nicht, welche/r der fehlende war oder warum vorher das unbekannte Gerät im Geräte Manager war. Danach wars auf jeden Fall weg.
Screenshot 2025-01-24 123738.png
Hab jetzt noch den AMD NPU Treiber installiert von deinem Link.

Ja ich habe BIOS 7E10v1I installiert. Vorher hatte ich die letzte Stable Version, die Betas habe ich nicht angefasst.

Memtest86 habe ich gemacht:
lolum schrieb:
Memtest86 liess ich 10 Stunden laufen mit dem Ergebnis 7 Passes und 0 Errors.
 

Anhänge

Kaspersky Software? Deinstallieren, und testen ob sich was geändert hat.
Unity.exe? Kann das vlt für Probleme sorgen?
Eine saubere Windows Neuinstallation, ganz OHNE unnötigen Kram, wäre noch besser.

Nach Netzteil-Problem sieht mir das jedenfalls nicht aus.
Testen kannst du aber trotzdem ein anderes, falls verfügbar. Und mach' Praxistests mit einzelnen DIMMs, auf verschiedenen Slots.
 

Anhänge

  • Gefällt mir
Reaktionen: lolum
lolum schrieb:
BugCheck habe ich bisher noch nicht gefunden in der Ereignisanzeige.
Unwahrscheinlich, dass es keine gibt, bei so vielen, unterschiedlichen Bluescreens. Filtern nach "Quelle = ..."

Ereignisanzeige_Filter_BugCheck_Windows-10-22H2_2025-01-26.png
 
  • Gefällt mir
Reaktionen: lolum
Stell im Energiesparplan unter PCIe auf maximal Stromsparen. Das erlaubt es der SSD in den Sleepmodus zu gehen. Windows verhindert das normalerweise.
Kostet keine Leistung. Senkt die Temperatur.

IMG_0348.png

Vorher
IMG_0350.png

Nachher
IMG_0349.png
 
  • Gefällt mir
Reaktionen: lolum und Schwobaseggl
Betriebssystem ist Windows 11 24H2? Dann unbedingt das Mainboard-Bios aktuell halten und die Firmware der NVMes auch. Nach meinen Erfahrungen reagiert die 24H2 darauf sehr empfindlich. Um die Temperatur der NVMes zu senken einfach den Grafikkartenlüfter laufen lassen - also den ZFM der Graka deaktivieren. Das reicht meist schon um die NVMes mit zu kühlen.
 
  • Gefällt mir
Reaktionen: lolum
Zurück
Oben