Wie analysiere ich unexpected shutdowns bzw. Blackscreens? / Gigabyte B650E AORUS Master "geht aus".

Sweepi

Commander
🎂Rätsel-Elite ’12
Registriert
Sep. 2009
Beiträge
2.082
Hi Forum,



Die Lage:
nach einen BIOS-Update ist mein bis dahin rockstable PC instabil geworden.
Instabil heist: Während oder kurz nach dem Hochfahren geht das Display auf schwarz,
Lüfter von CPU und GPU drehen weiter (auf idle Geschwindigkeit), die 7 Segmente Anzeige des Mainboards erlischt (Steht im normalen Betrieb ansonsten auf "AA"). Der Rechner muss am NT(Netzteil) ausgeschaltet werden, Power-Button gedrückt halten hat keine Auswirkung.

Wenn ich weiterem Verlauf von crashen, Absturz, shutoff, etc. spreche meine ich genau dieses Verhalten. Ich meine nie eine andere Art von Fehlverhalten, wie z.B. einen Freeze oder Bluescreen.

Vor dem BIOS Update (von Version 7a auf Version 8d) hatte genau ich 0 crashes/shutoffs.

Was habe ich gemacht?
  • RAM gewechselt (siehe Timeline)
  • PBO abgestellt (war nach dem BIOS-Update ungewollt aktiv)
  • EXPO Profil gewechselt (6000 -> 5600, gleiche Timings in Taktzyklen, also "more loose" Timings in ns)

Das Verhalten ist jetzt "unter Kontrolle" aber nicht behoben, vor allem klappt der erste Boot fast nie.

Die Frage:
Wie würdet ihr dieses Problem analysieren?
Wenn nur mehr Stabilität das Ziel ist, wäre der nächste Schritt auf BIOS 7a downzugraden, auf den alten RAM zu wechseln, und dann, wenn das System stabil erscheint, wieder auf den neuen RAM zu wechseln. Wenn es dann weiterhin keine Probleme gibt, ist BIOS Version 8d als Verursacher isoliert. Das könnte man dadurch bestätigen, wenn nach einem erneuten BIOS Update die gleichen Probleme auftreten.
Mir geht allerdings nicht aus dem Kopf, dass PBO nach dem Update ungewollt aktiv war, was zur Instabilität beitragen hat. Vllt übersehe ich ja noch ein anderes Setting?!
Wo/Wie nachvollziehen, was den "shutoff" auslöst? Nehme an im Event-Viewer gibt es nichts, wenn es "direkt von der Hardware" kommt.



  • Ich plane auf 64 GiB RAM upzugraden
  • Zunächst will ich auf 64 GiB ECC updaten, aber er stellt sich raus, das Gigabyte ECC RAM auf AM5 nicht supportet, es gibt zwar BIOS updates für "ECC support", damit meint Gigabyte allerdings, dass das MB jetzt mit ECC-Sticks bootet, aber weiterhin die ECC-Funktionalität nicht unterstützt wird.
  • Ich bestelle 64 GiB RAM ohne ECC
  • RAM kommt an
  • Ich hatte das BIOS update bereits vorbereitet, und spiele es ein (zumal ich das HwInfo feature ausprobieren möchte)
    -- Performance optimized for Ryzen 7000X3D series processors
    -- Support GIGABYTE BIOS Settings feature under HWiNFO64 (https://www.gigabyte.com/Press/News/2101)
  • ich stelle meine vorherigen Settings (XMP an, Virtualisierung an, ...)
  • nach dem Update schafft der Rechner es Windows zu booten, schmiert dann aber ab.
  • Ich bin irritiert, wechsel dann aber den RAM (schließlich ist in 30 Minuten BG3 Runde!)
  • Rechner ist sehr instabil (kommt entweder nicht ins Windows oder stürzt nach 1-2 minuten ab)
  • Ich stelle fest, dass PBO an ist (vor dem BIOS-Update war es definitiv aus), und schalte es ab
  • Rechner wesentlich stabiler
  • am nächsten tag wechsele ich das EXPO-Profil von DDR5-6000 auf DDR5-5600
  • Rechner definitiv wesentlich stabiler aus Ausgangslage, und keinerlei Probleme im Betrieb, allerdings hat das erste Hochfahren am Tag eine 50/50 zu funktionieren, und einmal ist der Rechner direkt nach dem Hochfahren abgeschmiert, als ich in Discord auf einen Text channel geklickt habe.


Um Fragen vorweg zu nehmen:
1. Mit ECC Ram meine ich "richtigen" ECC RAM, nicht "on-die ECC", was jeder DDR5 RAM verbaut hat.
2. Ich glaube nicht, dass das NT zu schwach ist. Vor dem Wechsel auf die 4090 habe ich eine 3090@480W (https://www.techpowerup.com/vgabios/227466/asus-rtx3090-24576-201117) ohne Probleme betrieben (für Benchmarks und Stresstests, in Spielen dann @Default). Zudem tritt das Problem genau zeitlich mit BIOS/RAM Wechsel auf, und diese sollten keine relevante Mehrbelastung für das NT darstellen.
 
Zuletzt bearbeitet:
Sweepi schrieb:
insbesondere klappt der erste Boot fast nie.
  • Ist damit bloß Windows gemeint oder kommst du da nicht mal ins BIOS?
  • Wie ist die Grafikkarte mit dem Netzteil verkabelt?
  • Auch schon gänzlich ohne XMP (oder sogar nur ein Riegel in A2) und/oder ohne Grafikkarte probiert?
 
  • Gefällt mir
Reaktionen: Baal Netbeck
  • Gefällt mir
Reaktionen: Sweepi
Drewkev schrieb:
Ist damit bloß Windows gemeint oder kommst du da nicht mal ins BIOS?
Bevor meine Displays aufgewacht sind, wechselt der PC in dem oben beschrieben "Modus" (Lüfter drehen, kein Display, keine MB-Segmentanzeige). Wie weit der Rechner kommt, kann ich nur raten, könnte bei nächsten Mal die Bildschirme vorher anstellen...

Grafikkarte Verkablung ist unverändert.

Ich meine mindestens ein Boot zwischendurch war ohne XMP und ist gecrasht (war aber evtl mit PBO...)
 
Vom Netzteil gehen 3 Kabel Richtung GPU, davon 2 custom Kabel, die in 1x PCIe-12V-8-Pin enden, und ein original Kabel vom Netzteil, welches in 2x PCIe-12V-8-Pin mündet. Alle 4 8-Pin Anschlüsse sind am mit der GPU mitgelieferten Adapter angeschlossen, und das PCIe-12V-12-Pin Ende des Adapters dann wiederum an die GPU.
Ergänzung ()

@Rickmer

In %SystemRoot% (C:\Windows) liegt kein einziger Dump
1698065386439.png



Edit: In C:\Windows\Minidump auch nicht:

C:\Windows\Minidump>dir
Volume in drive C has no label.
Volume Serial Number is xxxx-xxxx

Directory of C:\Windows\Minidump

17/12/2021 21:29 <DIR> .
17/12/2021 21:29 <DIR> ..
0 File(s) 0 bytes
2 Dir(s) 91.080.343.552 bytes free

C:\Windows\Minidump>
 
Für dein RAM-Problem

Slots A2 und B2 nutzen

Fast Boot im Bios ausmachen
Expo Profil laden oder manuell 6.000MHz einstellen (manuell funktioniert meist besser)
FCLK auf 2000MHz (bei 6000MHZ Modulen)

VDDSOC Voltage 1.25V
VDDIO/MC Voltage 1.35V (1,40V)
DRAM VDD Voltage 1.35V (1,40V)

Da du jetzt Dual-Rank Module hast, anstatt Single-Rank Module kannst und solltest du die Ram Voltage etwas erhöhen bis 1,40V (Werte in Klammern). Würde da mit 1.37-1.38V anfangen.

Obwohl es mit dem Netzteil vorher funktioniert hat, muss es nicht mehr funktionieren.

Würde erst das RAM-Problem beseitigen und schauen ob es ausreicht.
 
  • Gefällt mir
Reaktionen: Sweepi
gekauft
 
@NameHere

Bin mir unsicher, ob es überhaupt ein RAM-Problem gibt.
Guter Hinweis zu Dual-Rank/Single Rank.

HW-Info Sagt "Number of ranks" = 2, ergo Dual-Rank?

1698065867532.png



@Drewkev

Bei cablemod.com, über den Configurator.
Kann man nicht verlinken(?), im Configurator kann man mein Netzteil (Corsair SF750 Platinum) auswählen, das habe ich auch bei der Bestellung gemacht.
 
Übersehe ich etwas?:

1698066304175.png


Screenshot mit aktueller CPU-Z Version:

1698066444428.png
 
Wo?

1698066475269.png
 
2.08 habe ich gerade von cb runtergeladen
 
Sweepi schrieb:
Corsair SF Series Platinum SFX 750
Welches Adapter nutzt du für RTX 4090?
Geh je nachdem mit 3 separaten Kabel ans Netzeil, an jeweils einen PCIe Anschluss.
Deaktiviere CSM im BIOS und aktivere den (Ultra)Fastboot,
sodass der UEFI-GOP (Graphics Output Protocol) Treiber geladen wird.
Windows muss hierfür aber im UEFI (GPT) Modus installiert sein.

NameHere schrieb:
Fast Boot im Bios ausmachen
Keine gute Empfehlung das VBios der GPUs in den Legacy Modus zu zwingen.
Erst mit dem schnellsten Fastboot wird sicherlich der UEFI-GOP Treiber geladen
Ergänzung ()

Schalte den Windows Schnellstart noch aus:
"Schnellstart unter Windows 10 deaktivieren"
Ergänzung ()

Ich beziehe mich hauptsächlich darauf:
Sweepi schrieb:
Während oder kurz nach dem Hochfahren geht das Display auf schwarz,
Lüfter von CPU und GPU drehen weiter

Und in der Regel kann man ein BIOS auch zurückflashen "Downdate",
z.B. auf die Version wo es keine Probelme gab bei dir.
Sollte ein "Downdate" nicht möglich sein, gibt es Hinweise darauf bei den BIOS Downloads.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Sweepi
Ich habe gedacht es wären Samsung IC verbaut, aber anscheinend sind es Hynix IC mit geraden Timings.

Du musst was ich oben gepostet habe im Bios durchführen. Vorher macht alles kein Sinn.
 
Zurück
Oben