Unregelmäßig Problematik: Schwarze Bildschirme und/oder Hochdrehen der Lüfter, bereits einige Lösungsversuche durch andere Threads erfolgt.

Varesha

Cadet 2nd Year
Registriert
Apr. 2023
Beiträge
26
Wie bereits im Titel beschrieben, habe bereits einige Threads hier gelesen und abgearbeitet, jetzt komme ich jedoch nicht mehr weiter.

Fehlerbeschreibung, soweit möglich kurz gehalten:

  • Unregelmäßige Problematik: Schwarze Monitore und Hochdrehen aller Lüfter (GPU + Case + CPU), Sound noch hörbar, dann hilft nur noch das Powerbutton 5 sek drücken
  • Unregelmäßige Problematik: Schwarze Monitore und KEIN hochdrehen der Lüfter, Sound noch hörbar, dann hilft ebenso nur noch den Powerbutton 5 sek drücken
--> PC fährt anschließend normal hoch. Manchmal sehe ich kein Bild am Monitor, kann aber das Passwort blind eingeben und Windows startet, mit Sound. Kann dann zb. über das Stream deck HWIinfo starten und Temperaturen, usw. sehen. (Am Streamdeck hab ich dafür Anzeigen erstellt)

Wann tritt Problematik auf?
Beim Gamen (V-Rising, PoE), im Idle, Bei Workstation arbeiten Excel, Word, Photoshop, Surfen, Youtube, etc.
Wie bereits gesagt -> Keine Regelmäßigkeit / kein Muster zu erkennen

Warum ich jetzt schreibe?
Ich hatte knapp 3 Monate Ruhe, das Letzte mal wie der Fehler aufgetreten ist hatte ich durch Frust den PC zwei Tage in Ruhe gelassen, danach wie besagt Ruhe.

Wissenswertes:

System Informationen


Mainboard - MAG X670E TOMAHAWK WIFI
Betriebsystem - Microsoft Windows 11 Pro 64-Bit Ver.2009 (OS build 22631.3593)
BIOS Version - 1.A0 (vom 04/23/2024)
CPU - AMD Ryzen 7 7800X3D 8-Core Prozessor
RAM - 2x 16 GB DDR5-4800, G Skill Intl F5-6000J3636F16G
GPU - NVIDIA GeForce RTX 4070 Ti (Treiber 555.85)
SSD - KINGSTON SKC3000D2048G
Bildschirme - 2x DELL U2412M über DP/DP

PC Gekauft mit Beratung hier aus dem Forum im April'23.

Einstellungen / Temperaturen / Bios

System nicht übertaktet oder undervoltet.
Temperaturen alle im Normbereich CPU ohne Last bei ~40°C bei Last bis etwa ~74°C, GPU ohne Last bei ~37°C bei Last bis ~55°C, Hotspot ~60°C.
(HWIinfo Protokolle vorhanden)
Da es damals beim Relaese von 7800x3d Probleme mit Durchbrennen etc gab:
VSoC auf 1.0200
Expo nicht aktiviert

Was ist bereits geschehen?

Einige Threads hier im Forum durchforstet, denke kaum dass ich alle erwischt habe jedoch bereits viel erledigt, ich liste mal auf:
  • Nur ein Bildschirm verwendet
  • Andere Monitore verwendet
  • Unterschiedliche Kabel verwendet (DP, HDMI)
  • Tastenkombination: WinTaste + Strg + Shift + B (kurzer Piepton - nichts passiert)
  • Display Kabel Tausch, sowie verwenden von DP und / oder HDMI
  • Neuinstallation / Update von Treibern: GPU, Chipsatz
  • Neuinstallation des Grafiktreibers im abgesicherten Modus mit DDU
  • Ausbau / Neueinsetzen von GPU, RAM, Überprüfung der Kontakte auf Ablagerungen an Pins, etc.
  • Überprüfung von allen angesteckten Kabeln am MB, GPU
  • tägliche logs mit HWIinfo, Programm läuft immer im Hintergrund und ist das erste was ich starte.
  • check von Zuverlässigkeitsverlauf u.a. mit folgenden Problemen und "Lösungen"
- 1. Problemereignisame: APPCRASH
- Anwendungsname: CC_Engine_x64.exe
->> Autostart von MSI Control center deaktiviert -> Treiber update

- 2. Hardwarefehler - Bluescreen code:133
- Den Bluescreen habe ich nicht wahrgenommen / gesehen, System hat einfach neu gestartet
->> Neuinstallation / Update aller damals 30.5 vorhandener neuer Treiber

- 3. Hardwarefehler - LiveKernelEvent 1a8
->> Check der Updates von GPU / Chipsatz

- 4. Hardwerefehler - LiveKernelEvent 117
->> Überprüfen ob Expo deaktiviert ist: ja


"Interessante Fehler in der Ereignisanzeige"
amd3dvcacheSVC
: Die Beschreibung für die Ereignis-ID "1" aus der Quelle "amd3dvcacheSvc" wurde nicht gefunden. Entweder ist die Komponente, die dieses Ereignis auslöst, nicht auf dem lokalen Computer installiert, oder die Installation ist beschädigt. Sie können die Komponente auf dem lokalen Computer installieren oder reparieren.
CreateHelperUserProcess - WTSQueryUserToken Failed failed with 1008
--> Kein Zusammenhang mit den Schwarzen Monitoren erkennbar / Zeiten Passen nicht zueinander

- Die Beschreibung für die Ereignis-ID "153" aus der Quelle "nvlddmkm" wurde nicht gefunden. Entweder ist die Komponente, die dieses Ereignis auslöst, nicht auf dem lokalen Computer installiert, oder die Installation ist beschädigt. Sie können die Komponente auf dem lokalen Computer installieren oder reparieren.
--> In einem anderen Thread habe ich von einer Ähnlichen Fehlerbeschreibung gesehen und die Lösung dort durchgeführt: Entfernen der zweiten älteren (etwa 3 Monate)nvlddmkm.sys Datei (Erledig am 01.06.24) -> Problem trat danach jedoch erneut auf


Was habe ich bisher noch nicht gemacht?

Vermutlich einiges.
Was mir nicht möglich ist, GPU tauschen, hab keine andere passende hier.


Erstmal vielen Dank fürs durchlesen und für diejenigen die sich diesem Problem annehmen noch ein größeres Danke im Voraus.


PS: Beim Schreiben dieses Artikels kein Auftreten der Problematik
 
Zuletzt bearbeitet:
Hardwerefehler - sehe ich auch so.
- netzteil kaputt, mainboard, ram, cpu?
 
Das mit dem manchmal kein Bild nach dem hochfahren könnte an den dell Displays liegen. Ich hatte vor meinem g2724d einen u2415 und der zeigte manchmal kein Bild an nachdem ich den PC aus dem Ruhezustand geholt hab. Manchmal aber auch nur Farbstreifen wo ich schon dachte meine Grafikkarte wäre kaputt.
Tatsächlich lag beides am Display, da die alten Dells irgendwie Probleme mit Displayport Versionen >1.1 haben.
Seit meinem Upgrade auf den g2724d und der unterstützung von dp1.4 sind beide Probleme weg.

Was du mal probieren kannst ist, mit dem pbo Tool das Offset der Spannungsversorgung für die CPU leicht zu verändern.
Zuerst lässt du dir vom ryzen master Tool sagen welche beiden Kerne die schnellsten sind und diesen gibst du im pbo Tool dann einen positiven Offset von 10
 
Danke für die Kommentare,
@StefanArbe damit komm ich jetzt nicht wirklich weiter
@Rainbowprincess Habe auch mal ein / und oder zwei ältere Monitore angeschlossen mit DP oder auch HDMI, da taucht das selbe Problem dann auf. Mal läuft es nen ganzen Tag ohne Anzeichen, und dann am nächsten Tag beim einschalten wieder schwarze Monitore.

mit dem Tool PBO kenn ich mich nicht wirklich aus, und eine gute allgemein erklärende Anleitung habe ich leider nicht gefunden. Könntest du es vllt näher beschreiben / veranschaulichen? Was ist dein Hintergedanke bei dem Lösungsvorschlag - erkenne den Zusammenhang nicht wirklich.

Habe jetzt mal ein Ersatzkabel zur GPU versorgung bestellt, kommt morgen. Habe aus meinem privaten Kreis gehört das könne gerne auch mal daran liegen.

Habe im Gerätemanager festgestellt, dass unter "Grafikkarten" ein "Microsoft Basic Display Adapter nicht ordnungsgemäß funktioniert" (Bild im Anhang) könnte das eine Ursache sein? - Denke das ist bei der CPU die Integrierte Grafikeinheit?
Wie könnte ich dort vorgehen?

PS: Jetzt war 2 Tage Ruhe, kein Vorfall, und heute beim Einschalten nach der Arbeit direkt mit Schwarzen Monitoren hochgefahren. Wieder konnte ich normal mein PW (blind) eingeben und Windows startet in die Oberfläche (Ton zu hören) Streamdeck startet und HWI kann über eine Taste gestartet werden. Im Zuverlässigkeitsverlauf, nichts anderes als "Unerwartetes Herunterfahren".
Nach dem Zweiten hochfahren dann wieder Monitor mit Bild.... Seltsam

Erneut, Vielen Dank
 

Anhänge

  • gmanager.png
    gmanager.png
    70,4 KB · Aufrufe: 94
manche ryzen cpus schwächeln, wenn sie in einem kurzen Moment der Last zu wenig spannung kriegen. Das macht sich zumindest bei der 5000er Serie gern mit einem WHA fehler bemerkbar und einem neustart oder bluescreen. Kommt gerne zum Vorschein, wenn man mit dem PBO tool die cpu undervolten möchte und das negative offset zu weit oben ansetzt. Mit dem tool kann man aber auch andersrum agieren. Durch einen positiven offset der cpu einen tick mehr spannung zugestehen, wenn sie in ein lastszenario kommt.

Aber im nachhinein und dem erneuten durchlesen deines problems schließe ich den fall doch eher aus. Denn dein PC startet ja nicht neu sondern du kassierst ein blackscreen dass sich nur durch ein power off beheben lässt. Das ist eher nicht der Fall bei diesen CPU Fehlern.

was du noch machen kannst ist die integrierte GPU deiner CPU zu nutzen. Dadurch kannst du nachprüfen ob die 4070 das Problem ist. Läuft der PC fehlerfrei mit der integrierten GPU, weisst du woran es liegt.
 
Rainbowprincess schrieb:
manche ryzen cpus schwächeln, wenn sie in einem kurzen Moment der Last zu wenig spannung kriegen. Das macht sich zumindest bei der 5000er Serie gern mit einem WHA fehler bemerkbar und einem neustart oder bluescreen. Kommt gerne zum Vorschein, wenn man mit dem PBO tool die cpu undervolten möchte und das negative offset zu weit oben ansetzt. Mit dem tool kann man aber auch andersrum agieren. Durch einen positiven offset der cpu einen tick mehr spannung zugestehen, wenn sie in ein lastszenario kommt.

Aber im nachhinein und dem erneuten durchlesen deines problems schließe ich den fall doch eher aus. Denn dein PC startet ja nicht neu sondern du kassierst ein blackscreen dass sich nur durch ein power off beheben lässt. Das ist eher nicht der Fall bei diesen CPU Fehlern.

was du noch machen kannst ist die integrierte GPU deiner CPU zu nutzen. Dadurch kannst du nachprüfen ob die 4070 das Problem ist. Läuft der PC fehlerfrei mit der integrierten GPU, weisst du woran es liegt.
Na dann lass ich das erstmal mit dem PBO, das mit der integrierten GPU teste ich mal - was sollte ich da für einen Treiber installieren oder gibt es da ne direkte anlaufstelle bei AMD für die 7800x3d? - Sehe in den Foren und auf der AMD HP nur, dass sie eine solche GPU hat, aber Treiber eher nicht.
Danke schonmal
 
der normale adrenalin treiber für radeons tuts da soweit ich weiß. aber vielleicht kannst sogar einfach mal den von windows dann installierten nutzen. es geht im grunde ja nur darum zu sehen, ob der fehler auftritt.
 
So GPU Stromversorungskabel ist getausch. etwa 2 h nach Tausch sind wieder die Monitore schwarz geworden und die lüfter haben hochgedreht. Das war der Fehler dann wohl nicht.

Zusätzlich in der Ereignisanzeige andere Fehler:

"nvlddmkm"
Die Beschreibung für die Ereignis-ID "153" aus der Quelle "nvlddmkm" wurde nicht gefunden. Entweder ist die Komponente, die dieses Ereignis auslöst, nicht auf dem lokalen Computer installiert, oder die Installation ist beschädigt. Sie können die Komponente auf dem lokalen Computer installieren oder reparieren.

Falls das Ereignis auf einem anderen Computer aufgetreten ist, mussten die Anzeigeinformationen mit dem Ereignis gespeichert werden.

Die folgenden Informationen wurden mit dem Ereignis gespeichert:

\Device\Video3
Error occurred on GPUID: 100
sowie
HAL
Die IOMMU hat einen Fehler festgestellt.

Für eure Antworten bin ich überaus dankbar!
folgendes ist ebenso erledigt:
Rainbowprincess schrieb:
der normle adrenalin treiber für radeons tuts da soweit ich weiß. aber vielleicht kannst sogar einfach mal den von windows dann installierten nutzen. es geht im grunde ja nur darum zu sehen, ob der fehler auftritt.
Treiber für Microsoft Display Driver über AMD Graphics Treiber installiert
(nach dem Tausch von Stromversorungskabel und dem erneuten Fehler der schwarzen Monitore)

EDIT: 05.06.2024 - Wieder schwarze Monitore, kein Lüfter hochdrehen.
 
Zuletzt bearbeitet:
also kann man die grafikkarte schonmal ausschließen. Als nächstes würde ich mal den arbeitsspeicher prüfen. Betreib den PC mal mit nur einem der beiden ram riegel abwechselnd.
 
@Rainbowprincess Probleme entsteht weiterhin, beide RamRiegel abwechselnd alleine verwendet.

Heute in der Ereignisanzeige zwei 'neue' "nvlddmkm" Fehler, beide zur selben Zeit in der Ereignisanzeige.

15:47:26 nvlddmkm

Die Beschreibung für die Ereignis-ID "14" aus der Quelle "nvlddmkm" wurde nicht gefunden. Entweder ist die Komponente, die dieses Ereignis auslöst, nicht auf dem lokalen Computer installiert, oder die Installation ist beschädigt. Sie können die Komponente auf dem lokalen Computer installieren oder reparieren.

Falls das Ereignis auf einem anderen Computer aufgetreten ist, mussten die Anzeigeinformationen mit dem Ereignis gespeichert werden.

Die folgenden Informationen wurden mit dem Ereignis gespeichert:

\Device\Video3
00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000

Die Nachrichtenressource ist vorhanden, die Nachricht wurde in der Nachrichtentabelle jedoch nicht gefunden
und
15:47:26 nvlddmkm

Die Beschreibung für die Ereignis-ID "153" aus der Quelle "nvlddmkm" wurde nicht gefunden. Entweder ist die Komponente, die dieses Ereignis auslöst, nicht auf dem lokalen Computer installiert, oder die Installation ist beschädigt. Sie können die Komponente auf dem lokalen Computer installieren oder reparieren.

Falls das Ereignis auf einem anderen Computer aufgetreten ist, mussten die Anzeigeinformationen mit dem Ereignis gespeichert werden.

Die folgenden Informationen wurden mit dem Ereignis gespeichert:

\Device\Video3
UCodeReset TDR occurred on GPUID:100

Die Nachrichtenressource ist vorhanden, die Nachricht wurde in der Nachrichtentabelle jedoch nicht gefunden

Beide zur selben Zeit.

Zwei Tage Ruhe und jetzt wieder, - schon sehr seltsam - hab mich schon gefreut, dass es der Microsoft Display Driver hätte sein können... war wohl zu einfach.


Was habe ich jetzt noch gemacht?
Irgendwie werd ich das Gefühl nicht los, dass es ein Software /-Einstellungs Problem ist. Daher habe ich jetzt erstmal in den 3d-Einstellungen in den NVIDIA Systemsteuerungen bei Globalen Einstellunge

Energieverwaltungsmodus Maximale Leistung veborzugen

gewählt. Bilde mir ein irgendwann mal irgendwo gelesen zu haben, dass das helfen kann.
 
Zuletzt bearbeitet:
Kannst du dir irgendwo einen anderen DDR5 Speicherriegel besorgen zum testen? Das Thema RAM würde ich erst dann abhaken wenn der Fehler auch mit gänzlich anderem Arbeitsspeicher auftritt
 

19:05 Uhr - Erneut Schwarze Monitore, diesmal mit Lüfter hochdrehen. Übrigens im Idle, bzw bei geöffnetem Browser um diesen Thread zu beobachten, kein Game oder sonsiges Programm geöffnet (HWIinfo läuft natürlich - Temps alle in Norm)

Das wars wohl auch nicht
-> In Ereignisanzeige kein neuer Eintrag eines Fehlers


EDIT:--> Überprüfung der Nvidia Systemsteuerung, hab wohl vergessen auf Übernehmen zu klicken. Der Energieverwaltungsmodus stand wieder auf "Normal" -- erneut auf MAximale Leistung bevorzugen


@Rainbowprincess Wenn dann nur neuen kaufen, in meinem Umfeld keiner der mir einen leihen könnte.

EDIT2: 19:24 Uhr - Erneut Schwarze Monitore, diesmal ohne Lüfter hochdrehen. Wieder im Idle, kein neuer Eintrag in der Ereignisanzeige

Was ist jetzt erfolgt?

Energieoptionen
-> PCI-Express-Verbindungszustand-Energieverwaltung von "Mittlere Energieeinspaarung" auf Aus
 
Zuletzt bearbeitet:
wenn du das geld über hast, dann würde ich das mit dem arbeitsspeicher mal machen. nur eben drauf achten dass es nicht der selbe ist wie du bereits im system drin hast
 
@Rainbowprincess hm, würdest du mir vllt erklären - ich steh echt im dunkeln - warum du so sehr auf den RAM tippst?

17:22 heute PC absichltich nur im idle / browser betrieben. habe ein youtubevideo angesehen. -> Schwarze Monitore, sound läuft weiter ohne unterbrechung, hätte sicherlich das video zuende sehen können, habe jedoch nach 5 min den Power button 5 sec gedrückt...
Fehler in der Ereignisanzeige, wieder ID 14 und ID 153 mit der selben Fehlermeldung aus Post 10

EDIT: 20:28 Uhr Mehrmals die selben Fehler, egal ob im idle oder im Game. Einmal 2 h nichts, dann direkt nach dem Neustart.
--> Hab gesehen, dass ein neuer Grafiktreiber raus ist. -> installiert
555.99 unteranderem steht da folgende Neuerung drin:
[GeForce Experience] Flickering or black screen if Instant Replay is enabled [4665009]

Mal sehen.
 
Zuletzt bearbeitet:
Erneut der Fehler ID 14 sowie ID 153. Langsam ratlos

In einigen Foren gelesen, dass der Treiber 552.44 sehr stabil lief... ich deinstalliere jetzt im Abgesichteren Modus den Grafiktreiber und installier den 552.44
EDIT: Treiber 552.44 Installiert.
 
Zuletzt bearbeitet:
Ich habe einen ähnlichen Fehler. Das System lief ein Jahr störungsfrei, letzten Montag das erste Mal Schwarzbild. Das kam jetzt immer einmal kurz nach Start, wenn das System vorher lange genug aus war. Messwerte wie im HWInfo-Log sind unauffällig, die Einträge unter Windows eher nichtssagend.

Gestern dann das erste Mal auch nachdem der Rechner einige Zeit gelaufen war. Das hatte ich erwartet, solcher Art Fehler neigt dazu, sich im Lauf der Tage/Wochen zu verschlimmern.

Für mich ist das ein reines Problem der Grafikkarte, wo irgendein Sensor ein Ergebnis liefert, was die Firmware dann in die Sicherheitsschaltung treibt. Und weil das intern in der Grafikkarte abläuft, bekommt man ohne entsprechende Tools die eigentliche Ursache nicht angezeigt. Und mir ist nichts bekannt, mit dem man sich den Ablauf der Datenübertragung in der 4000er-Serie ansehen könnte.

Ich habe mir deshalb einige Threads durchgelesen, viel auf Reddit und auch z.B. diesen hier bei CB. Die These, dass es an den Sensepins des wahrlich schrecklichen Stromsteckers liegen könnte, halte ich nicht für unplausibel. Ich nutze den originalen nVidia-Adapter, da mein Netzteil noch keine entsprechenden Kabel hat. Den habe ich jetzt einmal abgezogen und neu aufgesteckt. Bisher ist der Fehler danach nicht mehr aufgetreten. Wie gesagt, die letzten Tage war es zuverlässig, dass der Fehler einmal kurz nach Start auftrat.

Noch ein Tipp für den Restart. Statt den Powerknopf zu drücken, habe ich mir eine kleine Batch für den Neustart gebastelt, die ich dann blind ausgelöst habe. Also, bei Schwarzbild eventuell ALT+F4, falls gerade eine Vollbildanwendung den Schirm exklusiv hat. Sonst WIN+R + Batchname eingeben. In der Batch steht nur dieser Befehl.
Code:
shutdown /r /f /t 0
Du musst sie natürlich irgendwo in den Pfad legen, ich habe sie nach Windows kopiert.

Wenn du einen Account bei Igors Lab haben solltest, frag da nach, ob die Vermutung mit den Sensepins nachvollziehbar ist. Vielleicht fragt Igor bei seinen Kontakten in Asien nach. Denn der Fehler ist recht häufig bei den 4000ern von nVidia.

 
Zuletzt bearbeitet:
@Brimbamborum Ich ziehe es mal in Erwägung dort einen Account zu erstellen, jedoch wäre es schon sehr zufällig, dass beide Kabel, das neue und das alte defekt sind.

@Restart001 Gerne bitte mit Eklärung was das denn macht. Sonst steh ich ja wieder im Unklaren, danke schonmal für die Idee und Erklärung

Nach ein paar Stunden Betriebszeit mit dem neuen "alten 552.44" Treiber, jetzt dann doch wieder schwarze Monitore. Kein Fehler in der Ereignisanzeige.
 
Ich habe mir wirklich im Dutzend Threads dazu durchgelesen und wenn es sich um genau das Problem drehte, dann war es IMMER die Stromversorgung, meistens direkt der Stecker. Bei HisN auch, siehe in meinem Thread dazu, wo ich einige Links gepostet habe. Das Kabel braucht nicht kaputt zu sein oder nicht richtig aufgesteckt, Druck, Gewicht, Fertigungstoleranzen, gegen das Gehäuse gestoßen, es reicht wohl eine Kleinigkeit.
 
@Brimbamborum Ich hab mir deine beiden Posts hier im Thread, sowie deinen eigenen Thread nochmal genauer angesehen und sehr aufmerksam durchgelesen. Habe dann auch zweimal mein Case offen gehabt um das Kabel im Gehäuse neu auszurichten. Einmal mit schwerwiegenderem Grafikfehler, viele Farben auf den Monitoren. Danach auf die andere Seite ausgerichtet. Mal sehen wie lang das jetzt anhält.

Ich kann der Vermutung folgen ja, aber welches Alternatives Kabel könnte ich denn bestellen? Gibt es schon irgendwo eine 100%ige Lösung für ein funktionierendes Kabel?

Danke schonmal für deine Beiträge und Hinweise
 

Ähnliche Themen

Zurück
Oben