Vega 56 defekt? Merkwürdiger Fehler

Ich hatte dasselbe mal bei meiner Vega, da lag es an derb schlechten Lüftercontrollern von Thermalright bzw. den Treibern dazu. Ich würd mal nach der Software schauen, halte das für am wahrscheinlichsten. Kaputte Grafikkarten machen ja für gewöhnlich eher gar nicht mehr.
 
@Rage wie jetzt? Du hattest das Problem mit der Vega aber die Ursache waren treiber vom Gehäuselüfter? Da hab ich gar keine Software zu, die laufen alle übers bios
 
Treiberprobleme würde ich hier aber ausschließen bzw. Zumindest in den Hintergrund Rücken.

Der TE hat geschrieben, das die GPU nach einem Reset teilweise erst nach dem zweiten oder dritten Versuch anläuft, das spricht für mich nach einem Hardware Problem.

Vorschläge hab es schon genug, die würde ich Mal abarbeiten, ggf. auch einfach mal alles demontieren und neu zusammensetzen, es können halt Kleinigkeiten sein, zu viel Druck durch den CPU Kühler, Karte nicht ganz 100%ig im Slot, etc..

Unter Windows würde ich dir eine Integritätsprüfung der Systemdateien empfehlen, ist schnell gemacht:
Rechtsklick auf Start -> Windows Powershell (Administrator) starten
sfc /scannow eingeben und mit Einem bestätigen.
Dann überprüft der Dienst die Systemdateien auf Fehler und versucht diese zu korrigieren.

Nachtrag: was ich gerade sehe:
Du nutzt einen Morpheus auf der Karte?
Treten die Fehler sich mit dem Werksseitig installierten Kühler auf?
Wie sieht die VRM Kühlung aus?
Die werden bei den Vegas nämlich stark beansprucht und wenn die nicht ausreichend gekühlt werden, kann die Karte Systemfreezes auslösen und die "Erholungszeit" nach dem Reset würde es auch erklären.
 
wie bitte bringt man eine gespannte cpu nur mit der Saugkraft der Kühler WLP aus dem gespannten Sockel, wenn der Haltepin noch arretiert ist?
 
Das Problem sind die Treiber an sich (wer etwas genaueres weiß, her damit).
Ich hatte am Anfang mein System so konfiguriert, dass Festplatten und Monitore deaktiviert werden, wenn ich dann mal länger als 5-10 Minuten nicht am Rechner sitze.
Dass führte leider zum Absturz des Systems, genauer gesagt das Herunterfahren der Platten. Sobald ich die Option für die Festplatten deaktiviert habe, war alles wieder in Ordnung.
Auch tritt dieser Fehler nicht bei allen Nutzern auf, was an sich schon merkwürdig genug ist, wieso sich ein GPU-Treiber so verhält.
Daher würde ich mal alle Energiesparoptionen deaktivieren, was die HDDs angeht und diese Konfiguration dann testen.
 
@Taxxor Ähnliche Symptome: Einfach so sporadisch Blackscreen mit Lüfteralarm, nach dem Neustart danach wars dann wieder ‚okay‘ bis zum nächsten Zwischenfall. Hatte auch die Vega im Verdacht, aber die Lüfter-Treiber haben scheinbar meinen PC öfter einfach so komplett abgeschossen. Vielleicht ist ja auch irgendwelche Müllsoftware bei Dir beteiligt, die nur mit speziellen AMD-Treibern muckt. Ist aber nur Spekulation, das mit den anschließenden Startproblemen habe ich zum Beispiel überlesen und erinnere mich nicht, ob es bei mir auch so war.
 
Mortal1978 schrieb:
wie bitte bringt man eine gespannte cpu nur mit der Saugkraft der Kühler WLP aus dem gespannten Sockel, wenn der Haltepin noch arretiert ist?
Das war überraschend leicht, so stark hab ich gar nicht gezogen, die Noctua Paste klebt anscheinend gut.
Ergänzung ()

mykoma schrieb:
Du nutzt einen Morpheus auf der Karte?
Treten die Fehler sich mit dem Werksseitig installierten Kühler auf?
Wie sieht die VRM Kühlung aus?
Die werden bei den Vegas nämlich stark beansprucht und wenn die nicht ausreichend gekühlt werden, kann die Karte Systemfreezes auslösen und die "Erholungszeit" nach dem Reset würde es auch erklären.
Kann ich nicht sagen, da ich die Karte nie mit dem Werkslüfter betrieben habe, sie ist auch genau ein Jahr älter als der Fehler.
An den VRMs kleben so viele nicht elektrisch leitende Kühlsockel wie ich hatte, eine Übertemperatur dabei würde ja auch nicht im Desktop Betrieb ohne Beanspruchung ausgelöst werden. gestern habe ich 5 Studnen am Stück Anno gezockt ohne Probleme, abgeschmiert ist der Rechner Stunden später beim Schreiben in diesem Thread.
Aus- und eingebaut hatte ich die Karte damals auch schon ohne Erfolg.
 
Zuletzt bearbeitet:
Beim nächsten mal das NT bitte für 1 - 2 Minuten komplett vom Strom getrennt lassen, damit sich sämtliche Kapazitäten entladen können. Dann wieder einschalten und gucken was passiert.
 
@Bartonius Ich werde dran denken, wenn das nächste mal kommt, bisher habe ich immer so 10 sek gewartet.
 
Hintergrund ist, dass sich ausgelöste Schutzschaltungen innerhalb des NTs meistens nur durch komplette Spannungsfreiheit zurücksetzten lassen. Da du geschrieben hast, dass du das NT mehrfach ein- und ausschalten musst damit der Rechner wieder startet, vermute ich, dass die Zeit zwischen deinen Schaltvorgängen nicht reicht um die Kapazitäten im NT komplett zu entladen und damit die Schutzschaltungen zurück zusetzen.
Sollte sich das Verhalten ändern, also durch das längere auslassen des NTs dieses mehrfache ein/aus nicht mehr nötig sein, so tippe ich auf eine angesprochene Schutzschaltung im NT. Warum steht dann auf einem anderen Blatt, aber als erstes würde ich dann das von dir erwähnte Corsair 500W mal testen.
 
Dass das Ausschalten über den Ein/Ausschalter nicht mehr geht zeigt eigentlich trotz aller Unwahrscheinlichkeit auf Mainboard. Der Schalter schließt ja direkt einen Stromkreis der das Board ausschalten soll. Wenn das nicht geht, muss das Board selbst ja irgendwie intern "abstürzen". Zusammen mit den 7 Monaten Zeit zwischen den Problemen würde ich auf einen "schlichenden Plattfuß" tippen. Ein Fehler der nicht gleich zu Problemen führt, sondern erst nach gewisser Zeit.

Vielleicht gibt es irgendwo an den Kontakten rund um die Grafikkarte (größeres PCI-E Umfeld) eine stelle die angeschmort aussierht?
 
Taxxor schrieb:
Die habe ich beim Entfernen des alten noctua Kühlers nämlich blöderweise vorher nicht erwärmt und gerade hochgezogen, sodass sie weiterhin am Kühler klebte und aus dem gespannten Sockel gerissen wurde.

Drehen, nicht ziehen!
Leicht hin und her drehen, bis der Kühler sich gelöst hat.

Du scheinst dich ja schon lange damit herumzuärgern.
Du musst mal was ausschließen, sonst kommst Du nicht weiter.

1. Mach das Mainboard BIOS aktuell und lade danach Stockwerte im BIOS. ---> testen

2. Setze mal Windows und AMD Treiber komplett neu auf oder installiere es zum testen auf einer zweiten Platte --> testen

Wenn es dann immer noch klemmt, kannst Du bei der Hardware anfangen zu suchen.
 
DocWindows schrieb:
Dass das Ausschalten über den Ein/Ausschalter nicht mehr geht zeigt eigentlich trotz aller Unwahrscheinlichkeit auf Mainboard. Der Schalter schließt ja direkt einen Stromkreis der das Board ausschalten soll. Wenn das nicht geht, muss das Board selbst ja irgendwie intern "abstürzen"
Naja der Schalter soll ja auch das Netzteil abschalten.
Ergänzung ()

IBISXI schrieb:
2. Setze mal Windows und AMD Treiber komplett neu auf oder installiere es zum testen auf einer zweiten Platte --> testen
Windows wurde zwischendrin schon neu aufgesetzt, den AMD Treiber habe ich eben mit DDU komplett runtergeschmissen.

Nach dem anschließenden Neustart ist das Bild immer wieder schwarz geworden, es war im Schnitt häufiger schwarz als dass ich was sehen konnte. DP Stecker gezogen und wieder reingesteckt und er blieb an. Dann hatte ich aber überall kleine Bildfehler, sahen wie eine Art Tearing aus, horizontale Artefaktlinien, die immer mal wieder an verschiedenen Stellen aufgetaucht sind.
Habe dann am Kabel nichts mehr verändert, sondern einfach den 19.4.2 installiert, währenddessen wird das Bild ja sowieso mehrmals kurz schwarz, danach waren diese Bildfehler verschwunden.
 
Ist das BIOS aktuell und hast du mal Stock Werte gelanden?
(kein Speicher oder CPU OC)

Hast Du die Grafikkarte schon mal in einem anderen Rechner versucht?
 
Taxxor schrieb:
Naja der Schalter soll ja auch das Netzteil abschalten.

Erst mal soll der Schalter am PC durch das Schliessen des Stromkreises eine Info an das Board geben und dies wiederum Windows informieren dass der Schalter gedrückt wurde. Windows kann dann z.B. in den Ruherzustand gehen oder herunterfahren. Kann man ja im System konfigurieren was passieren soll.
Der Hard-Off nach 4Sekunden drücken ist ebenfalls eine Sache die das Board aktiv machen muss. Das Verhalten kann man wiederum im Bios einstellen. Da hängt sich bei dir wohl das ganze Board weg, wenn der 4 Sekunden Kill nicht mehr funktioniert.
 
@DocWindows Da in diesem zustand auch die GPU keine Spannungsversorgung bekommt und die Board Lüfter voll drehen, gehe ich mal davon aus, dass das Board nicht mal in den Zustand gekommen ist, in dem irgendwelche BIOS Settings abgefragt oder umgesetzt werden können.

Aber der exakt gleiche Fehler bei zwei unterschiedlichen Boards?

Was ist denn mit der CPU? Ohne eingesetzte CPU reagieren die AM4 Boards z.B. auch nicht auf den Power Button.
Da hätte ich leider keinen Ersatz da, der käme erst im Sommer.
Ob man bei AM4 Boards in der Theorie ohne CPU ins BIOS kommen könnte, weiß ich nicht
Ergänzung ()

IBISXI schrieb:
Ist das BIOS aktuell und hast du mal Stock Werte gelanden?
(kein Speicher oder CPU OC)
BIOS ist das was von Anfang an drauf war CPU läuft schon immer auf Stock, Speicher läuft mit dem Standard DOCP Profil, womit er auch schon seit Beginn läuft.
Habe es jetzt mal aktualisiert und das DOCP Profil deaktiviert.
Die Zeitliche nähe (2 Tage) zum Umbau der Komponenten in ein neues Case lässt mich aber einen Fehler in der Richtung eigentlich ausschließen.
IBISXI schrieb:
Hast Du die Grafikkarte schon mal in einem anderen Rechner versucht?
Habe keinen anderen Rechner zur Verfügung



Momentan scheint der Fehler aber auch viel seltener aufzutreten als damals, was ironischerweise schlecht ist, da es die Fehlersuche erschwert.
 
Zuletzt bearbeitet:
Taxxor schrieb:
Dann hatte ich aber überall kleine Bildfehler, sahen wie eine Art Tearing aus, horizontale Artefaktlinien, die immer mal wieder an verschiedenen Stellen aufgetaucht sind.


davon bitte ein foto - das hört sich nach einen VRAM Problem an
 
Das verschwindet sobald man den AMD Treiber installiert?
Ich hatte schon mal eine Karte mit VRAM Problem, das sah anders aus, aber ich kann mal versuchen es zu reproduzieren. Ein Foto wird aber nicht funktionieren, da sie ja nicht statisch sind
 
Naja, wie du siehst, jede Kleinigkeit kann helfen die richtige Idee zu haben.
Deshalb sind dann auch so Fehlermeldung wie die Bildfehler natürlich wichtig. Du musst bedenken: Wir sitzen nicht vor deinem Rechner. Wir können also nur Vermuten auf Grundlage deiner Angaben ;)

Keine Ahnung wieviel und was du nun schon von den Vorschlägen umgesetzt hast. OC weg, Memtest, Benchmarks, Netzteil tauschen.
Uns vielleicht auch darüber nicht ganz im dunkeln lassen wäre hilfreich.

@Sebbi: falsch zitiert. Ich hab das nicht gesagt :)
 
Zuletzt bearbeitet:
Silverangel schrieb:
Ein Foto wird aber nicht funktionieren, da sie ja nicht statisch sind

eine momentaufnahme mit den fotoaparat ist da ausreichend
 
Zurück
Oben