Random restarts, keine crash dumps, Nitro 64 defekt?

Dant3

Cadet 4th Year
Registriert
Okt. 2008
Beiträge
90
Hallo zusammen,

Ich bin mit dem Problem jetzt seit August dran und mit meinen Ideen so langsam am Ende.

System:
Crosshair Hero 6
Ryzen 1600
16GB G.Skill TridentZ 3200 CL14
Nitro Vega 64+ (ist mit 2 exklusiven 12v Schienen angeschlossen)
Enermax Platimax 750
Crucial mx300 750GB
WD Blue 4TB

Mein PC startet sporadisch neu. Das kann einmal alle 10 Tage sein, aber auch direkt 2 mal in einer halben Stunden hintereinander und dann erst 3 Tage später wieder.
Egal ob Desktop, Videos oder im Spiel. Unabhaenging von der tatsaechlichen Auslastung.
Er verhaelt sich als haette man mittendrin einfach den Reset Knopf gedrueckt und bootet direkt wieder auf den Desktop.
Dabei erstellt Windows NIE eine Crash Dump (alles wurde entsprechend richtig konfiguriert das dies geschehen sollte) und in den Systemereignissen ist der Reboot lediglich als Kernel 41 Problem gelistet, aber ohne weitere Anhaltspunkte (alle Werte als 0 angegeben).

Das System ist uebertaktet bzw. die Grafikkarte gleichzeitig undervoltet, aber es lief bis zu diesem Zeitpunkt zu 100% Stabil.
Was ich bisher gemacht habe …

Zig Stunden Prime Tests, zusaetzlich CPU Voltage / SOC Voltage weiter als bisher noetig angehoben,
Spannungen der Grafikkarte erhoeht bzw. Takt deutlich verringert,
Memtest86+ durchlaufen lassen, keine Fehler,
Platten mit Crystalmark gecheckt, alles i.o,
Furmark in Kombination mit Prime, keine Fehler,
Diverse AMD GPU Treiber probiert,
Aktuelle Chipsatztreiber installiert,
Ein aktuelles Bios des Mainboards installiert,
Alle Temperaturen kontrolliert,
Spannungen des Netzteils kontrolliert,

Gröbere Maßnahmen …
Andere Steckdose inklusive neuer Steckdosenleiste probiert,
Das Netzteil ausgetauscht (war mein erster Verdacht),
Alle Anschluesse auf dem Mainboard bzw. GPU kontrolliert,


Im Endeffekt wuerden jetzt nur die CPU (IMO sehr unwahrscheinlich), das MB und die GPU bleiben
Bisher hatte ich eigentlich das Mainboard im Verdacht, obwohl absurd, kam mir dies logischer als die GPU vor. Gestern, nachdem diese Reboots allerdings 3 mal in extrem kurzer Abfolge auftraten, hatte ich kurz danach auf dem Desktop einen fetten, pixeligen, grauen Streifen der ca. 1/3 des Bildschirms einnahm und kurz darauf wieder verschwand. Dadurch bin ich mir jetzt nicht mehr so sicher ob es nicht doch die GPU sein koennte, obwohl das ganze verhalten auch nicht unbedingt fuer einen GPU defekt spricht bzw. so habe ich das noch nie kennengelernt.


Meine Frage, hat jemand schon mal aehnliches erlebt und kann evtl. etwas dazu sagen?
Mfg
 
Klingt schon irgendwie total verhext. Aber die Vermutung wenn wirklich kein Hardwaredefekt vorliegen sollte das ein Schalter am Gehäuse einen Defekt hat und tatsächlich resettet. Wäre schon der Knaller. Villeicht mal Rechner hochfahren und die Kabel abziehen um zu beobachten ob der Fehler dann auftritt....
 
8j altes Netzteil, welches mit den schnellen Spannungswechseln nicht zurecht kommt. Haben wir hier im Forum gefühlt seit gut 2j.
 
Hatte mit meiner vega56 das gleiche Problem.
Bin dann auf den aktuellen beta Treiber gewechselt und das Problem tritt nun seit etwa 5 Tagen nicht mehr auf.

Allerdings ohne graue Streifen...
 
firexs schrieb:
8j altes Netzteil, welches mit den schnellen Spannungswechseln nicht zurecht kommt. Haben wir hier im Forum gefühlt seit gut 2j.
Hat er doch getauscht?!
 
Autsch.. mein Fehler.. (außer das getauschte Netzteil war auch so eine altes) ;)
 
Vielleicht kommt das Problem ja von "außen". Störspannung auf der Stromleitung, EMV-problem etc. Es gibt Steckleisten mit Überspannungsschutz, vielleicht sowas mal testen... Oder eventuell kannst du das ja an was anderem festmachen, wie bspw. immer wenn der Nachbar mit Bogenlicht schweißt o.ä. ;)
 
Ich habe momentan ähnliche Probleme. Sogar der GPU-Treiber wird zurückgesetzt. Seit mein RAM auf 2133 MHz läuft, ist mein System nicht einmal mehr abstürzt. Und das auch mit R5 1600.
 
Also, ich gehe mal auf ein paar Dinge Schritt fuer Schritt ein.


Es handelt sich hier nicht um ein 8 Jahre altes Netzteil, sondern um die neue Version von 2017 -> https://geizhals.de/enermax-platimax-d-f-750w-atx-2-4-epf750ewt-a1694062.html
Wenn das mit einer Vega ueberfordert sein sollte, dann wohl 99% aller Netzteil auf dem Markt.
Und wie bereits gesagt, die Karte ist ueber 2 verschiedene 12v Schienen angeschlossen.

Steckleiste habe ich eine mit Ueberspannungsschutz und auch diese wurde schon getauscht bzw. die neue auch an eine andere Steckdose angeschlossen, Problem trat einen Tag spaeter wieder auf. Das hier einer immer mit einem Bogenlichtschweißer arbeitet ist bei den Zeiten wo die Reboots u.a. auftreten praktisch ausgeschlossen ;).

Treiber habe ich bereits mehrere durch. Ich hatte vor dem Problem einen von April installiert, damit habe ich die letzten Monate alles moegliche gespielt und es gab nie Probleme. Jetzt habe ich schon 2 aktuelle durchgetestet, immer noch Neustarts.
Die Karte werkelt seit August 2018 in dem System, das Netzteil hatte ich erst im Maerz 19 eingebaut. Es gab bis ende August kein vergleichbares Problem. Das war von heute auf morgen präsent.

Diverse Programme die Kritische Fehler in der Ereignisanzeige verursachen habe ich auch alle beseitigt, es gibt nur noch diese Kernel 41 Reboot - Fehler.

Das es der Knopf am Gehaeuse ist, das habe ich gestern spaßeshalber auch noch zu einem Freund gesagt, aber das kommt mir so EXTREM absurd vor. Das Gehaeuse ist 2 Jahre alt und den Reset Knopf habe ich vielleicht 20 - 30 mal betaetigt bisher (Bios Fummelei zum Ryzen Launch).
Von so einem Phänomen habe ich auch noch nie gelesen und ich bin eigentlich kein Laie was das Hardware Thema betrifft.


Seit heute morgen habe ich zur Notlösung eine aus dem Media PC stammende RX570 verbaut, mit welcher der Fehler bisher noch nicht aufgetreten ist … was aber natuerlich nichts zu sagen hat, da man ihn nicht forcieren kann. Spielen kann ich damit in UWQHD natuerlich nicht wirklich, weswegen ich gehofft hatte, jemand haette schon mal aehnliches erlebt und koennte meinen Verdacht mit der GPU eingrenzen, so dass ich da Ersatz besorgen und die Nitro einschicken kann.

Nachdem die Reboots gestern 3 mal in Folge (nach Sekunden auf dem Desktop) auftraten und es danach kurzzeitig diesen dicken, pixeligen grauen Streifen gab, neige ich auch eigentlich dazu.
 
Ich habe eine RX 5700 und bei mir passiert genau das gleiche. PC Startet ohne vorwarnung neu bzw. Bildschirme werden schwarz im hintergrund hört man aber das Spiel/Video noch laufen. Mit meiner alten RX480 gib es keine Probleme.

Ich bin echt frustiert so hab ich mir ne neue Grafikkarte nicht vorgestellt. Hab bisher auch viel Probiert nichts funktioniert.

Hast du zufällig 2 Bildschirme angeschlossen? ich hab ein 144Hz Monitor über DP und ein 60Hz über HDMI angeschlossen. Könnte was damit zutun haben.
 
Bei mir hört man auf jeden fall keinen Ton mehr, er startet direkt komplett neu ohne zu haengen, freezen oder sonstiges.
Ich habe noch einen 4k TV an der Karte haengen, aber der ist praktisch den ganzen Tag aus und den hatte ich auch von Anfang an der Karte. Da gab es auch nie Probleme.

Die Reboots passieren auch wenn nur der TV Aktiv ist und ich darueber Spiele. Ich habe zu 99,9% auch nur einen Bildschirm aktiv.
 
Ähnliches Problem hatte ich auch mit meiner Vega 64. Dachte auch da liegt der Fluch auf der Karte.

Zum Testen würde ich mal den RAM auf 2400 Mhz stellen und UV/OC von der Karte nehmen (das konnte ich jetzt deinen bereits erfolgten Tests nicht direkt entnehmen).

Sind in der Nähe der Restarts irgendwelche auffälligen Einträge im Zuverlässigkeitsverlauf / im Ereignisprotkoll?

Bei mir war es im Endeffekt das HBM-OC, was vorher über Monate ohne Probleme lief in Verbindung mit dem RAM. Frag mich aber nicht nach dem Auslöser ^^
 
2400 Mhz, da redest du vom Arbeitsspeicher und nicht dem HBM, nehme ich an?
Also das ist ein B-Die Kit, welches zuvor auch mit meiner alten RX 470 Nitro+ ohne Probleme auf 3200 Mhz CL14 lief. Ram Probleme hatte ich damals zum Ryzen Launch genug mit dem Board, die verhalten sich ganz anders und sind ja auch die Monate zuvor nicht mit der Vega 64 aufgetreten. Veraendert habe ich seit Ewigkeiten nix mehr am OC bzw. UV. Lediglich mehr Spannung auf Vcore und Soc um auf Nummer sicher zu gehen.

OC/UV bei der Karte habe ich nicht raus genommen, allerdings habe ich der Karte viel mehr Spannung als nötig fuer 1500mhz ~ gegeben. 1050mv fuer die 1500mhz GPU, 1000mv fuer 1000mhz HBM.
Lief die Monate zuvor aber immer mit 950mv GPU / 975mv HBM ohne Probleme.
Ich kann die Karte gezielt zum Absturz bringen bezueglich nicht ausreichendem Saft fuer Takt. Da resettet sich dann auch jedes mal der GPU Treiber und das Spiel schließt sich. Beim HBM gibt's immer Artefakte im Bild.
Eben drum glaube ich auch nicht das hier das Problem liegt. Die Restarts sind immerhin auch auf dem Desktop im idle mode und an den unteren Einstellungen kann man ja gar nichts veraendern.
Wenn es nur unter Last auftreten wuerde, waere das Problem ja viel viel leichter einzugrenzen.


Es kann natuerlich trotzdem sein, das hier irgendwas nicht stimmt. Im Zweifel kann auch der RAM im Arsch sein, ich konnte aber bisher nichts finden was darauf hindeutet und auf irgendwas muss man sich ja verlassen, wenn es so beliebig passiert wie hier.


Leider gab es auch in der Ereignissanzeige nix auffaelliges in der Naehe der restarts. Am Anfang ist quasi gleichzeitig ein Logitech Treiber mit einem Error abgeschmiert und ich hatte diesen natuerlich im Verdacht. Aber auch nach der Deinstallation sind die restarts weiter da und viel mehr kam die Fehlermeldung vom Treiber wohl durch den bevorstehenden Reboot.
 
Jop. Genau, meine den RAM.

Teste mal am besten nochmal mit Standardsettings. Nur so könnte man das weiter eingrenzen.

Ich bin jetzt auf P7 1592Mhz / 930 mV und HBM auf 1075 Mhz / 900 mV.

Die HBM-Spannung die man setzen kann, hat nichts mit der tatsächlichen Spannung zu tun. Der HBM läuft immer bei 1,35V bei der Vega 64.
 
Nur einen Bildschirm "aktiv" aber angeschlossen ist der Zweite dennoch oder? Nicht mehr aktiv sind die bei den AMD Treibern NUR, wenn man das Kabel von der GPU zieht oder die Stromzufuhr vom Monitor vollständig trennt, bei Nvidia übrigens das Gleiche.

Probier mal:
https://www.amd.com/de/support/prev...eries/radeon-rx-vega-series/radeon-rx-vega-64

Adrenalin 2019 Edition 19.4.3 Optional

Ansonsten kann auch einfach das OC/UV nicht 100% stable sein, bei meiner Vega64 habe ich mehrere Wochen getestet zum ersten Crash in realen Szenarien (The Division 2 eignete sich hervorragend für maximalen Stress), hat aber dennoch wie geschrieben, Wochen dafür gebraucht.

Was sonst den Treiber angeht, den kann man auch schon crashen indem man die Settings öffnet, selten so eine instabile Software gesehen.

Blubb.PNG


Das waren meine Settings auf der Nitro+, -10mV zu wenig auf P5 und P6 "schon" ist das Ding nach Tagen/Wochen irgendwann abgeschmiert.
 
Zuletzt bearbeitet:
@frkazid
Ich weiß dass die tatsaechliche HBM Spannung eigentlich fix ist, aber wenn man den Wert beim HBM zu tief setzt, boostet der GPU / HBM Takt teilweise nicht mehr voll. Erst wenn man eine bestimmte Schwelle dort ueberwunden hat (z.b. 900 auf 930) geht der Takt bei beiden Einheiten wieder auf das Maximum.

@eax1990
Mir ist klar dass die Vegas teilweise sehr empfindlich sind, aber ich sagte ja, dass ein Crash aufgrund mangelnder Spannung bzw. zu hohem Takt sich ganz anders verhaelt. Ich kann diesen Crash ja auch ohne Probleme erzwingen.
Wenn ich bei 1000mv bleibe und den maximalen Boost z.b auf 1652 stelle, dann schmiert frueher oder spaeter der Treiber ab und ich fliege auf den Desktop. Das passiert jedes mal so, da gibt es keine Restarts. Egal ob Witcher 3, FFXIV oder Wolfenstein. In der Ereignisanzeige ist dies dann auch explizit so nachzuverfolgen.


Seit ich jetzt die RX570 drin habe (auch etwas mit gespielt) kam es bisher zu keinem Restart. Hat natuerlich noch nichts zu sagen, aber momentan bin ich noch immer der Meinung das die Vega einen weg hat.
Auf gut Glueck habe ich mir jetzt eine RX5700XT bestellt und werde sehen wie es sich damit verhaelt. Die 570 ist leider fuer UWQHD und 4K zu langsam, als dass ich damit lange ausharren koennte.

Wenn es mit der 5700XT keine Probleme gibt werde ich die Vega als defekt einschicken und später verkaufen.
Werde auf jeden Fall noch Rückmeldung geben wie die ganze Sache ausging.
 
Das liegt daran, dass man mitm Wattman P0-P2 vom HBM nicht anpassen kann.

P2 liegt die Spannung (bei meiner Karte) bei 950mV. Sollte P3 dadrunter liegen, taktet er natürlich nur bis P2. Man muss dann schon alles anpassen :)

Ich habe mir via OverdriveNTool ne eigene PowerPlayTable gebastelt. Ist auch kein Hexenwerk :)

Hast du die Karte denn jetzt mal auf Stock testen können?
 
Also ich drück mich mal anders aus, ich glaube, auch wenn ich die Spannungen und Werte lese, dass du die Karte nicht RICHTIG UV/OCed hast.
Es wäre mal interessant zu wissen ob du das Powertarget erhöht hast, weil unter voller Last schafft es die Nitro + nicht mal in P7 rein.
Die Beiträge lesen sich so, als hättest irgendwelche Werte eingestellt ohne vorher zu gucken was die Karte im Standard überhaupt anliegen hat und in welcher P-Stage du dich befindest.

Die Nitro+ taktet nämlich, sofern man das Powertarget um 20% anhebt erstmal in P7 rein und das ist weit über den von dir angegeben 1500 Mhz, da liegen dann ca. 1580 an - von Werk aus.

Siehe hier:
https://www.sapphiretech.com/de-de/consumer/nitro-rx-vega64-8g-hbm2
 
Natürlich habe ich das Powertarget auf +50% gestellt und mir ist auch klar, dass sofern bei P7 1612mhz angegeben sind, die Karte nicht so hoch boostet.
Da kam sie bei mir mit 1000mv (Standard waren 1100 oder 1150mv von Sapphire vorgegeben) auf einen realen ingame Takt von 1520 - 1540mhz~.

Es ist nett das ihr euch bemueht, aber ich sagte es bereits mehrere male, die Reboots haben nichts mit dem OC/UV zu tun. Wenn da etwas schief geht, dann wird der Bildschirm schwarz, es resettet sich der Treiber und ich fliege in 3 getesteten spielen auf den Desktop zurueck. Das kann ich ganz gezielt herbei fuehren (1000mv und P7 auf 1682mhz, da boostet die Karte ein gutes Stueck ueber 1600mhz im Spiel).

Außerdem erwaehnte ich auch bereits oben, dass die Restarts auch im idle passieren. Also beim browsen, Video schauen oder einmal sogar als ich fuer eine Stunde ueberhaupt nicht am PC war und er lediglich schon mal auf den Desktop gebootet wurde (sah es in der Ereignisanzeige).
Da ist das max. OC voellig unrelevant.


Aktuell sieht es fuer mich immer noch danach aus, dass die Karte einen groeberen Hardware Defekt hat.
Die RX570 hatte die 2 Tage keine Probleme gemacht und die RX5700XT seit gestern Abend hat auch noch keine mucken von sich gegeben. Das kann sich natuerlich noch aendern, aber GPU scheint mir wahrscheinlicher als Mainboard.
 
Zuletzt bearbeitet:
Zurück
Oben