Möglicherweise defekte Vega 64?

Lugia Prophet

Cadet 4th Year
Registriert
Aug. 2007
Beiträge
119
Moin, moin

habe seit kurzem mir mal ein neuen Rechner zugelegt und seither mit diversen Problem zu kämpfen. Hier mal Randdaten zur Technik:

CPU: Ryzen 7 2700x (boxed Kühler, meldet meist rund 35-50 °C)
RAM: 2x16 GB g.skill DDR4 2400er ripjaws
Netz: Enermax MaxTytan 80er Platinum 800 Watt
GPU: Sapphire Radeon Nitro+ Vega 64 (kein OC oder UV, meist bei aktiver Last rund 57 - 63 °C )
OS: Windows 10, alle Updates, dxwebsetup alles nachgeladen, 1809er Version
Festplatten: SanDisk 256er für OS und eine 480er für Rest (meist bei 23 - 26 °C, SATA-betrieben)
MoBo: Gigabyte Gaming 5 WiFi x470er (aktuelles BIOS, aktuelle Chipsatztreiber)

Folgendes Problem: Während ich Path of Exile daddeln kann, ohne auf Probleme zu stoßen (DX11), läuft beispielsweise WoW (DX12) nicht stabil. Mit der Treiberversion 19.1.2 von AMD gibt es ein immer mal zufällig zwischen 2 - 30 Minuten ein schwarzen Bildschirm. Der Rechner muss dann vom Netz getrennt werden, da trotz Ausschalten am Power-Knopf noch jedes erdenkliche Licht am Mainboard aktiv ist. Was es nicht sein sollte, wenn der Rechner aus ist.

Wenn der Rechner abschmiert mit dem 19.1.2er Treiber, kommt es vor, das der Rechner nach einem Reset ständig das HDMI Signal verschwindet und wieder auftaucht. Sowohl unter Linux als auch unter Windows. Das kann nur beseitigt werden, wenn der Rechner komplett stromfrei gemacht wird, sprich, Netz aus, Power-Taste drücken zwecks Entladen aller Kondensatoren. Dann geht es eine Weile wieder.

Mit Treiber 19.1.1 gibt es kein schwarzen Bildschirm, dafür ändert sich die Auflösung zufällig mal zwischen UHD und 1080p und kann von 1080p auf UHD erst zurückgestellt werden, wenn ich das HDMI-Kabel getauscht habe (UHD läuft sonst auf 60 Hz). Ebenfalls kommt es zufällig zu Bluescreens (IRQL less or equal) oder das Spiel (WoW) stürzt mit einer Fehlermeldung ab.

Was ich schon probiert habe:
- Netzteil getauscht
- Treiber gewechselt (19.1.2 bzw. 19.1.1)
- Windows neu installiert (bereits das 4te Mal)
- Grafikkarte im anderen PCIe-Slot betrieben
- Memtest86+ laufen lassen
- BIOS-Reset

Was ebenfalls merkwürdig ist: Wenn ich das MoBo im RAID-Modus betreibe, schafft es der Windows-Datenträger (USB) nicht, das System neuzustarten. Es bleibt einfach stehen, reagiert jedoch noch die Maus. Im AHCI Modus ist das nicht der Fall.

Nun ist meine Frage: Hat jemand noch eine bahnbrechende Idee oder deutet vieles darauf hin, das die Grafikkarte ODER das Mainboard ein Fall für RMA sind?

Was ich ggf. noch ausprobieren möchte: Eine 1070 Ti ausleihen und betreiben, aber da muss ich schauen, ob es klappt.


Beste Grüße!
 
Hallo zusammen,

@ Lugia Prophet

Lugia Prophet schrieb:
- Netzteil getauscht

Welches andere Netzteil hast du denn Probiert? Es ist so, hier im Forum wirst du viele Threads mit Problemen von Vega 64 Besitzern Sehen, wo das Netzteil die Probleme verursachte. Und beim nicht kleinen Teil sogar richtig gute Marken-Netzteile. Und wie du, erinnere ich mich auch an einen, der sogar ein 850 Watt NT hatte.

Die von dir beschriebenen Symptome weisen für mich schon durchaus stark auf ein Netzteilproblem hin. Was mich aber verwundert, sind die von dir angegeben Temperaturen, sowohl für GPU als auch CPU.

Besonders bei der CPU sind die viel zu Niedrig. Mit Boxed-Kühler sollten die in der Regel Plus Offset bei um die 75 Grad wenigstens liegen, mit dem Boxed-Kühler in jedem Fall. Und deine Custom Vega ist unter Last normalerweise auch wärmer als von dir angegeben. Deine angebebenen Temperaturwerte irritieren mich schon sehr.

Beim jetzigen Stand der Dinge würde ich aber eher das Mainboard als Problemverursacher Ansehen. Insofern könnte die von dir ins Spiel gebrachte GTX 1070 Ti durchaus Klarheit Bringen. Allerdings stellt die deutlich weniger Anforderungen an das NT. Vielleicht kannst du bei der Gelegenheit ja auch das NT bei dem Ausleihen, von welchem du die GTX 1070 Ti bekommen kannst. Dann wirst du in jedem Fall völlige Klarheit bekommen, was nun Sache ist. Und dazu ist auch kein überbordendes Umbauprozedere nötig.

So long...
 
Wenn WoW läuft und ich die Auslastung beobachte, düpelt die CPU herum und die GPU ebenso. Da drehen nicht mal die Lüfter mitunter hoch, wenn ich in Sturmwind bei UHD rumlaufe. Es sei noch erwähnt, das unsere Heizung im Haus kaputt ist und der Techniker erst die Woche auftaucht. Wir haben hier Raumtemperaturen von 13 - 14 °C gerade mal und der PC steht beim Fenster. Am Boden ist es noch kälter.

Das Netzteil was zum Tausch diente, war ein 700er von Corsair. Hab da für die genaue Bezeichnung kein Zugriff mehr, war nur geliehen. Jedenfalls war es nicht modular.

Wenn es am Netzteil liegen sollte - was für ein Test lässt sich da fahren? Ich mein, wenn Furmark die Karte nicht stört, wenn Path of Exile in UHD keine Probleme verursacht (da ist die GPU Utilization sogar hoch) und Skyrim SE mit Mods (GPU utilization 80 - 90%) nicht stört, warum macht dann WoW wo die GPU sich langweilt Probleme? ich mein, wenn sie gefordert wird, kann ich es ja verstehen. Wenn sie sich aber quasi langweilt...?

Also wenn sich was herauskristallisiert, was die Ursache sein könnte - nur zu. Ich probiere jetzt mal den Treiber 18.12.1

/edit: Die Karte nutzt 2 PCIe 6+2er Anschlüsse, die auch angeschlossen sind.
 
Lugia Prophet schrieb:
... Wir haben hier Raumtemperaturen von 13 - 14 °C gerade mal und der PC steht beim Fenster. Am Boden ist es noch kälter.
...
Bei der Kälte hätte ich auch keinen Bock zu arbeiten :-)
 
  • Gefällt mir
Reaktionen: stevefrogs
Hallo zusammen,

@ Lugia Prophet

Lugia Prophet schrieb:
Wir haben hier Raumtemperaturen von 13 - 14 °C gerade mal und der PC steht beim Fenster. Am Boden ist es noch kälter.

Der Ryzen 2700X ist nach deinen Worten, Respektive deiner Angaben, dann nie Wärmer als ca. 40 Grad abzüglich des Temperatur-Offset von 10 Grad. Das kannst du völlig Vergessen. Das stimmt zu 100 % nicht. Auch nicht bei ca. 13 - 14 Grad Raumtemperatur. Ich weiß wovon ich rede, denn ich habe schon mehrere verbaut. Noch dazu mit Boxed-Kühler, nie im Leben!

Die Temperaturen bei der GPU können bei diesen Temperaturen hingegen sehr wohl hinkommen.

So long...
 
Hast du zufällig die corsair icue Software drauf? Falls ja bitte deinstallieren und testen ob der PC noch abstürzt. Hatte exakt die selben Probleme und nachdem icue deinstalliert war lief alles rund.
 
@Lugia Prophet

Wenn du so ein Blackscreen bekommst, dann hilft auch kein reset, muss direkt vom Strom getrennt werden?
Du sagst die Karte langweilt sich bei WoW und DX12, läuft aber einwandfrei bei PoE in DX11.
Hast du mal z.B. HWInfo oder sowas im Hintergrund laufen inkl. logging? Vielleicht taktet sich der HBM einfach komplett runter?
 
Wie wäre es denn stattdessen Mal die Vega etwas runterzudrehen. Takt und Spannung. Dann sollte diese das NT nicht zu stark belasten können. Dann kann man das NT ausschließen. Wenn doch noch Abstürze kommen, dann wird es wahrscheinlich das MB sein.
 
@lux: Kühler, Paste etc sind passend verbaut. Hab nachgeschaut bzw. die Wärmeleitpaste nun ersetzt. Ich kann mit Prime95 sicher höhere Temperaturen erreichen, doch die CPU Last liegt bei WoW selten bei 30% und bei Skyrim SE auch selten über 35%, dafür pumpt die GPU immerhin und ich hab stabile 57-60 FPS.

@flow: Nein, das ist jetzt gerade pures Windows + alle AMD Treiber + AMD 18.12.1 für GPU und ich lasse gerade wieder Furmark einfach aus langeweile laufen. Der Rechner zieht gerade knapp 450 Watt aus der Dose und macht keine Probleme. Das ist ja, was mich bisschen nervt. Lege ich LAST an - nichts. Langweilt sich der Rechner -> Boom. Zugegeben, den 18.12.1er habe ich noch nicht mit WoW getestet. Es läuft noch Furmark. Werde gleich mal FurMark und Prime95 zusammenwerfen.

Aktuell 71 °C bei GPU und eine Last von 98%, HBM taktet laut Furmark mit 945 MHz

@Azrael: Ich kann beim Blackscreen den powerknopf drücken, er geht auch aus. Aber die Lichter beim Mainboard bleiben alle aktiv (was sie nicht sein sollten). Wenn ich den Rechner in diesem Zustand wieder hochfahre, flackert meist das HDMI Signal wie wild. Da muss ich ausschalten, vom Netz nehmen, Power-Taste drücken (entladen) und dann wieder hochfahren. Dann ist alles erst mal wieder okay. Das alles passiert aber nur mit dem 19.1.2er Treiber, den AMD für Resident Evil released hatte. Werde mal hwinfo laufen lassen und berichten.

@Legend92 Ich könnte durchaus das "Silent-Bios" nutzen oder die Karte undervolten, klar. Nur wie gesagt, es passiert absolut nichts, wenn die Karte mit Benchmarks oder Furmark dauerbefeuert wird. Da gibt es kein Problem. Probleme gibt es, wenn sie NICHTS zu tun hat bisher. Wie in WoW.
 
Dann Mal umstellen und einfach Mal abwarten ob da was kommt. Wenn es wieder auftaucht, dann grenzt es schon Mal etwas mehr ein. Du benutz aber auch HDMI Ausgang und nicht Displayport? Ich Frage es deswegen, weil beim den meisten DP Kabeln manchmal auf dem letzten Pin eine Spannung anliegt, diese ist aber nur für mobile Geräte gedacht.
 
@Lugia Prophet
Du führst dann Furmark in DX12Mode aus? Auch mal irgendein Dx12 Benchmarks getestet?
Falls es durchläuft, dann taktet der HBM wahrscheinlich einfach runter in WoW und geht in p1 oder sowas.
 
@Azrael Furmark kann, wenn ich das richtig sehe, nur OpenGL. Sorgt aber für eine maximale Auslastung der gesamten Grafikkarte und das stört die Karte bisher kein bisschen. Ich suche gerade nach DX12 Benchmarks.

@Legend92 Ich nutze ein HDMI Kabel, ja. Habe auch schon verschiedene Kabel ausprobiert. Irritierend oder mir nie aufgefallen ist, das auch dort scheinbar eine kleine Spannung anliegt? Wenn der Anschluss vom Monitor kommend (egal welcher Monitor, ich habe auch mehrere Monitore schon ausprobiert und verschiedene HDMI Kabel), knackst es wenn eine Kante vom HDMI Kabel mit dem Gehäuse in Kontakt kommt. Sprich, da scheint minimal auch eine Spannung irgendwo zu sein an einem internen Pin vom Kabel.
 
Es ist nicht einfach, ein DX12 Benchmark zu finden. Habe jetzt 3d Mark Time Spy mehrfach laufen und nebenbei hwinfo mitloggen lassen.

Es gab keine Fehler oder Abstürze (18.12.1 als Treiber gerade und nicht der Silent-BIOS der GPU aktiv). Der HBM Speicher ist während der Benchmarkszenen stets bei 945 MHz (wie gewünscht), die GPU erreicht bis zu 70 °C, der HBM bis zu 65 °C, die CPU bei Spitzenauslast von bis zu 88% erreicht ungefähr 60 °C aber nur kurz, weil dann der Lüfter der CPU deutlich hörbar aufdreht (was ja beim Spielen nie passiert unter UHD bisher) und die Temperatur hält bzw. auch mal auf 57 °C wieder runterdrückt.

/edit: Mir ist durch Zufall aufgefallen, das seit 18.12.1 installiert ist, ein seltsamer roter "Block" links oben bei Skyrim SE verschwunden ist. Der war mit 19.1.1 immer zu sehen und hatte die Farbe der ReLive-Oberfläche. War nur in Skyrim zu sehen und wirkte wie eine reingebuggte Oberfläche. Mit 18.12.1 ist er nun fort.
 
Zuletzt bearbeitet:
Vielleicht eine dumme Frage aber ist das Gehäuse richtig geerdet? Vllt ist irgendwo Kontakt zwischen MB und Gehäuse? Keine Leitungen unter dem MB oder sonst wo geführt wo es evtl. aufscheuer könnte ? Also ich Frage es, weil es mit dem HDMI Recht ungewöhnlich ist und dass das MB nach dem Power Off nicht ganz aus ist.
 
Zurück
Oben