RTX 3070 + Treiber 460.89 = Blackscreens / Reboots (nur) in Spielen

McQ

Ensign
Registriert
Jan. 2013
Beiträge
247
1. Nenne uns bitte deine aktuelle Hardware:

  • Prozessor (CPU): Ryzen 5 5600X @ Stock Settings
  • Arbeitsspeicher (RAM): 32GB (2x 16GB) Crucial Ballistix 3200 @ XMP 3200
  • Mainboard: MSI B550 Gaming Plus
  • Netzteil: Seasonic Focus GX 650W
  • Gehäuse: Fractal R5
  • Grafikkarte: Asus ROG Strix RTX 3070
  • HDD / SSD: 1x Samsung EVO 970 M.2 NVMe

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden(zusätzliche Bilder könnten z.b. hilfreich sein):

Vorgestern 1660ti ausgebaut (ich meine 460.79 war bis dato installiert) - das System lief bis dato 100% stabil. RTX 3070 eingebaut (2x 8 Pin, zwei separate Kabel) + 460.89 installiert (Option: Treiber Neuinstallation). Ein paarmal Time Spy laufen lassen, ein bisschen mit Afterburner rumgespielt mit leichtem OC -> alles OK. Temperaturen max. 65 Grad GPU, Benchmark-Resultate gemäß Erwartungen.

Gestern das erste mal den Spielbetrieb aufgenommen. Cyberpunk (1440p / High-Ultra / RTX+DLSS @ ca. 60FPS). Nach 15 Minuten: Black Screen, Sound noch 3 Sekunden zu hören, System rebootet. Daraufhin habe ich die OC Einstellungen der GPU komplett zurückgesetzt. Spiel neugestartet: nach 10 Minuten selbes Problem. Google angeschmissen: 3 Millionen Einträge + teils esoterische Workarounds/Fixes. Bissel rumgespielt an den einfachen Fixes/Einstellungen. Cyberpunk gestartet, wieder nach 10 Minuten gleiches Problem.

Dann keine Lust mehr gehabt, den Abend mit Cyberpunk-Fixing zu verbringen und Vermintide 2 gestartet (Extreme Settings @ 120FPS). Nach 15 Minuten im Spiel: Black Screen, Sound noch zu hören, nichts geht mehr (jedoch kein Reboot).

Genervt: 20 Minuten Time Spy (Demo + Benchmark) laufen lassen -> ohne Probleme. 10 Minuten Furmark + Prime 95 auf Volldampf laufen lassen -> ohne Probleme.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?

Temperaturen gecheckt: die GPU geht bis max. 65 Grad, egal welche Anwendung. Die CPU wird in Cyperpunk teils knapp 80 Grad warm (nach 10 Minuten Cinebench R23 nur 65 Grad btw). Das ist zumindest auffällig, aber aus meiner Sicht nicht problematisch. Ein thermisches Problem kann ich meiner Meinung nach ausschließen.

Last- und Stromverbrauch überwacht: im synthetischen Max-Load Furmark + Prime 95 gleichzeitig zieht die GPU 275W, die CPU 75W gemäß Afterburner OSD. Rechne ich noch 50W oben drauf, lande ich bei 400W. Bleiben noch 250W + Puffer. Das während der Spiele Spikes mit deutlich größer als 250W zusätzlich entstehen, halte ich für unwahrscheinlich. Und das das NT deswegen abschaltet erst recht, zumal das Seasonic ja kein Chinaböller ist.

Bisherige Maßnahmen: GPU auf Stock Settings, Win 10 Energieoptionen auf Höchstleistung, Full-Screen Optimizations aus. Treiber müssten alle auf dem neuesten Stand sein meine ich, zumal das System vor 3 Wochen komplett neu aufgesetzt wurde.

Bevor ich die Nadel im Heuhaufen suche: wo würdet Ihr mit der Fehlersuche beginnen bzw. wie würdet Ihr gezielt vorgehen?
 
Zuletzt bearbeitet:
Mal mit DDU Treiber komplett deinstallieren und aktuellen installieren.

461.09

CP77 auch mal neu installieren.
 
  • Gefällt mir
Reaktionen: Maggolos und marzk
Versuche die Karte mal um 50-100 MHZ zu untertakten. Alternative: Senke testweise via Afterburner das Powerlimit um wenige Prozent.
 
Es macht auch viel Sinn, eine neue Karte als erstes zu übertakten. Noch mehr Sinn macht es bei diesen Karten, die sowieso schon am Limit laufen und OC kaum messbare Vorteile bringt :freaky:

Meine 3070 läuft mit dem 456.69 bis jetzt problemlos, mehr als 200W hat sie beim spielen noch nie gezogen...
 
Hi-Fish schrieb:
Es macht auch viel Sinn, eine neue Karte als erstes zu übertakten. Noch mehr Sinn macht es bei diesen Karten, die sowieso schon am Limit laufen und OC kaum messbare Vorteile bringt :freaky:

Meine 3070 läuft mit dem 456.69 bis jetzt problemlos, mehr als 200W hat sie beim spielen noch nie gezogen...

Es geht hier nicht um die Sinnfrage. Wie geschrieben, tritt das Problem ebenfalls bei Stock-Settings auf.

Werde heute Abend wie vorgeschlagen 461.09 mit DDU aufzuspielen und berichten. Danach geht es mit dem Powerlimit-Tests weiter.
 
  • Gefällt mir
Reaktionen: xpgx1
Afterburner mit Kompatibilität für die 3070 ist soweit mir bekannt noch beta....Hast du mit einem anderen Tool, z.b. GPU-Z, geschaut ob die Karte wirklich wieder auf Werkseinstellungen läuft?
 
Zumindest im OSD wurde der Stock-Takt wieder angezeigt (1950MHz / vorher mit OC ca. 2050MHz) - werde ich aber nochmal mit GPU-Z nachprüfen.
 
Alter Schwede, wenn das wirklich die Ursache war: f*ck me. Bevor ich mich an Treiber, BIOS-Settings usw. gemacht habe, habe ich das Gehäuse geöffnet um nochmal zu prüfen ob alle Anschlüsse etc. korrekt sind und die GPU richtig sitzt usw.

Was sehe ich: zwei blinkende LEDs an der Grafikkarte über den beiden Power-Connectors. Bei ausgeschaltetem System wohlgemerkt komischerweise. Kurz gegoogelt: https://linustechtips.com/topic/1282100-asus-strix-3070-o8g-red-led-blink-at-power-connector/

Dann die Verkabelung geprüft: siehe da, einer der beiden 8-Pin Stecker sitzt nicht richtig / ist nicht eingerastet. Daraufhin nochmal alles fest angedrückt.

Was soll ich sagen: ich komme gerade aus einer problemlosen 45 Minuten Session Cyberpunk.

Ich werde weiter berichten ;)
 
  • Gefällt mir
Reaktionen: xpgx1
So, die gute Nachricht: an meiner Blödheit mit dem Kabel lag es nicht - war anscheinend eher Zufall. Die schlechte Nachricht: Gestern nach 20 Minuten Vermintide 2 Black Screen + Reboot.

Daraufhin:

  1. neuestes MB-BIOS aufgespielt: nach 10 Minuten Furmark Black Screen + Reboot (Stock-Settings, Afterburner aus)
  2. 461.09 mit DDU (Safe Mode) installiert: 5 Minuten Furmark Black Screen + Reboot (Stock-Settings, Afterburner aus)
  3. Im BIOS PCIe Gen 4 auf Gen 3: 5 Minuten Furmark Black Screen + Reboot (Stock-Settings, Afterburner aus)
  4. Gehäuse auf, alle Lüfter auf 100%: 5 Minuten Furmark Black Screen + Reboot (Stock-Settings, Afterburner aus)
  5. Afterburner an, Power Target auf 95%: Furmark 1 Stunde ohne Probleme

@racerli : Danke für den Tipp!

Frage: wie macht man hier weiter? Kann ja nicht sein, dass die Karte "out of the Box" crasht und man nur mit reduziertem PT zu einem stabilen Betrieb kommt...

Hat die Karte einen Defekt? Netzteil ne Macke? Gibts irgendwelche Bug-Fixes?
 
Folgendes brachte keinen Erfolg:

XMP aus
Downgrade auf 457.51
Chipset-Treiber nochmals aktualisiert
Switch von Quiet Mode auf Performance Mode per Schalter auf der Karte

Ich bin inzwischen zu einer Erkenntnis gekommen: die Karte hat ein Temperaturproblem.

Ich habe nochmals diverse Furmark-Testreihen gefahren: GPU Lüfter auf 65/75/100% manuell, Gehäusewand auf/zu, Gehäuselüfter 5/7/12V.

Ab 73+ Grad GPU-Temperatur steigt die Karte aus uns es kommt zu einem Reboot. Alles unter 70 Grad läuft stabil bei Stock 100%+ PT / 280W GPU Power (30+ Minuten Furmark).

RTX 3070 sind meines Erachtens für 80 Grad und mehr ausgelegt - 73 sollten maximal unkritisch sein.

Würdet Ihr sagen, dass dies Grund für eine RMA-Abwicklung ist? Und seht Ihr hier andere Möglichkeiten?
 
Wie geschrieben: die Karte ist zuerst in einem Spiel gecrasht. Furmark dient dann halt den Tests - und wer bei 73 Grad von Grillen spricht, der meint wohl eher sanftes Garen.
 
Vielleicht ist ein Schaden entstanden, durch den Stromanschluss der nicht richtig saß.
 
mospider schrieb:
Vielleicht ist ein Schaden entstanden, durch den Stromanschluss der nicht richtig saß.
Eher unwahrscheinlich, da die GPU bei Temps unter 73 Grad stabil läuft (30+ Minuten Furmark).
 
  • Gefällt mir
Reaktionen: xpgx1
Wahrscheinlich hast du recht aber durch einen Wackelkontakt können bestimmt auch Bauteile beschädigt werden.
 
Auf die Gefahr hin mich direkt bei einigen unbeliebt zu machen: Was der Mann mit seiner GPU macht ist ja wohl seine Sache. Furmark ist nicht necromancy und auch keine Last die Schäden hervorrufen kann - sofern alles korrekt angeschlossen ist und ein Kühler existiert und funktioniert =) Das muss das Boot, oder die Karte in diesem Fall, schon abkönnen - Ende. So, das hilft jetzt keinem. Zu deiner Frage, McQ:

Absolut. Wenn meine RTX 3070 bei 73°C reproduzierbar zu einem CTD / Blackscreen / Reboot führen würde, würde ich umgehend den Händler oder eben den Hersteller kontakten. Aber: Da sind wir mMn noch gar nicht. =)

Ich würde mal versuchen eine völlig andere Festplatte/SSD mit einem vanilla Windows zu testen. Ernsthaft, auch wenn du alles andere mit DDU usw durchgenudelt hast. Schau dir die Karte mal in einem anderen PC (wenn das möglich ist) oder mit einer neuen OS Umgebung an - und installiert bitte keinerlei third party OC software -> I'm looking at you RivaTuner/Afterburner/whatever. Mir würde es darum gehen das wir eine 0815 baseline haben wo keinerlei software reinfunkt => gleiches Ergebnis?

In so einem Fall geht es dann wirklich stetig Richtung HW-Problem, die Frage ist nur welches Bauteil schuld ist =) Wenn du es rausfinden willst kommst du um einen Netzteil Tausch (temporär, besser wäre der völlig fremde pc) nicht umher - zumindest nicht aus meiner Sicht. Klar ist dein PSU ausreichend, ich habe zb auch "nur" ein Corsair RM650i, aber Fehler dieser Art sind einfach ein gut dokumentiertes Problem dieser Karten.
 
Nur zur Info:

Ich hatte es inzwischen nochmals genau reproduzieren können, da ich wissen wollte ob andere Komponenten durch die Abwärme der GPU eventuell Fehler produzieren:

Vorher: Memtest, 2,5 Stunden: 0 Fehler.

Dann Gehäusewand geöffnet, alle Lüfter auf 12V, NT-Lüfter von semi-passiv auf aktiv. Per Afterburner die Drehzahl auf 50% fixiert, Furmark an. Nach rund 4 Minuten werden 73-74 Grad erreicht, nach 5 Minuten Reboot. Ich habe dann noch ein bisschen getweakt (GPU-FAN leicht rauf, Takt / PT runter) - mit reproduzierbaren Resultaten.

RAM, Netzteil usw. werden dabei handwarm, Systemtemp max 45 Grad, CPU max. 56 Grad. Die 12V Schiene ist stabil zwischen 11,95 und 12,05, kein Spannungsabfall vor Reboot erkennbar.

Wenn ich die Karte auf den Performance-Modus stelle, kann ich easy fordernde Spiele wie Cyberpunk über lange Zeiträume spielen, da die GPU nicht über 65 Grad geht - hier performt die Karte absolut gut/normal. Wenn ich in den Quiet-Mode schalten würde, würde ich über 73 Grad kommen und es käme 100% zum Reboot.

Inzwischen stehe ich mit Asus im Kontakt bzgl. einer RMA-Abwicklung bzw. eines Austausches. Es scheint einfach ein komischer Bug zu sein - ich tippe auf leicht defektes Bauteil, welches bei Hitze aussteigt.
 
  • Gefällt mir
Reaktionen: xpgx1
Ah alles klar - super! Ne ganz klar die richtige Entscheidung mMn da direkt sich an Asus zu wenden. Weil du hast dich da schon ausführlicher mit befasst - wir sind halt keine Experten mit gutem Werkzeug =)

Ich denke auch das da evtl. irgendein Bauteil auf dem PCB nicht mitmacht, evtl isses auch der VRAM - who knows. Das kommt leider vor, ich bin in jedem Fall gespannt was hieraus wird.
 
Hey McQ,

wie ist Deine Asus Strix RTX 3070 Geschichte denn ausgegangen?
War es ein Defekt bzw. hat Dir Asus eine neue Karte geschickt, die dann problemlos lief oder lag der Fehler doch woanders?

..meine Neugier kommt daher, dass ich mit eben der gleichen Karte eben jenes Problem auch habe.
Von daher wäre ich über jeden Input dankbar :)
 
Zurück
Oben