MSI GeForce RTX 3080 Ventus 3X OC boostet bis zum Crash

Was mir noch einfällt, wenn ich in Windows die Ereignisanzeige anschaue steht dort folgendes:

"Display driver nvlddmkm stopped responding and has successfully recovered.”

Also würde ich schon sagen, dass es sich schwer nach einem Treiber Problem anfühlt...
 
Ohje und ich habe mir eine MSI RTX 3080 Gaming x Trio bestellt und bekomme sie, wenn die nächste Charge da ist. Ich hoffe nur, dass sich dies da erledigt hat
 
Hallo Zusammen,

habe eine MSI RTX 3080 Ventus 3x. Das gleiche Problem. Im Ltt Forum hat sich derzeit der temporäre Workaround etabliert die Karte um 30-100 Mhz mit dem MSI Afterburner runterzutakten. (Hat bei mir geholfen). Hoffe das das ganze eine Treiber Sache ist.

Wer mehr lesen möchte kann sich hier weiter informieren:
https://linustechtips.com/main/topic/1248333-rtx-3080-crash/
 
  • Gefällt mir
Reaktionen: e_Lap
  • Gefällt mir
Reaktionen: deady1000 und simosh
Hab mich mal im Nvidia Forum eingereiht und auch mal ein Ticket bei MSI aufgemacht. Mal schauen wie lange die Antwort dauert :)
 
  • Gefällt mir
Reaktionen: deady1000, simosh und EverØLucky
Viel Erfolg Leute, ist ja ätzend, dass es so losgeht mit den neuen Karten.
 
  • Gefällt mir
Reaktionen: deady1000, Porky Pig, EverØLucky und eine weitere Person
R-47 schrieb:
Kleines Update:
Bei einem 2ten PC genau das selbe Problem

Netzteile sind jeweils ein Corsair RM850i (2017) sowie ein RM750 (2019)
Das RM850i befeuerte ansonsten bis jetzt eine Vega64 LC, die ja auch kein Kostverächter ist.

Habe mal ein GPU-Z Screen und das Log dazu hochgeladen.
Man kann sehr gut erkennen, dass der Crash bei 07:07:42 passiert

@SyntaX den Auto OC Scanner laufen zu lassen, ist eine gute Idee. Mal sehen was dabei rum kommt.

Anhang anzeigen 970404
https://www.techpowerup.com/forums/threads/gpu-z-perfcap-log-number-meanings.202433/#post-3148971
hier wird beschrieben was die PerfCap Reason Nummern im GPU-Z Log besagen.
12 ist die Addition von 4+8, beides Volt-Limits
1 ist das Powerlimit
13 ist wenn 4+8+1 also die Volt-Limits zusammen mit den PowerLimit auftreten.
Im Log ist zusehen, dass unter Last zu Beginn häufig allein die Volt-Limits, später abwechselnd oder zusammen mit dem Powerlimit auftreten.
Die Volt-Limits verhindern jegliche Spannung oberhalb 1.0750V.
Kurz vorm Crash ist die Voltage aber wiedermal so tief, dass kein Voltlimit aktiv ist, die Spannung fällt auf 1.0250V der Takt ist bei 2010MHz
3 Sekunden später bei 1.0430V und 1995MHz -> 2010MHz -> 1995MHz -> Crash
Klar waren auch vorher einige Werte mit so hohen MHz bei wenig Volt, aber die Temperatur stieg zuletzt auf 71°C und genau da könnte es sein, dass diese MHz/Volt Kombination zu schwach ist.
- oder - die verfixte Sache mit der Speicher-Temperatur, die auch duch Abwärme der GPU genährt werden könnte.
 
  • Gefällt mir
Reaktionen: deady1000
R-47 schrieb:
Kleines Update:
Bei einem 2ten PC genau das selbe Problem

Netzteile sind jeweils ein Corsair RM850i (2017) sowie ein RM750 (2019)
Das RM850i befeuerte ansonsten bis jetzt eine Vega64 LC, die ja auch kein Kostverächter ist.

Habe mal ein GPU-Z Screen und das Log dazu hochgeladen.
Man kann sehr gut erkennen, dass der Crash bei 07:07:42 passiert

@SyntaX den Auto OC Scanner laufen zu lassen, ist eine gute Idee. Mal sehen was dabei rum kommt.

Anhang anzeigen 970404
verwendest du bei deinen Netzteilen after-market Kabel, z.B. von Cablemod?


Manju schrieb:
Hallo Zusammen,

habe eine MSI RTX 3080 Ventus 3x. Das gleiche Problem. Im Ltt Forum hat sich derzeit der temporäre Workaround etabliert die Karte um 30-100 Mhz mit dem MSI Afterburner runterzutakten. (Hat bei mir geholfen). Hoffe das das ganze eine Treiber Sache ist.

Wer mehr lesen möchte kann sich hier weiter informieren:
https://linustechtips.com/main/topic/1248333-rtx-3080-crash/

welches Netzteil und welche Kabel verwendest du?
 
EverØLucky schrieb:
"Display driver nvlddmkm stopped responding and has successfully recovered.”

Also würde ich schon sagen, dass es sich schwer nach einem Treiber Problem anfühlt...
Der NV-Treiber schmiert auch ab, wenn die Karte defekt ist. Heißt also nichts.
 
  • Gefällt mir
Reaktionen: deady1000
Bisher viel mir kein Crash auf. Könnte ich das irgendwie herbeitesten ?
 
ne einfach gamen, sobald es ein TDR gibt kurz nachprüfen ob es mit reduzierten Takt rund läuft und anschließend reklamieren.
Sind von 10.000 Custom Karten nur <5% betroffen, also im grunde nur die Modelle mit dem höchsten Werks OC.
Da wurde halt nicht gebindet, das Problem gab es aber schon immer außer bei Turing aber seit Ampere sortiert nvidia nicht mehr aus sondern die Partner haben wieder die volle macht über das vBIOS bzw. deren Taktraten.

Das Dilemma mit denn werks oc karten kenne ich schon zu Fermi Zeiten, am schlimmsten war es bei Kepler und Pascal.
Würde mich nicht wundern wenn nvidia nach Ampere wieder aussortiert aber dadurch steigen wieder die Preise.

Am sichersten fährt man zurzeit mit denn FE's und Karten mit Moderater Übertaktung.
Gibt aber mehr Modelle mit Extremen OC als Modelle mit Stock und "normaler" Übertaktung :heul:
Alles über 80+MHz ist grenzwertig, 100MHz ist die absolute grenze und alles über 100MHz OC ist in meinen Augen bereits extrem OC da dies nicht jeder Chip packt.

Wäre ich nvidia würde ich Übertaktung nur dem User überlassen und es dem Partner verbieten.
Dadurch gebe es fast gar keine falsch Meldungen mehr zu bugs etc. allgemein können Fehler präziser gefunden werden.
Aber diesen schritt wird sich nvidia nicht trauen weil sie wissen wie sich die Medien darauf stürzen, siehe A und B Chips, gabs direkt mimimimi

Das Werks-OC finde ich auch unfair gegenüber denn Partnern die Stabile Karten bringen wollen.
Die Partner mit höchsten Werks-OC juckt Stabilität 0, Hauptsache längsten Balken auf denn review Seiten und die Kunden kaufen nun mal Karten mit denn längsten Balken.

Ich gehe stark davon aus, falls sich die Meldungen häufen wird nvidia mit denn Partnern kommunizieren und die bringen ein BIOS raus mit reduzierten Taktraten oder nvidia bringt selbst dafür ein tool raus wo nur ein paar bytes im BIOS überschrieben werden ähnlich wie der Displayport BIOS fix vor ein paar Jahren.

EverØLucky schrieb:
Was mir noch einfällt, wenn ich in Windows die Ereignisanzeige anschaue steht dort folgendes:

"Display driver nvlddmkm stopped responding and has successfully recovered.”

Also würde ich schon sagen, dass es sich schwer nach einem Treiber Problem anfühlt...

nope das ist ein TDR damit die Karte nicht denn ganzen PC zum abstürzen bringt.
TDRs sind in 99% der fälle immer zu hohe Taktraten, lediglich 1% sind Treiber Bugs.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Nobbi56, Stuntmp02 und Flare
Ein großer Teil der Nutzer mit dem Problem hier, in den verlinkten Foren und auf Reddit hat eine Gemeinsamkeit:
Ein Netzteil von Corsair mit 750-850W.

Sind die Dinger einfach sooo verbreitet? Oder kann das vielleicht doch damit zusammenhängen?

Ich erwarte meine 3080 Ventus morgen früh ... natürlich passend mit einem 750W Netzteil von Corsair.
 
  • Gefällt mir
Reaktionen: e_Lap und deady1000
Die sind einfach so verbreitet. RMx, TX, HX, VS, alles sehr beliebte Serien.
 
  • Gefällt mir
Reaktionen: e_Lap
Haha, meine MSI Ventus OC kommt morgen. Soll ich die behalten? Will da eh im Oktober einen Wasserkühler von Alphacool oder Byskski draufschnallen. Auch wenn die Karte crasht... 2040MHz unter Luft klingen erstmal nett. Denke da sollten die 2GHz unter Wasser doch stabil bleiben oder? Ggf noch mit Undervolting auf 0.9V. Hat die Karte schon mal jemand undervoltet? Welchen Takt erreicht man mit 0.9V? Vielen Dank!

PS:
Würde erstmal sagen MSI hat bei der Karte ein schlechets BIOS installiert, dort scheinen nämlich die Spannungen nicht zum Takt zu passen. Gleichzeitig takten sie wohl auch zu aggressiv und es kommt obendrein möglicherweise zu heftigen Lastspitzen, womit einzelne Netzteile nicht klarkommen.

Denke auch man muss differenzieren zwischen PC-Absturz/Abschaltung (Lastspitze, Netzteilabschaltung, ggf schlechtes Netzteil) und Treiberabsturz/Bildfehler/Spieleabsturz (Instabilität der GPU durch zu niedrige Spannung bzw zu hohen Takt). Das könnten zwei separate Probleme sein, die nicht direkt was miteinander zutun haben.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Nobbi56
@deady1000 Habe das eben mal quick and dirty mit meiner Ventus getestet. Denke man kommt mit 900mV irgendwo zwischen 1.725 und 1.800 Mhz raus. Mit 1.800 hatte ich relativ direkt einen Crash To Desktop und mit 1.725 Mhz lief Doom Eternal äußerst geschmeidig. Kommt natürlich auch auf die Chipgüte und ggf. die Temps an.

uv_3080.png
 
  • Gefällt mir
Reaktionen: deady1000
Das OC egal ob ab Werk oder via Afterburner offset und Co ist im Wesentlichen nichts Anderes als den Clocktable gegen den VoltageTable zu verschieben. Im Tieferen liegt dahinter noch sowas wie ein detailierterer Table in dem auch Lasten mit einbezogen wurden, dieser ist aber fest im vBios-Anteil den selbst die Boardpartner nicht ändern können.
Es gibt meiner Meinung nach mehrere Möglichkeiten offiziell zu handeln ohne die beworbenen Boostwerte senken zu müssen:
1. Um Probleme zu vermeiden ein ab Werk eingestelltes Taktlimit über das Boost nicht darf, natürlich mit Tools nutzerveränderbar.
2. Der von Nvidia hinterlegte Volt/Frequenz Table bekäme stabilere/höhrer Voltages, hier würde das Powertarget dann auch zu leicht niedrigeren Takten führen.
es gibt aber bestimmt noch mehr Möglichkeiten
 
Its
Häschen schrieb:
ne einfach gamen, sobald es ein TDR gibt kurz nachprüfen ob es mit reduzierten Takt rund läuft und anschließend reklamieren.
Sind von 10.000 Custom Karten nur <5% betroffen, also im grunde nur die Modelle mit dem höchsten Werks OC.
Da wurde halt nicht gebindet, das Problem gab es aber schon immer außer bei Turing aber seit Ampere sortiert nvidia nicht mehr aus sondern die Partner haben wieder die volle macht über das vBIOS bzw. deren Taktraten.

Das Dilemma mit denn werks oc karten kenne ich schon zu Fermi Zeiten, am schlimmsten war es bei Kepler und Pascal.
Würde mich nicht wundern wenn nvidia nach Ampere wieder aussortiert aber dadurch steigen wieder die Preise.

Am sichersten fährt man zurzeit mit denn FE's und Karten mit Moderater Übertaktung.
Gibt aber mehr Modelle mit Extremen OC als Modelle mit Stock und "normaler" Übertaktung :heul:
Alles über 80+MHz ist grenzwertig, 100MHz ist die absolute grenze und alles über 100MHz OC ist in meinen Augen bereits extrem OC da dies nicht jeder Chip packt.

Wäre ich nvidia würde ich Übertaktung nur dem User überlassen und es dem Partner verbieten.
Dadurch gebe es fast gar keine falsch Meldungen mehr zu bugs etc. allgemein können Fehler präziser gefunden werden.
Aber diesen schritt wird sich nvidia nicht trauen weil sie wissen wie sich die Medien darauf stürzen, siehe A und B Chips, gabs direkt mimimimi

Das Werks-OC finde ich auch unfair gegenüber denn Partnern die Stabile Karten bringen wollen.
Die Partner mit höchsten Werks-OC juckt Stabilität 0, Hauptsache längsten Balken auf denn review Seiten und die Kunden kaufen nun mal Karten mit denn längsten Balken.

Ich gehe stark davon aus, falls sich die Meldungen häufen wird nvidia mit denn Partnern kommunizieren und die bringen ein BIOS raus mit reduzierten Taktraten oder nvidia bringt selbst dafür ein tool raus wo nur ein paar bytes im BIOS überschrieben werden ähnlich wie der Displayport BIOS fix vor ein paar Jahren.



nope das ist ein TDR damit die Karte nicht denn ganzen PC zum abstürzen bringt.
TDRs sind in 99% der fälle immer zu hohe Taktraten, lediglich 1% sind Treiber Bugs.
You are right. Nvidia shouldnt accept fabric OC by other vendors. Now are many problems with oc cards. Also i want to buy tommorow rtx 3090 what versions should i skip? I dont wanna oc version.
 
Aber du solltest alle OC Versionen meiden, oder den Weg nachträglich "ständig" ein Tool zu brauchen tolerieren.
Solange keine endgültige zufriedenstellende offizielle Werks-Lösung für alle betroffenen Karten existiert.
Man es ist echt traurig das Niemand diesem OC-Winner-Marketing Einhalt gebietet.
Und ich kann das diletantische Werks OC seit Maxwell II 100% bestätigen, nach dem Motto denn sie wissen nicht was sie tun. Es gibt Beispiele wo ich nur durch das Angleichen der Taktdomains und Taktsenkung bessere Ergebnisse bekam als duch das Chaos was die AiBs im Bios angerichtet hatten.
 
Mal eine andere Frage, nehmen wir mal an Nvidia kann das Problem nicht mit einem Treiber Update fixen und man ist "gezwungen" über den Afterburner den Takt zu senken, dass es funktioniert oder die Karte einzusenden bzw. zurück zu geben.

Dann kann ich doch die Karte während der Garantie immer einsenden oder? Heißt ich könnte jetzt theoretisch 1,5 Jahre damit leben und bekomme dann eine "neue" oder eventuell reparierte Karte wenn ich mich dann melde...

Habe jetzt ehrlich gesagt auch einfach keine Lust die Karte an MSI zu schicken oder innerhalb der 14 Tage Widerruf an den Verkäufer um dann Monate auf eine neue Karte zu warten...

Wie seht ihr das?
 
Zurück
Oben