RTX 2080 Freeze

Mavarius

Newbie
Registriert
Dez. 2016
Beiträge
7
Guten Abend,

Seit nun über 3 Wochen haben ich Stress mit der 2080. Die erste Zotac 2080 Blower konnte ich genau 1h benutzen ehe der PC abstürzte und ich nur noch in 800x600 booten konnte mit 999 Artefakten -> Vram defekt. Ich bekam eine neue 2080 und hatte 2 Wochen damit großen Spaß, kein Absturz, tolle Performance. Vor 3 Tagen fing es dann an. Am selbsten Tag installierte ich den neusten Nvidia Treiber. In einer Runde PUBG freezte mein Bild, der Sound lief weiter, die anderen zwei Monitore gingen nochmal kurz, dann ging gar nichts mehr und ich musste den PC manuell neustarten.

Ich habe bisher folgendes ausprobiert.

  • PC OCs rausgenommen
  • RAM einzeln getestet
  • Treiber mit DDU deinstalliert und neu installiert
  • Treiber mit DDU deinstalliert und 417.73 installiert
  • Windows komplett neuinstalliert
  • verschiedene Nvidia Versionen ausprobiert.

Es stürzt überall ab: Browsen, Idle aufm Desktop, Netflix, PUBG, Divinity Sin, Overwatch

Manchmal passiert Stunden lang gar nichts, wie heute nach der Windows Installation. Wenn es passiert, ich den PC schnell neustarte und sofort wieder ins Spiel zurück gehe stürzt er sofort wieder ab.

CPU und GPU sind wassergekühlt, die Temperaturen liegen zwischen 30-50 °C. Wenn der Fehler mal auftauchte, passiert es immer wieder. In der Ereignisanzeige steht ein nvlddmkm Fehler und mehrmalige Displayfehler. Der PC lief ohne Probleme 2 Jahre mit einer GTX970.

Da ich die 970 bereits verkauft habe und sie in 1-2 Tagen nicht mehr habe, werde ich morgen noch schnell damit testen. Den Fehler absichtlich herbei führen, kann ich bisher nur mit Realbench nach etwa 10 Minuten. alleine mit Prime95 passiert nichts bisher. Ich bin mit meinem Latein komplett am Ende. Das einzige was mir einfällt ist dass DOCH ein Ram plötzlich kaputt ist, das Netzteil zu wenig Leistung hat (530W), es ein Fehler mit dem Treiber ist, oder die Grafikkarte erneut defekt ist. Den Ram testen mit Memtest gelingt mir bisher nicht, da das Programm aus bekannten Gründen beim laden Abstürzt (beim booten). Die Windows Version sagt mir lediglich (cannot reallocate 4095MB)

Was ich heute und morgen testen werden: Wattvebrauch des PCs (auch wenn mir sämtliche Calculator sagen, dass 530 reichen), andere Driver Versionen, Ram Test. Mit einem Riegel ist der PC bisher noch nicht abgestürzt, da sich auch leider Realbench damit nicht starten lässt (zu wenig ram).


Der PC:

Ryzen 1700 (no oc)
3200 14-14-14-28 g.skill Trident (läuft aber gerade auf 2400)
RTX 2080 Zotac Blower (waterblock von Alphacool )
Crosshair VI Hero
SSD Samsung Evo 840 500GB
Crucial SSD 1TB
1,5TB HDD
3 Monitore (2 Full HD (60 &144hz, 1x 1440p 144hz)

+ Jede Menge Wasserkühlkram der hier denke ich nicht relevant ist.
Vielen vielen Dank fürs Durchlesen. Mein Kopf qualmt, daher sorry für die teilweise unsortierten Gedanken. Ich habe einfach null Lust zum 2. mal zu Media Markt zu latschen und 3 Tage zu warten bis ich mir wieder n Wasserblock drauf basteln kann. Ist doch kacke :(
 
Mavarius schrieb:
Da ich die 970 bereits verkauft habe und sie in 1-2 Tagen nicht mehr habe, werde ich morgen noch schnell damit testen.
Mach das, denn es höhrt sich nach defekter Grafikkarte an.
 
Die genaue Bezeichnung vom Netzteil würde helfen und hast du Mal nur mit einem Monitor getestet?

Das Netzteil sollte auch nicht zu alt sein, denn gerade neue Hardware belastet die Netzteile mit vielen Spannungsspitzen und CPU + GPU werden ständig hoch und runtergetaktet. Ältere Netzteile können damit durchaus Probleme haben. Es könnte natürlich auch ein defekt im Netzteil sein.

Die Fehlersuche gestaltet sich bei so etwas leider nicht so einfach, gerade weil du schon so viel ausprobiert hast.
 
Mal allgemein: Beim nächsten Netzteilkauf einfach mal +100W draufrechnen - es schadet generell nicht ein bisschen Headroom zu haben auch wenn das die Effizienz etwas aushebelt, aber lieber das als solche Probleme.

@TE: Die zweite Karte hat dann aber schon Samsung Ram oder hat die etwa auch noch Micron wie die erste ? Dann würds mich nicht wundern wenn die ebenfalls anfängt die Grätsche zu machen.
 
  • Gefällt mir
Reaktionen: Hatsune_Miku
Die RTX2080 sind ja bekannt dafür, dass die Speicher überhitzen.
Daran ist ja deine erste drauf gegangen.
Kühlt deine Wasserkühlung auch die Speicher auf der Karte oder nur den Chip?
Eventuell grillst du durch die WK deine Speicher.
 
  • Gefällt mir
Reaktionen: yxman
NikoNet schrieb:
Die RTX2080 sind ja bekannt dafür, dass die Speicher überhitzen.
Daran ist ja deine erste drauf gegangen.
Kühlt deine Wasserkühlung auch die Speicher auf der Karte oder nur den Chip?
Eventuell grillst du durch die WK deine Speicher.

Wenn dann sind die RTX 2080 TIs mit Micron Speicher anfälliger dafür, da diese 11 statt 8 VRam Chips haben. Aber auch nicht mehr oder weniger wenn man den Statistiken glauben darf.
Die 2080 fällt diesbezüglich so gut wie gar nicht auf, zumindest meines Wissens.

Da du die komplette Software schon getauscht hast, sieht das nach einem Hardwaredefekt aus.

Und zwei defekte neue Grafikkarten innerhalb von wenigen Wochen... also das ist schon extremes Pech, sowas hab ich eigentlich überhaupt noch nie gehört.
Hat dir der Support mitgeteilt, was mit den Karten tatsächlich nicht gestimmt hat?
Was für ein Netzteil hast du genau? Blöde Frage, aber die 2080 auch mit 1x6 und 1x8 Pin angebunden?
Du sagst, du hast alles OC rausgenommen. Wie war denn OCed? VRAM auch? Welche Module?

Für mich klingt das alles eher nach defektem (V?)RAM oder Temp Problemen (WaKü --> Spawas, VRAM usw) und oc (Volt?)?

Bin mal gespannt was die Tests mit der 970 ergeben. Schade, dass der 1700 (den ich auch selber habe plus auch 2080) keine interne GPU zum Testen hat.

Soll ich dir mal meine Voltage und Temps idle / last posten? Dann könntest du damit vielleicht testen wenn dir das hilft. Mein System läuft nach sehr langen Tests sehr stabil.

Edit: ich habe auch ein Hero (7) Motherboard. Wegen der Vergleichbarkeit usw.
Hast du im Bios die Stromversorgung auf alle Lanes enabled? Nicht umsonst hat dieses Board ja mit die Besten Spawas usw übherhaupt. Modus heisst glaube ich "Extreme" oder so und ist standardmäßig aus. Könntest du auch mal testen. Das hier sind nicht meine Werte, hab das in einem Link gefunden, aber nur die beiden Einstellungen (gelb) meinte ich:
https://rog.asus.com/articles/maxim...ngs-for-overclocking-maximus-vi-motherboards/


1551173183791.png


vg Chris
 
Zuletzt bearbeitet:
Guten Morgen,

Erst einmal vielen Dank für eure netten und hilfreichen Kommentare. Ich fasse mich kurz, da wenig Zeit.

  • die Grafikkarte war beides beides mal die selbe Charge.
  • der waterblock kühlt auch den vram, eben deshalb habe ich sogar nach dem Defekt der ersten 2080 sogar den waterblock vom heat killer auf alphacool gewechselt, damit es nicht evtl doch daran lag, auch wenn der heatkiller ebenfalls den vram und die spawas kühlte.
  • das Netzteil ist tatsächlich älter. Ich habs mal kurz ausgebaut und nachgesehen. Hatte mich vertan, es hat 580w und ist ein bequiet straight Power 580w e9 von 2013. Jap, 6 Jahre. Übrigens hatte die 970 davor 2x 8 pins. Und ja, ich habe die Grafikkarte mit dem 8er und dem 6er angeschlossen.
- die Grafikkarte lief kurz mit 150 mehr clock und der RAM mit 650 mehr. Der CPU lief mit 3,925 und der RAM mit 3200 und 14er Latenz. Vcore war beim CPU um die 1,4 meine ich. Ebenfalls waren die lanes auf extreme gestellt. Der oc lief sehr stabil (early adopter der ryzen Serie... Gott war das ein scheiß mit dem oc am Anfang) Wie gesagt, habe ich die Einstellungen alle rausgenommen. Bei der 2080 hatte ich zudem die regler für max Stromzufuhr auf max. Gedreht.

Wie gesagt, wurden CPU und gpu auch unter last nicht viel wärmer als 50 Grad. An der 2080 hab ich ansonsten nichts am vcore rumgebastelt.

- habe heute nacht 5h einfach mal Furmark durchlaufen lassen, kein Absturz. Aber erstens belastet das die 8gb vram kaum und zweitens tritt der Fehler einfach so sporadisch aus dass es frustrierend ist danach zu suchen. Grafikkarte mal eben in einen anderen PC bauen ist wegen der Wasserkühlung echt nicht praktikabel. Daher kommt gleich die 970 nochmal rein. Ich melde mich dann.


Edit: die fällt mir gerade noch ein, dass ich beim Umbau ins neue Gehäuse, zusätzlich zur Ersatz 2080, aus Platzgründen den zweiten pcie Platz genommen habe und nicht den oberen. Kann es evtl daran liegen? Hab mich davor schlau gemacht ob es einen Unterschied macht ner sogut wie nichts dazu gefunden. Und wie gesagt, lief die Karte für etwa 1 oder 2 Wochen ohne ein einziges Problem.

Übrigens, auch wenn es hier nichts zur Sache tut. Das Pech verfolgt mich etwas. Hatte mir zu der 2080 auch den neuen vg270up geholt... Der hat n serienmäßigen defekt im Panel - _- ist nicht mein Jahr bisher.

Danke euch!
 
Zuletzt bearbeitet:
Moin,

ich habe ein be quiet straight power 10 mit 600 Watt drin (mindestens 5 Jahre alt schätze ich). Ich poste dir jetzt einfach mal meine Werte, da wir fast identische Systeme haben. Vielleicht fällt dir ja was auf im Vergleich, vor allem bei der Voltage, für Temperaturen musst du eh besser sein und dafür ist der Test zu kurz. Bin allerdings komplett auf "Luft". Laut HWInfo verbraucht mein System maximal 174 Watt + 97 Watt = 271 Watt. Plus paar Hds usw, lass es 300 Watt sein overall.


1551176958998.png


1551177508841.png


1551176916751.png


Kuck dir hier auch die Ram und SOC Voltage an, hier hat es mit am längsten gedauert, das stabil und vernünftig hinzubekommen. Stock, so wie du es jetzt betreibst, ist das ja oft eine einzige Katastrophe.

Ich habe mal gelesen, dass ein sich verabschiedendes Netzteil an den Ampere (SVI2 TFN) erkennbar sein soll, bekomme ich jetzt nicht mehr zusammen, kann man sicher googeln falls richtig.

Kühlst du deine Spannungswandler Mainboard bzw. temps?
Habe einen Top Down (Stock SPire), der das mitkühlt.

vg Chris
 
Zuletzt bearbeitet:
Hey Chris, danke für die Mühe !

Ram und Soc Voltage stimmen mit meinen overclocked Spannung in etwa (1,4 Ram und 1,1 SoC) überein und ich gebe dir Recht, das ist ne mühselige Fummelei beim Ryzen. Drei Fans pusten über das MB drüber, das sollte reichen denke ich.

Ich habe nun aber 2 Sachen gefunden die evtl gegen die Grafikkarte als Verursacher sprechen.

  1. meine CPU+soc verbraucht ganze 30W weniger als deine. Ja, sie läuft gerade nicht overclocked, aber 30 Watt weniger? Die Vcore ist momentan auf auto und gibt dem CPU 1,056V
  2. Der PC ist gerade das erste mal bei P95 abgestürzt. Ne Sekunde vorher sah man wie alle worker abgeschmiert sind, dann Standbild. Ich probiere es gleich nochmal aus. Was das heißen würde, keine Ahnung. Netzteil defekt, spawas defekt, evtl einfach nur n Kabel kaputt.... ich melde mich



Edit: Mittlerweile peakt es auf 67 Watt. P95 läuft nun gerade seit 18 Minuten, ohne einen Fehler. Vorhin dauerte es 3 Minuten bei max 60 Watt und er schmierte ab. Meine güte ist das frustrierend. Ich hab schon soviele Fehler in PCs privat und beruflich diagnostiziert aber das hier ist echt nervig. Wenn ich wenigstens den Fehler abseits von Realbench herbeiführen könnte. Aber Weder Furmark noch Heaven Benchmark, Superposition oder 3DMark. Realbench ist der einzige Benchmark der es immer schafft dass er abstürzt mit dem bekannten Fehler. Und es ist der einzige Benchmark der gpu udn cpu zu 100% auslastet, gleichzeitig.
 
Zuletzt bearbeitet:
NikoNet schrieb:
Die RTX2080 sind ja bekannt dafür, dass die Speicher überhitzen.

Was völliger Unsinn ist, der vram kann nicht zu warm werden, vorher drosselt sie.
Dazu gab es auch einige Tests
 
Mavarius schrieb:
Hey Chris, danke für die Mühe !

Ram und Soc Voltage stimmen mit meinen overclocked Spannung in etwa (1,4 Ram und 1,1 SoC) überein und ich gebe dir Recht, das ist ne mühselige Fummelei beim Ryzen. Drei Fans pusten über das MB drüber, das sollte reichen denke ich.

Ich habe nun aber 2 Sachen gefunden die evtl gegen die Grafikkarte als Verursacher sprechen.

  1. meine CPU+soc verbraucht ganze 30W weniger als deine. Ja, sie läuft gerade nicht overclocked, aber 30 Watt weniger? Die Vcore ist momentan auf auto und gibt dem CPU 1,056V
  2. Der PC ist gerade das erste mal bei P95 abgestürzt. Ne Sekunde vorher sah man wie alle worker abgeschmiert sind, dann Standbild. Ich probiere es gleich nochmal aus. Was das heißen würde, keine Ahnung. Netzteil defekt, spawas defekt, evtl einfach nur n Kabel kaputt.... ich melde mich



Edit: Mittlerweile peakt es auf 67 Watt. P95 läuft nun gerade seit 18 Minuten, ohne einen Fehler. Vorhin dauerte es 3 Minuten bei max 60 Watt und er schmierte ab. Meine güte ist das frustrierend. Ich hab schon soviele Fehler in PCs privat und beruflich diagnostiziert aber das hier ist echt nervig. Wenn ich wenigstens den Fehler abseits von Realbench herbeiführen könnte. Aber Weder Furmark noch Heaven Benchmark, Superposition oder 3DMark. Realbench ist der einzige Benchmark der es immer schafft dass er abstürzt mit dem bekannten Fehler. Und es ist der einzige Benchmark der gpu udn cpu zu 100% auslastet, gleichzeitig.

Klar gerne.
Das mit dem minderverbrauch dürfte schon hinkommen, habe ja mehr vcore und 3,7 allcore. Ehrlich gesagt finde ich da deinen Verbrauch in Relation zu hoch. Meiner braucht Stock über 1,35 Volt für den Boost Takt auf einem Kern wenn "Auto". Das kann ich daheim nachsehen, aber jede CPU ist auch anders. Zusätzlich steht bei mir eben "extreme" im BIOS, Spannungsversorgung.
Aber zumindest ist es eine Tendenz.

Sieht doch danach aus, wie wenn deine CPU / soc oder ram Spannungen nicht stabil sind denke ich...expetentier mal mit der soc Spannung. Höher als stabil bedeutet hier oft instabiler als niedriger. Soll heißen, geh mal unter die 1.1. Und beim ram würde ich die Timings entschärfen und die Riegel einzeln betreiben. Mehr fällt mit grade leider a ned ein... Und natürlich ceteris paribus testen, damit sich eine Komponente zeigen kann.
Ergänzung ()

Nachtrag: wenn ich was testen will mache ich paar Durchläufe cinebench, hier bekommt man schnell freezes wennst nicht passt und dauert nur Sekunden. Dann mach ich Prime max heat und furmark 8x msaa gleichzeitig an plus einen twitch Stream. Der freezt auch sehr schnell innerhalb Minuten wenn instabil. Ram teste ich über mein Bootmenü memtest durch separat. Damit bin ich immer gut gefahren.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Mavarius
Häschen schrieb:
Was völliger Unsinn ist, der vram kann nicht zu warm werden, vorher drosselt sie.
Wenn es dem so ist, und die Karte bei zu hoher Temperatur des VRAM wirklich drosselt, wäre es mir neu.
Dann sorry dafür.
Im Netz findet man, aber trotzdem viele, die ein Problem mit den VRAMs der 2080er Karten haben.

Ob es in dem Fall zutrifft weiß ich nicht. Es war nur eine Idee im Zusammenhang mit der WK und Freezes.

Wurde denn ein BIOS Reset schon gemacht?
So kann man das Ganze mit Standardwerten testen.
 
Es wurde lediglich eine Fehlerhafte charge an VRAMs an die boardpartner ausgeliefert.
 
NikoNet schrieb:
Wenn es dem so ist, und die Karte bei zu hoher Temperatur des VRAM wirklich drosselt, wäre es mir neu.
Dann sorry dafür.
Im Netz findet man, aber trotzdem viele, die ein Problem mit den VRAMs der 2080er Karten haben.

Ob es in dem Fall zutrifft weiß ich nicht. Es war nur eine Idee im Zusammenhang mit der WK und Freezes.

Wurde denn ein BIOS Reset schon gemacht?
So kann man das Ganze mit Standardwerten testen.

Man findet im Netz eine überwältigende Menge an fehlerhaften Vrams bei der TI, Gefühlt kauft kaum einer ne 2080 wenn es danach geht.
Tatsächlich habe ich "nur" im Bios das bios resettet, aber kein cmos clear gemacht, mache ich gleich.

Danke



Nachtrag:

Der PC läuft nun Munter seit 2h mit Prime95 während ich zwischendurch surfe, Superposition und Heavenbenchmark laufen lassen. Auch Cinebench brachte es nicht zum abstürzen. sigh.
 
Zuletzt bearbeitet:
Mavarius schrieb:
- die Grafikkarte lief kurz mit 150 mehr clock und der RAM mit 650 mehr. Der CPU lief mit 3,925 und der RAM mit 3200 und 14er Latenz. Vcore war beim CPU um die 1,4 meine ich. Ebenfalls waren die lanes auf extreme gestellt. Der oc lief sehr stabil (early adopter der ryzen Serie... Gott war das ein scheiß mit dem oc am Anfang) Wie gesagt, habe ich die Einstellungen alle rausgenommen. Bei der 2080 hatte ich zudem die regler für max Stromzufuhr auf max. Gedreht.
Hast du den Speicher denn nicht übertaktet?
Reslutierend daraus hast du quasi den Speicher doch, wie bei den Ausfällen auf der Ti, thermisch überlastet.
Zuviel Spannung bedeutet ja auch Wärme.
Kann, muss natürlich nicht sein.
 
Korrigiere mich da gerne, aber ein mehr an Takt heißt nicht ein mehr an Temperatur. Erst eine Erhöhung der Spannung resultiert in höherer Temperatur. Letzteres habe ich nicht getan. Und soweit ich das gelesen habe, sind 650mhz auf dem RAM auch eher moderat.

Neue Beobachtung: Neben einem Absturz durch Realbench 2.56, ist das einzig andere, was häufig vorkommt ein direkter Absturz nach einem Freeze. So ist gerade bei Realbench der PC wie immer gefreezt. (Ton geht ohne Haker weiter, nur das Bild steht auf allen 3 Monitoren). Habe den PC neugestartet und während der PC noch den Autostart durchging gingen alle drei Bildschirme aus und nicht wieder an.

Ich stecke jetzt die Grafikkarte in den anderen PCIE Slot. Danach probiere ich die GTX970 aus. Wie gesagt, manchmal wünschte ich, ich hätte keine Wakü. Wenns mal nicht geht, ist es ein Pain in the ass. Immerhin habe ich jetzt Quick Plug an der cpu udn gpu sodass ich nicht das gesamte System leeren muss.
 
Zuletzt bearbeitet:
Zurück
Oben