GPU (VRAM) Stresstesting

ChaosCoders

Banned
Registriert
Sep. 2019
Beiträge
24
Hallo zusammen,

ich hab ein Problem: Meine Grafikkarte (MSI RX Vega 56 Airboost OC) stürzt immer wieder ab und meine Recherche hat ergeben, dass es am meisten Sinn macht die Karte als Garantie Fall bei Mindfactory (wo ich sie vor einem Jahr gekauft hab) einzuschicken - es handelt sich möglicherweise um ein Temperatur Problem.

Leider kann ich das Problem noch nicht wirklich reproduzieren, ich habe jetzt schon öfters über längere Zeit ( ~2 Stunden) Furmark laufen lassen aber die Grafikkarte weigert sich abzustürzen. Die Temperatur des Chips liegt dann etwa bei 70 bis 85 °C, allerdings nutzt Furmark kaum VRAM wie ich gesehen hab.
Meine Vermutung: Da der HBM2 Speicher ja dafür bekannt ist heiß zu werden, könnte es daran liegen? Um das zu Testen bräuchte ich einen Benchmark/Stresstest der gezielt den GPU Speicher auslastet... Irgendwelche Vorschläge welchen Stresstest ich da nutzen kann?

Ausserdem wäre ich euch dankbar für ein Tool mit dem ich die Temperatur der GPU aufzeichnen kann - am besten VRAM und GPU Sensoren getrennt. Ich weiß dass Tools wie OpenHardwareMonitor, Adrenalin oder HWInfo solche Features eingebaut haben, jedoch ist es bei diesen Tools meines Wissens nach nicht möglich die ganze Zeit aufzuzeichnen und automatisch zu speichern sodass bei einem Absturz die Temperatur zur Zeit des Absturzes gespeichert wird.

Viele Grüße :)
 
Bist du sonst zufrieden mit der Karte? Dann wäre es IMO die bessere option zu schauen ob du mit leichtem underclocking die Karte stabil bekommst.
Die Vegas sind EOL, da bekommst du den Zeitwert und wenn ich mir die damaligen Preise anschaue wirst du da vermutlich mindestens 100€ drauflegen dürfen um Leistungsmäßig da zu landen wo du jetzt bist.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: ChaosCoders
Wenn du das gesamte System insbesondere die GPU und RAM ganz gut aufheizen und belasten möchtest, bietet sich nach wie vor auch The Witcher 3 auf der Skellige Map an.

Wenige Spiele heizen den gesamten PC so ein wie dieses Spiel auf dieser Map. Da habe ich bisher noch jede Schwachstelle gefunden.

Damit habe ich damals auch das UV und OC meiner RX Vega 56 Nitro+ verifiziert.
 
  • Gefällt mir
Reaktionen: ChaosCoders
GPU-Z wie schon erwähnt und ein Logfile unter dem Reiter Sensoren erstellen, dies kann dann nach nem Absturz eingesehen werden und deine restliche komplette Hardware angeben wäre auch nicht verkehrt. Und was passiert bei dem Absturz?
 
sebbolein schrieb:
GPU-Z kann alles mögliche auslesen und auch aufzeichnen.
Stimmt, danke das funktioniert glaub ich. Hab noch nicht gegoogelt - aber hat jemand zufälligerweise nen Tool zur Hand womit man sich die Werte in einem Diagramm grafisch darstellen lassen kann? Wenn nicht muss ich wohl selbst was machen... :evillol:
Stormfirebird schrieb:
Die Vegas sind EOL, da bekommst du den Zeitwert und wenn ich mir die damaligen Preise anschaue wirst du da vermutlich mindestens 100€ drauflegen dürfen um Leistungsmäßig da zu landen wo du jetzt bist.
Hab schon mit MF telefoniert deswegen, die meinten sie haben eventuell eine als Restbestand oder so noch da.... Wenn nicht hoffe ich eigentlich darauf dass ich einfach eine andere Leistungsmäßig identische Karte bekomme - kann nicht sein dass ich vor nem Jahr 240€ ausgegeben hab und jetzt meine Garantie quasi "verfällt" nur weil die Karte nicht mehr produziert wird. Werd ich mich dann wenn es soweit ist drum kümmern müssen... :(

SV3N schrieb:
Wenn du das gesamte System insbesondere die GPU und RAM ganz gut aufheizen und belasten möchtest, bietet sich nach wie vor auch The Witcher 3 auf der Skellige Map an.
Werde ich mal probieren, danke für den Tipp 👍
SV3N schrieb:
Damit habe ich damals auch das UV und OC meiner RX Vega 56 Nitro+ verifiziert.
Stormfirebird schrieb:
Dann wäre es IMO die bessere option zu schauen ob du mit leichtem underclocking die Karte stabil bekommst.
Das mit dem Undervolting probiere ich dann sobald ich es schaffe den Absturz gezielt herbeizuführen... Dann kann ich ja erst validieren ob es wirklich was gebracht hat.

Da sich hier ja einige mit der V56 auszukennen scheinen... Ist jemandem das Problem bekannt dass die Karte unter Last plötzlich die Lüfter auf 100% aufdrehen, dann alle Bildschirme schwarz werden und man einen Neustart erzwingen muss? Das Internet hat leider meiner Recherche nach keine wirkliche Lösung oder Ursache gefunden außer "eventuell etwas mit Hitze".
 
  • Gefällt mir
Reaktionen: SVΞN
Hach wie wäre die restliche Hardware so ... und wie stürzt der PC ab "beschreiben bitte"...

Weil es kann auch einfach nur am Netzteil liegen was bei voller Last abkackt .
 
  • Gefällt mir
Reaktionen: Tunguska
  • Gefällt mir
Reaktionen: goodnight und ChaosCoders
ChaosCoders schrieb:
kann nicht sein dass ich vor nem Jahr 240€ ausgegeben hab
Doch genau das. Die gleiche Leistung kostet soweit ich das sehe jetzt sogar einen Ticken mehr und darauf wird sich Mindfactory nicht einlassen. 50% Abschlag beim Zeitwert würde mich nicht überraschen, mit gut zureden etwas weniger. Minfactory ist nicht so der Kulanz Laden, dafür halt meist günstig beim Einkauf :daumen:

Wenn du den Fehler reproduzieren kannst und einen Austausch möchtest bei Minfactory, lass dir das davor explizit zusichern ob sie dir wirklich noch eine Karte haben.
 
  • Gefällt mir
Reaktionen: ChaosCoders
xxMuahdibxx schrieb:
Hach wie wäre die restliche Hardware so ... und wie stürzt der PC ab "beschreiben bitte"...

Weil es kann auch einfach nur am Netzteil liegen was bei voller Last abkackt .
Es geht hier eigentlich nicht um die Lösung des Problems sondern um die Suche nach einem Tool zum VRAM stresstesten. Falls du dich trotzdem an der konkreten Lösung beteiligen möchtest hier die Sepcs:

CPU: Ryzen 5 3600 (PBO aktiviert)
GPU: AMD Radeon vega 56 MSI Airboost OC (nicht übertaktet, Treiber aktuell)
RAM: 16 GB GSkill Trident Z 3200Mhz CL 16
Mainboard: Asus Prime X470
Netzteil: Riotoro Enigma G2 650W (Nachbau eines Seasonic Netzteils, hat mit guten Bewertungen in einem Netzeiltest abgeschnitten)
Gehäuse: BeQuiet Silent Base 801 (3 Lüfter installiert)
2 Sata SSDs, eine NVME SSD, denke die spielen hierbei keine Rolle...
Ergänzung ()

Viper1982 schrieb:
https://www.igorslab.de/amd-radeon-...d-das-richtige-auftragen-von-waermeleitpaste/

Hier auch noch was interessantes vom Igor bezüglich der Vegas. Was passiert denn wenn du die Lüfter manuell mal auf 100% stellst und dann was Zockst?
Schau dir mal die Hotspottemperatur mit GPUZ an die wird dort aufgelistet und wenn deine Karte eh schon 85Grad warm wird dann ist der Hotspot vermutlich auch höher.
Cooler Artikel, sehr interessant. Mache dann nochmal nen paar Tests und achte auf die Hotspot Temperatur... :)


Stormfirebird schrieb:
och genau das. Die gleiche Leistung kostet soweit ich das sehe jetzt sogar einen Ticken mehr und darauf wird sich Mindfactory nicht einlassen. 50% Abschlag beim Zeitwert würde mich nicht überraschen, mit gut zureden etwas weniger. Minfactory ist nicht so der Kulanz Laden, dafür halt meist günstig beim Einkauf
Uff, ok - dass ist zwar nicht das was ich unter Garantie verstehe aber das werde ich dann ja sehen. Hab gerade nachgeschaut, würde noch kanpp 140€ bekommen :freak: :schluck:
 
Zuletzt bearbeitet:
xxMuahdibxx schrieb:
und wie stürzt der PC ab "beschreiben bitte"...

wäre immer noch gut zu wissen ... denn was bringt ein VRAM Test wenn es gar nicht daran liegt ?
 
xxMuahdibxx schrieb:
wäre immer noch gut zu wissen ... denn was bringt ein VRAM Test wenn es gar nicht daran liegt ?
=>
ChaosCoders schrieb:
Ist jemandem das Problem bekannt dass die Karte unter Last plötzlich die Lüfter auf 100% aufdreht, dann alle Bildschirme schwarz werden und man einen Neustart erzwingen muss?
Geschieht unter Last. Temperaturen sind normal. Hab gerade wieder so einen Absturz gehabt, die Temps von allem geloggt und die sind eigentlich durchweg ok. Hab Apex Legends auf maximalen Settings in FullHD gespielt, hänge den Log mal an. Aktuell sind 4 Bildschirme angeschlossen, es passiert aber auch wenn nur zwei angeschlossen sind.

VRAM kann man wohl (zumindest Temperatur bedingt) mittlerweile ausschließen da die Temperaturen in den Logs ok sind.

EDIT: Header zeile beim Log hinzugefügt.
 

Anhänge

Zuletzt bearbeitet:
Die Karte ist vom Hersteller leicht übertaktet, das Kühldesign ist bescheiden. Die Karte hat zwei Bios, TDP mit 210W und 150W. Schon immer empfiehlt sich bei Vega gute Kühlung.

  • >80°C GPU
  • >90°C VRAM
  • >100°C Hotspot(Link aus #8?)
  • Lüfter max 66%(ist wohl das erträglichste)
  • Power 250W(Standard oder selber erhöht?)

Paar Grad weniger könnten womöglich den Unterschied machen.
Es geht darum, eine Tendenz zu finden, was die Abstürze verhindert. Temperatur/Power/UV wäre ein einfacher Ansatz zum Testen.

Bios mal umgeswitcht? Abstürze auch beim 150W Bios?
Gehäusetemperatur?
Bei offenem Gehäuse?
100% Lüfter?
Unterschiede?
 
  • Gefällt mir
Reaktionen: ChaosCoders
goodnight schrieb:
Bios mal umgeswitcht? Abstürze auch beim 150W Bios?
Nicht BIOS geswitched aber in Afterburner Powertarget geändert (aktuell Silent Bios aktiviert). Stürzt sowohl bei 165W als auch bei ca 250W ab.
Gehäuse Temperatur ist eigentlich sehr gut, hab zwei Lüfter die vorne Luft einsaugen und einen der hinten rauspustet. Offenes Gehäuse ändert nix. Grafikkarte ist mit dem Lüfter nach oben montiert, der kriegt also auch genug Luft.
100% Lüfter hab ich noch nicht probiert, ist aber bei dem Blower Design ehrlich gesagt keine akzeptable Lösung - da fängt der Tisch an zu vibrieren xD

Danke für die Mühe an alle :)
Ich dokumentiere weiter die Abstürze, und schaue mal was die Temperaturen so sagen. Wenn ich bei den Abstürzen weiterhin feststelle dass die Temperaturen überhöht sind wechsel ich vllt auf eine andere Kühlung (Wasserkühlung war sowieso geplant). Sollte es trotz normaler Temperaturen Abstürze geben wende ich nochmal an Mindfactory.
Wo wir gerade dabei sind:
Was sind denn gute (Hotspot) Temperaturen für HBM und GPU bei Vega? Hab gelesen das ab >106°C die Notabschaltung greift (oder greifen sollte) aber macht das Temperaturen von 80 bis 90°C zu "guten" Temperaturen?
 
Gute Hotspottemperaturen wären um die 80 Grad und bei dir sinds über Hundert und zwar durchgehend was das Abschalten erklärt. Also Kühler runter Paste neu. Oder gleich nen Kühler eines Drittherstellers montieren denn du besitzt ja den "Standardkühler" (Blower).

https://www.computerbase.de/forum/threads/asus-rog-strix-rx-vega64-oc-schmiert-ab.1944319/page-2

Hier jemand mit ner Vega 64 bei dem auch nur das erneuern der Paste geholfen hat.

Hot.png

Und so sah sein Temperaturverlauf beim Absturz aus da hast du ja noch "Glück" das deine länger warm bleibt bevor se abschmiert. Und er hatte danach auch Temperaturen um die 80 Grad am Hotspot und alles ward gut.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: ChaosCoders
Hätte mir damals wohl auch eine 56 angeschafft. Als die Wasserkühler da waren, gab's nur leider keine Karten mehr zum UVP. Mit Luft hätte ich die Referenzkarte sonst nie genommen.
Kühler ab und neue Paste drauf unter Beachtung der Hinweise im Link aus #8 wäre meine erste Wahl, ansonsten vielleicht gleich ein Wakü Projekt in Angriff nehmen.
 
  • Gefällt mir
Reaktionen: ChaosCoders
Alles klar, danke an alle für eure Tipps. Wenn jemand noch eine spontane Idee hat, oder sonst etwas mitteilen möchte immer her damit. :)
Ansonsten werde ich mich jetzt zeitnah drum kümmern ne WaKü zu installieren. Schicke dann vllt mal Updates hier rein ;D
 
Wakü hat natürlich seinen Preis. Nur mal mein persönlicher Favorit, den ich verbaut hätte.
https://shop.watercool.de/HEATKILLER-IV-for-RX-Vega-56-64-ACETAL(kompatibel zu deiner Karte)
Gibt's aber vielleicht auch mittlerweile gebraucht deutlich günstiger. Andere Kühler natürlich auch.

Ich würde vorher sichergehen, dass es auch wirklich an der Karte und Temperatur liegt und deshalb erst mal anderweitig die Temperatur senken(z.B. Lüfter 100% oder notfalls dann erst mal neue WLP). Spielabstürze müssen ja nicht zwangsläufig an der Grafikkarte liegen, instabiles System CPU/RAM/Board kann da auch schon reichen. Erst wenn die Abstürze weg sind, würde ich dann dem Lärm zu Leibe rücken.
 
  • Gefällt mir
Reaktionen: ChaosCoders
Hast du schon die CPU unter Wasser?
Mit genügend Underclocking senkst du letztendlich auch die Temperatur.
Mir ist mal eine Graka gestorben mit dem Phänomen wie bei dir. Blackscreen und Lüfter auf 100%, anfangs hatte ich die Lüfter manuell hochgesetzt und dass dann deutlich verlangsamt aber nach ein paar Monaten war Ende. Wenn du jetzt aber die Karte unter Wasser setzt und die ist wirklich defekt, dann hast du gut Geld verbrannt.
Da du die Abstürze reproduzieren kannst, klär doch mal mit Mindfactory ob die noch eine Karte hätten. Sonst würde ich noch einen Morpheus oder Accelero als Alternative zur wakü Vorschlagen.
 
  • Gefällt mir
Reaktionen: ChaosCoders
Zurück
Oben