AMD 7950X + X670E reboot nach Dauerlast

ThirdLife

Commander
Registriert
Aug. 2019
Beiträge
2.985
1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): AMD Ryzen 9 7950X
  • Arbeitsspeicher (RAM): G.Skill Trident Z5 RGB 2x16 GB, DDR5-6400, CL32-39-39-102 (F5-6400J3239G16GX2-TZ5RK)
  • Mainboard: ASUS ProArt X670E-Creator WIFI (90MB1B90-M0EAY0)
  • Netzteil: ASUS ROG Thor Platinum, ROG-THOR-1200P, 1200W ATX 2.4 (90YE0080-B001N0)
  • Gehäuse: Thermaltake View 71 TG
  • Grafikkarte: EVGA GeForce RTX 3080 Ti FTW3 Ultra Gaming
  • HDD / SSD: WD Black SN850 + PNY XLR8 CS3030 + Samsung 860 Evo + Seagate FireCuda 530 + Kingston FURY Renegade
  • Weitere Hardware, die offensichtlich mit dem Problem zu tun hat(Monitormodell, Kühlung usw.): WaKü mit MoRA, sonst dürfte nix damit zusammenhängen.

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):

Ich habe das Problem, dass der Rechner problemlos läuft, über Nacht auch angelassen werden kann über Tage hinweg ohne ein Problem oder einen Crash aber sobald ich per Handbrake Video zu x265 encode über Nacht kratzt die Kiste ab. Es wird einfach neu gestartet ohne BSOD (schon live beobachtet) und ohne Fehler im Eventlog ausser "unexpected error".


3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?

Ich habe zuerst gedacht, ok dein CO Setting ist halt nicht stabil, das raus genommen, PBO rausgenommen, BIOS komplett zurückgesetzt, neuestes BIOS (v0705) ist drauf. Jetzt läuft er komplett Stock, keine Veränderungen und dennoch immer beim Video encoden crasht die Kiste.

Temps sind kein Problem, selbst mit 5.5Ghz Allcore im CBR23 und 300-310W Powerdraw liege ich bei 80C auf der CPU. Beim Encoden hab ich auch das zurückgedreht (weil Verschwendung) da läuft die CPU mit 55-60C bei 150W PPT und 4.8Ghz Allcore.

Es spielt hierbei keine Rolle ob ich ein hartes OC fahre, Stock bleibe, UV betreibe. Video encoding das länger Last gibt, und die Kiste rebootet. Beim Zocken über Stunden hinweg jedoch keine Probleme. Ich hab jetzt länger danach gegoogelt und es häufen sich doch ein paar Berichte in Kombination mit explizit dem 7950X + X670E, dass dies nicht stabil laufe. Die einen haben Probleme mit Idle, die andern Probleme unter Last.

Ich habe auch keine Memory Errors (würde das RAM also ausschliessen), auch gabs keine Probleme mit der Erkennung und dem Training dessen.

Gibts hier evtl. ein paar die ähnliche Erfahrungen gemacht haben ?

Hier ein paar der besagten Links:

https://forums.tomshardware.com/thr...omly-shuts-off-whereas-7900x-is-fine.3779906/
https://www.reddit.com/r/Amd/comments/xrt8ar/experiences_with_the_x670_and_x670e_series/
https://www.xda-developers.com/amd-ryzen-7900x-7950x-review/
 
ThirdLife schrieb:
Es spielt hierbei keine Rolle ob ich ein hartes OC fahre, Stock bleibe, UV betreibe.

Das hört sich nach CPU an.

Auch daran schon gedacht:
https://www.amd.com/de/products/cpu/amd-ryzen-9-7950x
1667169424911.png
 
  • Gefällt mir
Reaktionen: ThirdLife
Du nutzt ein DDR5-6400 Kit mit XMP. Soweit ich es gelesen habe, ist derzeit alles oberhalb DDR5-6000 eher kritisch. Ferner wäre ein Kit mit AMD EXPO sinnvoll gewesen.

Ich vermute bei Dir ein Problem mit dem RAM-Takt MCLK bzw. den daraus abgeleiteten FCLK bzw. UCLK. Ich würde mal testweise den RAM auf 6000 MT/s runterstellen.
 
  • Gefällt mir
Reaktionen: Bassmensch, Drahminedum und ThirdLife
Corpus Delicti schrieb:
Naja, AMD selbst empfiehlt ja 6000er Kits als "Sweet Spot", das 6400er läuft ja auch ohne Errors. Ich würde das RAM also mal ausschliessen.

Klingt für mich nach irgendeinem BIOS Problem mal wieder. Hätte auf einen Kollegen hören sollen und kein Asus kaufen :D
Ergänzung ()

Nerevar schrieb:
Du nutzt ein DDR5-6400 Kit mit XMP. Soweit ich es gelesen habe, ist derzeit alles oberhalb DDR5-6000 eher kritisch. Ferner wäre ein Kit mit AMD EXPO sinnvoll gewesen.

Ich vermute bei Dir ein Problem mit dem RAM-Takt MCLK bzw. den daraus abgeleiteten FCLK bzw. UCLK. Ich würde mal testweise den RAM auf 6000 MT/s runterstellen.
Ich kanns auch mal Stock ohne Profil mit 4800 laufen lassen. Auch eine gute Idee. Denn wenn das schon nicht läuft ist das Problem woanders.
 
Dein PC läuft aber nicht problemlos, zumindest mit den 6400...

Lass es halt mal auf 5200 laufen, sicher ist sicher, macht er dann keine Probleme kannst du stetig hochgehen.

Nicht jede CPU ist so gut wie Review Samples, vllt schafft deine sogar nur 5600 stabil.
 
  • Gefällt mir
Reaktionen: ThirdLife und Weedlord
ThirdLife schrieb:
Naja, AMD selbst empfiehlt ja 6000er Kits als "Sweet Spot", das 6400er läuft ja auch ohne Errors. Ich würde das RAM also mal ausschliessen.
Teste halt mal mit Standard Setting, wenn es dann geht, weißte das der Ram bzw. deine CPU den Ram Takt nicht packt.
 
  • Gefällt mir
Reaktionen: ThirdLife
Weedlord schrieb:
Teste halt mal mit Standard Setting, wenn es dann geht, weißte das der Ram bzw. deine CPU den Ram Takt nicht packt.
Ich lass es über Nacht mal mit drei Encodes laufen mit absolut primitivsten 4800er 40-40-40-77 Settings @1,1V, ganz nach Basis-Spec. Normal würde ich aber behaupten, dass Memory Errors im Logdump auftauchen und einen BSOD geben und nicht einfach einen Hard-Reset mit Blackscreen.

Eigentlich sollte es nichtmal über POST hinauskommen wenns nicht ginge. Bin mal gespannt.

PS: nachdem was bisher zu lesen war ist doch FCLK mittlerweile entkoppelt und sollte daher so oder so kein Problem darstellen sofern das Board keine Issues hat die Sticks zu erkennen ?
 
  • Gefällt mir
Reaktionen: Coeckchen
Also aus eigener Erfahrung kann ich sagen, dass erfolgreich durchgelaufene Memory-Tests einen Fehler im RAM nicht ausschließen können. Manche Tests setzen einfach nur die entsprechende Komponente unter Volllast, um zu checken, ob es dabei Fehler gibt. Viel kritischer ist aber oftmals nicht die hohe Last an sich, sondern der ständige Wechsel zwischen Idle und Last. Vor 4 oder 5 Jahren hatte ich ein ähnliches Problem. Ständige Bluescreens aus heiterem Himmel, aber keine Hinweise darauf, dass der RAM schuld sein könnte. Auch Memory-Tests waren allesamt fehlerfrei. Aber um es kurz zu machen: Einer der RAM-Riegel war reproduzierbar defekt, und seit ich diesen getauscht habe, läuft alles wie geschmiert.

Bei dir gehe ich auch davon aus, dass der hohe RAM-Takt das Problem ist. 6000 MHz könnten bzw. sollten noch stabil sein, aber 6400 MHz sind halt so oder so kritisch. AMD gibt nicht umsonst 5200 MHz als offizielles Limit an - auch wenn sie selbst 6000 MHz als Sweetspot bezeichnen. Letztendlich heißt das halt nur, dass 6000 MHz (mit entsprechendem Board) in den meisten Fällen laufen sollten, aber dass das eben nicht garantiert wird. Und 6400 MHz ist ja nochmal deutlich darüber.
 
  • Gefällt mir
Reaktionen: hasentier, Col.Maybourne, dsxiadndxe und eine weitere Person
Über die CPU, x265.

Blyad, die Jungs hier hatten Recht. Heute liefen sogar vier Encodes über Nacht durch. Problem ist also doch Memory Related obwohl keine Memtest Errors auftreten. Was für ein Scheiss.

Mir kam gestern Nacht noch die Idee zu schauen ob sich der Fabric Takt anheben lässt, evtl. macht auch der Async-Mode Probleme. So könnte ich den Ram dennoch schneller behalten.

Alternativ muss ich halt runter auf 6000 und schauen ob ich die Timings schärfen kann, wäre aber der am wenigsten spassige Ansatz weil Zeitaufwändig. :D

Danke nochmal, manchmal braucht es einfach jemanden der einem die unangenehme Wahrheit ins Gewissen prügelt.
 
Ich muss jetzt noch ein bisschen was ergänzen:

RAM alleine ist hier nicht das Problem wie es scheint (und vermutet). Ich hab gesehen Igorslab hat dasselbe RAM Kit wie ich für Memory OC verwendet, ich hab also seine Werte einfach mal 1:1 übertragen. Das läuft jetzt so auch (6400 @ 32-38-38-30) .

Es scheint eine Kombination aus Async Modus (hab auf 1:1 mit IF 2133 umgestellt) und den Auto Timings zu sein die Asus generiert aus dem XMP/EXPO/DOCP Profil nach den Haupt-Timings. Manuell eingetragene (deutlich schärfere) Timings frisst die CPU/das Board problemlos.

Ich denke nach wie vor, dass das UEFI hier nicht wirklich "mature" ist und noch ein paar Updates braucht bis das Zeug läuft wie es sollte.

Das als Hinweis für alle die evtl. vergleichbare Problemchen haben sollten. Auch hab ich im BIOS keine Möglichkeit die iGPU zu deaktivieren - ebenfalls ein Bug in meinen Augen. ASUS hat halt mal wieder verkackt.
 
Zurück
Oben