Prozessorfehler bei oc (Hierarchy Error)

Skore1990

Cadet 3rd Year
Registriert
Okt. 2023
Beiträge
62
Guten Abend zusammen. Ich habe ein neues Problem, welches ich alleine nicht behoben bekomme und mittlerweile die Vermutung habe, dass mein Prozessor einen weg hat. Es gab keine besonderen Änderungen am System und der Fehler war plötzlich einfach da.

System:
Ryzen7 5800x, Asus ROG Crosshair VI Hero
GTX1080, 32gb Corsair 3200mhz DDR4 Ram (2x16gb)
M.2 SSD Samsung 970 EVO + diverse andere Platten

Äußern tut es sich so, dass der PC einfach ausgeht und dann neustartet. Als hätte man ihm den Strom genommen.
Offensichtlich hängt es mit dem OC der CPU zusammen, da ich das bereits ausgetestet habe.
  • Ram wurde ausgiebig getestet - ok
  • Netzteil wurde ausgetausch - ok
  • Windows wurde frisch installiert und Bios zurückgesetzt

1700243940076.png


Sobald ich der CPU weniger Strom gebe und mehr Takt als original (Precision Boost), taucht das Problem auf. Zuvor lief alles problemlos und selbst mit extrem entschärften Werten schmiert der Rechner dann ab.

Solange für die CPU alles auf auto steht, gibt es scheinbar keine Probleme.. zumindest seit 2 Tagen nicht mehr.
Der Ram läuft hingegen auf 3400mhz problemlos und stabil.


Kann da jemand was zu sagen?
 
Zuletzt bearbeitet:
Hey, naja erzähle mal was für Werte Du deiner CPU zugemutet hast und wie genau.
Also da fehlen einige Details.

Diese Details wären wichtig um ein zu ordnen und Ratschläge zu geben.

Ansonsten müsste man jetzt so direkt pauschal sagen : Dein UV mit gleichzeitigem OC war einfach zu heftig/scharf eingestellt und die Chipgüte hat halt nicht mehr hergegeben.

Ich würde eher vom OC absehen und mich aufs UV bei Stockwerten der Taktraten konzentrieren.

LG
 
  • Gefällt mir
Reaktionen: CBecker
zeig mal den zuverlaessigkeitsverlauf
liste deine hardware komplett auf/
Skore1990 schrieb:
Sobald ich der CPU weniger Strom gebe und mehr Takt als original, taucht das Problem auf. Zuvor lief alles problemlos und selbst mit extrem entschärften Werten schmiert der Rechner ab.
?!
Aussage in dem Satz ist, dass du probleme ahst wenn du daran herum spielst, mit defaults jedoch kein Proble hast?
Sobald ich der CPU weniger Strom gebe und mehr Takt als original, taucht das Problem auf. Zuvor lief alles problemlos
haengt man da jedoch den letzten halbsatz an, klingt es als ob auch die defaults Probleme machen:
und selbst mit extrem entschärften Werten schmiert der Rechner ab.
Details und alleswas du gemacht hast waere wirklich hilfreich
 
  • Gefällt mir
Reaktionen: CBecker
amorosa schrieb:
Hey, naja erzähle mal was für Werte Du deiner CPU zugemutet hast und wie genau.
Also da fehlen einige Details.
Der Rechner lief locker 1,5 Jahre mit den UV/OC Werten die ich damals eingestellt hatte und das absolut stabil und auch durch sämtliche Benchmarks und Tests.

Ich muss dazu sagen, dass ich damals aber schnelles UV/OC betrieben habe und irgendwann auch keine Lust mehr hatte und dann aufgehört habe, als alles stabil lief.

Habe beim Ram das XMP Profil geladen und bin dort 200mhz hoch gegangen, also auf 3400mhz. Die Spannung ist auf 1,4V gesetzt, getestet und fertig. Läuft durch alle Test und funktioniert.
Mit den Timings habe ich auch rumgespielt, aber da habe ich irgendwann aufgegeben, weil mir die Zeit fehlte.
Die stehen seit dem aber auf den original Werten.

PrecisionBoost habe ich auf manuell gestellt und dem Processor 10mV an Spannung auf allen Kernen genommen. Alles darüber hinaus wäre zu viel gewesen mit den 200mhz mehr an Takt.
Später dann halt die 200mhz mehr Takt draufgepackt. Lief ebenfalls die ganze Zeit stabil.

Man muss aber sagen, dass ich eine Custom-Wasserkühlung verbaut habe.
Die Temps und Spannungen waren gut und absolut im grünen Bereich.
Wassertemp bei max. 40°C
CPU max Temp liegt bei 86°C unter CinebenchR20
GPU max Temp liegt bei ~70°C

Die Grafikkarte hat hingegen ordentliches oc bekommen und läuft am absoluten Limit, was halt Afterburner und Bios der Karte so hergibt.

madmax2010 schrieb:
zeig mal den zuverlaessigkeitsverlauf
Ich muss korrigieren.. am 10. und 11. hatte ich den CPU auf Werkstaktraten stehen.. Hatte danach nochmal etwas rumgetestet und bin immer weiter runter gegangen mit uv/oc. Die Einträge von gestern stammen allerdings von meiner Reinigung der Wasserkühlung.. hatte diese komplett zerlegt und musste dann mal unsanft neustarten.

Die Fehler sind immer wieder "wurde nicht ordnungsgemäß heruntergefahren" dazu kommen noch eine Softwarefehler, da ich viele Sachen getestet und neu installiert hatte.
1700248115349.png

madmax2010 schrieb:
liste deine hardware komplett auf/
Sag mir alternativ welche Daten du genau haben möchtest, ich denke mal das Gehäuse und die Wasserkühlung ist uninteressant..
Netzteil ist aktuell ein Corsair 750e verbaut. Normalerweise steck ein Bequiet straight power 11 mit 750w drin.
Das wurde aber zum Testen ausgetauscht.
1700247965792.png


madmax2010 schrieb:
Aussage in dem Satz ist, dass du probleme ahst wenn du daran herum spielst, mit defaults jedoch kein Proble hast?
Nein, ich hatte bisher nie Probleme gehabt und diese traten plötzlich auf, ohne weiter gespielt zu haben. Also gute 1,5 Jahre war mit UV/OC alles tacko und dann kam das Problem von heute auf morgen.

zenokortin schrieb:
OC ist doch eh out, UV ok, aber OC ist seit ca. 10 Jahren sinnfrei.
Hatte das falsch formuliert.. habe natürlich auch uv betrieben.
 
Zuletzt bearbeitet:
Skore1990 schrieb:
Alles darüber hinaus wäre zu viel gewesen mit den 200mhz mehr an Takt
Das wird bei dir auch so schon zu viel gewesen sein. Plus 200 Mhz und gesenkte spannung schafft eigentlich keine AM4 CPU ohne Clockstretching. (wodurch man nebenbei auch noch einiges an Leistung verliert)

Lange Rede kurzer Sinn, nimm die 200 Mhz wieder raus. Oder verringere sie soweit, dass du aus dem Clockstretching raus bist.
Einfach zu überprüfen mit CB23 und HWinfo. Der Effektive Clock sollte da nicht tiefer (max.25Mhz) als der normale liegen.
 
  • Gefällt mir
Reaktionen: cvzone
Danke für deine Antwort, aber ich habe das Problem scheinbar behoben bekommen.

Habe nochmal sämtliche Varianten durchgetestet und auch durch die Benchmarks gejagt..
Verstehe allerdings nicht, wieso die CPU jetzt nur noch mit anderen Settings zurecht kommt?!
Vorher hatte die ja knappe 1,5 Jahre problemlos abgeliefert..

Aktuell habe ich deutlich stärkeres UV drin, aber dafür auch einen niedrigeren single Takt und somit weniger Punkte im CB bei single.. dafür ist der multi hoch gegangen.. (im Vergleich zu den vorherigen Settings)
Beide Punktzahlen liegen aber klar über den Stock Werten und auch die Temps sind gut während den Benchmarks.

Ich denke mal die Werte werde ich erstmals so lassen und später nochmal optimieren oder jeden Kern einzeln optimieren... (werde ich eh nicht machen.. damals schon kb mehr gehabt und heute nicht anders)

Muss aber sagen, dass nicht unter den optimalen Bedingungen getestet wurde.. es läuft relativ viel im Hintergrund.

Screenshot 2023-12-01 114851.png

Screenshot 2023-12-01 121749sa.png


Screenshot 2023-12-01 114729.png
Screenshot 2023-12-01 120821s.png
 
Zuletzt bearbeitet:
peterX schrieb:
Einfach zu überprüfen mit CB23 und HWinfo.
Ich hatte aus guten Grund HWinfo genannt, denn dein Tool kann das Clockstrtching( Effektiv Clock) nicht anzeigen.
Lass mal CB23 mit HWinfo laufen, dann siehst du was ich meinte.1701430008947.png

Neben bei hier einmal im Single die Taktraten
1701430008947.png


Und hier nochmal im Multi.
1701430355313.png

Und hier im Endergebnis
1701430533556.png


Wie du siehst, hab ich eine PPT von 100 Watt bei mir eingestellt. Verlier aber kaum was zum offenen Limit.
Clockstretching gibt es auch keins, trotz +50 Mhz und UV.
 
Bist du dir sicher das man Clockstrtching überhaupt zuverlässig nachweisen kann wenn man im HWinfo nicht den Snapshot-Mode nutzt?
Unbenannt.png
 
  • Gefällt mir
Reaktionen: Fas7play
Satz mit X ...

1701629715819.png


Rechner ist gerade wieder abgeschmiert und ich war lediglich im Browser unterwegs.. also keine Last etc.
In jeder getesteten Situation läuft er stabil.. es kann doch nicht sein, dass der dann einfach so wegstirbt!?
Gerade unter Last sollten solche Probleme doch auftreten.. wieso macht er es fast immer im IDLE?!


So langsam habe ich das Gefühl, dass entweder die CPU oder das Mainboard einen weg hat.
Zudem habe ich auch zwischendurch immer wieder mal Probleme mit dem Sound..
https://www.computerbase.de/forum/t...rsteuern-ohne-aenderung-der-hardware.2172279/

Die Frage ist jetzt, was tausche ich zuerst..
 
Aussetzer beim Sound deuten auf eine Unterversorgung vom SoC hin, ebenfalls kann das Auslöser für die Cache Hierarchie Fehler sein.
Besonders "gern" tritt dies auf, wenn du im idle bist und ein schneller, kurzer Lastwechsel Auftritt, wie z.B. das öffnen eines Browserfensters oder starten eines Spieles aus dem Desktop Betrieb.

Stelle die VSoC mal auf 1.1v und teste dann alles nochmal.

Solltest du bereits bei 1.1v sein, gehe hoch bis auf 1.15v mehr sollte nicht benötigt werden.
 
  • Gefällt mir
Reaktionen: 4BitDitherBayer und Skore1990
Verangry schrieb:
Stelle die VSoC mal auf 1.1v und teste dann alles nochmal.

Solltest du bereits bei 1.1v sein, gehe hoch bis auf 1.15v mehr sollte nicht benötigt werden.
Danke. werde ich machen! Allerdings kann ich es nicht wirklich testen, da es mittlerweile nur alle paar Tage auftritt und ich auch nicht genau weiss wann. Ist halt nicht worklich zu provozieren.
 
Mich wundert es nur, dass das vorher nie ein Problem war. Ich meine, es muss ja irgendwas passieren, damit da nix mehr läuft.. das ändert sich doch nicht einfach alles von alleine?
 
Das ist vermutlich auch der Grund weshalb die Spannungen organal vom Hersteller der Produkte als "unnötig hoch" erscheinen, da die Produkte mit weniger Spannung ja auch gut funktionieren.
Der Hersteller muss aber auch gewährleisten das sein Produkt über Jahre hinweg fehlerfrei funktioniert aus dem Grund werden da Sicherheitswerte mit einbezogen.

Habe die von @Verangry beschriebenen Sound Probleme in Verbindung mit zu wenig SoC Spannung selbst schon erlebt. Hab mir damals extra neue Kopfhörer gekauft weil ich annahm die Jetzigen seien defekt :D
 
Ja gut, der Hersteller legt halt das fest, wo Alles, immer zuverlässig funktioniert. Sobald da rumgedreht wird, kann es funktionieren, aber muss eben nicht. Zumal man ja bis an die Grenze gehen will und sich nicht mit nur 5% von möglicher 30% Ersparnis zufrieden gibt.

Ich habe SOC aktuell auf 1,1V stehend und bisher noch keinen Ausfall.. aber das will bekanntlich nichts heissen. Wenn ich 1 Woche lang mal keinen Absturz hatte, bin ich vermutlich safe und kann schon eher ein Fazit abgeben.
 
So, schnelles Feedback.
Das Anheben der Spannung hat tatsächlich geholfen! Seitdem habe ich keinen Absturz mehr gehabt!

Vielen Dank an @Verangry für den entscheidenden Tipp, ein dickes Danke an alle anderen und schöne Feiertage!
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: 4BitDitherBayer und Verangry
Zurück
Oben