System Reboot unter GPU-Last

Schluumi

Cadet 1st Year
Registriert
Sep. 2024
Beiträge
9
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): AMD Ryzen 7 7800X3D
  • Arbeitsspeicher (RAM): 32GB (2x 16GB) G.Skill Flare X5 schwarz DDR5-6000 DIMM CL30-38-38-96
  • Mainboard: MSI MAG B650 TOMAHAWK WIFI (MS-7D75)
  • Netzteil: 750 Watt be quiet! Straight Power 11 Modular
  • Gehäuse: Eigenbau
  • Grafikkarte: XFX RX 6800 XT Speedster Merc319 Black
  • HDD / SSD: 1x Samsung SSD 970 EVO Plus 500GB, 2x Samsung SSD 840 EVO 250GB

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Nach Wechsel des Mainboards, der Cpu und des RAMs rebootet das System bei hoher GPU Last nach ca einer Stunde in einen Blackscreen. Einmaliger Druck auf den IO Schalter führt dann zum Hard-OFF und nochmaliges Drücken zum normalen Bootvorgang. Wenn ich das Scenario dann reproduziere kommt der Shutdown früher (etwa 5-10 min).

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
Die Aufwärmzeit von einer Stunde in Kombination mit der verkürzten Reproduktionszeit haben mich zuerst an Probleme mit den Temps denken lassen wobei ich da eher mit Throttle rechne. Also hab ich den ganzen Prozess mit HWinfo protokolliert aber im Logviewer sah meines Erachtens alles entspannt aus. Die CPU hatte eh kaum Last und war durchschnittlich im 55 Grad Bereich, die GPU wurde voll belastet und war relativ konstant auf 85 Grad (max 87, Hotspot max 89). Die Spannungswerte scheinen alle stabil aber evtl kann jemand mit mehr Ahnung da drübergucken.
Als nächstes hab ich im Bios die default Settings geladen und das Expo Profil rausgenommen. Leider keine Veränderung.
Meine letzte Idee war die PSU. Also habe ich mir ein neues Straight Power 12 850W besorgt und angeschlossen nur um nach einer Stunde wieder vor dem schwarzem Monitor zu sitzen.
Bios ist up2date aber ich muss sagen dass mir das Board von Anfang an Probleme gemacht hat, von minutenlangen Bootvorgängen zu nicht geladenen USB Devices die neu eingesteckt werden müssen um gefunden zu werden. Vor Kurzem kamen noch EXCEPTION_ACCESS_VIOLATION Meldungen beim normalen Herunterfahren des Systems dazu, die aber wieder verschwunden sind.
Meint ihr ich sollte das Board einfach einschicken oder gibt es andere Sachen die ich vorher noch testen kann?
Ich hänge jedenfalls die HWinfo CSV mal an, falls jemand drübergucken will.

Grüße
Schlumi
 

Anhänge

Ja ich würde dann das Board, soweit noch Garantie tauschen.
 
Schluumi schrieb:
Über 2x8Pin an der PCIe1 der PSU.
Mit einem Y-Kabel ?
Screenshot 2024-09-19 154946.png
 
Setz doch mal ein Powerlimit für die GPU, um herauszufinden ob es tatsächlich an der Stromversorgung liegt.
Verwendest du Steckdosenleisten?

Und um das Problem vermeintlich schneller zu reproduzieren, verwende FurMark.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Maxysch
Maxysch schrieb:
Jein. Die PCIe Kabel der SPs sind quasi zwei 8Pin Kabel die unten in einem 12Pin Anschluss münden. https://www.bequiet.com/en/accessories/1446

Wo bin ich hier schrieb:
Setz doch mal ein Powerlimit für die GPU, um herauszufinden ob es tatsächlich an der Stromversorgung liegt.
Verwendest du Steckdosenleisten?

Und um das Problem vermeintlich schneller zu reproduzieren, verwende FurMark.
Ne keine Leiste. Powerlimit kann ich später testen. Wie weit soll ich da so runter am besten?
 
Schau erstmal ob du es mit FurMark schneller/zuverlässiger bei Powerlimit 100% reproduziert bekommst.
Dann würde ich einfach mal Powerlimit 70% sagen.
 
Maxysch schrieb:
Ist das Netzteil was gerade benutzt wird?
Ja. Der dokumentierte Crash den die angehängte CSV beschreibt wurde aber mit einem neuen Straight Power 12 850W produziert. Das war aber genauso angeschlossen.
 
Der Anschluss mit diesem Kabel an PCIe 1 beim Straight Power 11 750W ist genauso suboptimal wie beim Pure Power 12 850W an PCIe A oder B:

Mit PCIe 1 am Straight Power 11 750W bekommt die GPU nur 24A über 12V4, du musst das Kabel an PCIe 2 anschließen, besser wären allerdings 2 getrennte Kabel an PCIe1 und PCIe3:

1726756333750.png


1726756314403.png

Beim Pure Power 12M 850W ist es ähnlich:
1726756638282.png


1726756588883.png


Die GPU sollte mit 2 getrennten Leitungen angeschlossen werden:
1726756693409.png


Ich glaube nicht, dass es dein Problem löst, aber es sollte grundsätzlich berücksichtigt werden (steht auch so im Handbuch) und ein Versuch ist es auf jeden Fall wert.
 

Anhänge

  • 1726756549967.png
    1726756549967.png
    35,9 KB · Aufrufe: 27
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Maxysch
AMD-Flo schrieb:
Der Anschluss mit diesem Kabel an PCIe 1 beim Straight Power 11 750W ist genauso suboptimal wie beim Pure Power 12 850W an PCIe A oder B:

Mit PCIe 1 am Straight Power 11 750W bekommt die GPU nur 24A über 12V4, nur musst das Kabal an PCIe 2 anschließen, besser wären allerdings 2 getrennte Kabel an PCIe1 und PCIe3:

Anhang anzeigen 1524237

Anhang anzeigen 1524236
Beim Pure Power 12M 850W ist es ähnlich:
Anhang anzeigen 1524240

Anhang anzeigen 1524239

Die GPU sollte mit 2 getrennten Leitungen angeschlossen werden:
Anhang anzeigen 1524241

Ich glaube nicht, dass es dein Problem löst, aber es sollte grundsätzlich berücksichtigt werden (steht auch so im Handbuch) und ein Versuch ist es auf jeden Fall wert.
Ah, das ist gut zu wissen für das 11er. Aber das getestete Straight Power 12 850W hat ja nur eine 12V Schiene oder? Und die aufgezeichete PPT von 280W GPU + 30W CPU sind ja schon weit unter der angegebenen Max. combined power 12V (W) von 849.6.
 
Schluumi schrieb:
Aber das getestete Straight Power 12 850W hat ja nur eine 12V Schiene oder?
Ja, stimmt, da kann man nichts falsch anschließen. Ich habe fälschlicherweise das Pure Power 12M herangezogen.

Was darf man sich unter dem Eigenbau des Gehäuse vorstellen?

Ich würde auf Board, GPU oder SSD tippen.
Du kannst testweise alle Datenträger abgesehen von der System SSD entfernen.
Falls das Problem weiterhin auftritt, das System auf eine andere SSD klonen und nur mit dieser versuchen.

Außerdem würde ich die beiden RAM Riegel einzeln testen.
 
AMD-Flo schrieb:
Was darf man sich unter dem Eigenbau des Gehäuse vorstellen?
Ein dünner Kupfer-Korpus auf dem das Board frei an der Wnad montiert ist. Schwer zu beschreiben hier ist ein Bild.
IMG_20220104_144508.jpg
 
  • Gefällt mir
Reaktionen: AMD-Flo und Maxysch
Bitte die beim Netzteil mitgelieferten Kabel testen, Modkabel können auch mal nichts taugen.
Beim SP11 Einzelkabel nutzen bzw nur einen Anschluß vom A-Kabel nutzen. Beim Gold auf PCIe 1+3 und beim Platin auf 1+2
 
Ja, ich habe nochmal mit Powerlimt auf circa 260W Furmark laufen lassen und keine Probleme gehabt. Danach wollte ich einen Durchgang mit den Standardwerten starten und der Rechner ist direkt ausgegangen als ich auf RUN geclickt habe. Diesmal ganz und ich musste das Netzteil einmal vom Strom trennen um ihn wieder anzubekommen. Ich denke ich werde das Ding komplett zerlegen müssen und die PSU direkt an die Komponenten hängen.
 
  • Gefällt mir
Reaktionen: Maxysch
Zurück
Oben