RDNA3 Powertarget unter Linux

Natriumchlorid

Lt. Junior Grade
Registriert
Sep. 2013
Beiträge
425
Ich würde gern mein Verständnis bezüglich RDNA3 und dem einstellbaren Power-Target erweitern.

Das Thema hat folgenden Hintergrund: Im Winter-Sale hab ich mir Sons of the Forest (SotF) geholt und angefangen dies im Coop-Modus zu spielen. Nach ca. einer halben Stunde ging mein Rechner einfach aus (Grafikkarte ohne Strom, Bildschirm schwarz, Gehäuselüfter drehen aber weiter). Keine Reaktion am Power-Button. Von daher stromlos gemacht, Reboot und wieder ab ins Game.
Die Abstürze haben aber nicht nachgelassen. Je anspruchsvoller die Grafik, desto häufiger waren die Abstürze. Das selbe konnte ich beim Release von CS2 beobachten. Nachdem ich die Settings etwas heruntergeschraubt hatte, waren die Abstürze bei CS2 Geschichte.

Nun mit SotF ist das Thema leider nicht ganz so einfach. Selbst wenn die Grafik merklich reduziert wird, sind Abstürze vorhanden (einmal alle 3/4h). Ich hab mich daher auf die Suche nach dem Auslöser gemacht.
CPU: Ryzen 5900X
GPU: Sapphire RX 7900 XTX Nitro+
PSU: Seasonic Focus GX-850
Kernel: Linux 6.7.0-rc7-1 mainline
OS: Arch
Treiber: RADV (mesa)
Zielauflösung: 3840x2160
Zielbildwiederholrate: 144 fps
Grafische Einstellung in den Spielen: Höchste
Dank dem 6.7 Kernel hab ich nun die Möglichkeit das Voltageoffset und die Lüfter bei RDNA3 manuell zu konfiguieren.
(Die notwendigen Interfaces sind unter /sys/class/drm/cardX/device/ ab dem Kernel 6.7 verfügbar, Dokumentation.)
Ich dachte, wenn ich ein wenig die Spannung herabsetze, dann bessert sich die Situation. Mit meiner 5700XT konnte ich damals einen merklichen Performance-Gewinn und weniger Leistungsaufnahme dank Undervolting feststellen. Bei dieser Karte hab ich leider nicht den Spielraum für grosszügiges Undervolting, aber dies hat mein Hardcrash sowieso nicht beseitigt.

Als nächste Massnahme habe ich angefangen mit dem Power-Target zu spielen und meine GPU auf das Alternative BIOS umgestellt.
Die Karte darf im Alternative BIOS bis zu 291W aufnehmen (/sys/class/drm/card1/device/hwmon/hwmon1/power1_cap_default) und der niedrigste Wert, den ich manuell setzen kann beträgt 261W (power1_cap_min). Letzteres hab ich manuell als PT festgelegt und bin dann wieder ins Game, um zu "benchmarken".

Mittels eines kleinen Scripts, welches die aktuelle Leistungsaufnahme der GPU beobachtet, konnte ich sehen, dass es Leistungsspitzen von bis 441W gibt! Trotz eingestelltem PT von 261W. Ansonsten bleibt die Karte aber unterhalb vom PT.
Einen weiteren Absturz konnte ich während dem Testen beobachten, aber es bestätigt meine Theorie, dass die GPU sich mehr Strom genehmigt, als im Power-Target festgelegt. Meine Frage ist jetzt ein simples: Warum?

Sapphire selbst rät zu einem Netzteil mit mindestens 800W und beschreibt die maximale Leistungsaufnahme mit 420W. Mein Netzteil hat 850W, die GPU ist mit 3 seperaten PCIe-Kabeln verbunden und selbst mit massiv herab gesetzem PT, kann ich Werte von bis zu 441W beobachten (Abstürze mit wahrscheinlich höherer Leistungsaufnahme mal ausgenommen).

Ich bin mir bewusst, dass die langfristige und effektive Lösung hier ein stärkeres Netzteil ist und das ist auch geplant (auch wenns meiner Meinung nach absurd ist). Die massiv herab gesetzte Leistung diente zum eigenen Verständnis während des Testvorgangs. Mir geht es aber primär darum zu verstehen, weshalb die Grafikkarte nicht das eingestellte Power-Target respektiert, bzw. weshalb die Karte solch heftigen Leistungsspitzen ausgesetzt ist. Ist solch Verhalten auch unter Windows zu sehen?

Mit Spielen wie Forza Horizon 5, Final Fantasy XV, Cyberpunk 2077 (Patch 2.1), Monster Hunter: World kann ich komplett maxed out ins Spiel rein, ohne Abstürze oder andere Fehler. Aber CS2 (2023) und jetzt auch SotF (2023) sind wahrlich schwere Brocken für meine GPU (und damit PSU), weshalb ich auch gern verstehen würde, woher diese Leistungsspitzen gerade bei den neueren Titeln herkommen?
 
Dein Netzteil ist ausreichend.
Kannst Du das umstellen auf Singlerail-Betrieb? Schau mal aufs Typenschild, vielleicht ist der maximale Strom auf den 12V-Leitungen zu gering
 
  • Gefällt mir
Reaktionen: Natriumchlorid und JumpingCat
drake23 schrieb:
Die RDNA Karten genehmigen sich Lastspitzen, die über der TDP sind. Ich denke, damit hängen Deine Abstürze zusammen.
Ein 850W Netzteil kann locker nochmal 10% (genauere Angaben finden sich beim Hersteller) mehr im Peak bereitstellen, das darf natürlich nicht dauerhaft anliegen, sondern maximal ein paar Sekunden.
Ergänzung ()

_anonymous0815_ schrieb:
mehr im Peak bereitstellen
https://seasonic.com/focus-gx#specification
1000041453.jpg

OK, die ATX 2.4-Version kann Peak über die Rail tatsächlich "nur" 840W.

Eine Reserve ist hier wohl nicht vorgesehen.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Natriumchlorid
Das ist ein GX-850... das kommt locker mit der 7900 XTX klar auch mit den Spitzen, allein schon weil das Netzteil locker 10% Reserven hat, selbst unter Dauerlast. Abgesehen davon, die CPU benötigt max 144W wenn nicht mit PBO rumgespielt wurde, das bedeutet die GPU hat den Rest über, in der Spitze zieht die Karte sicher keine 700W.

Das Problem ist hier nicht das Netzteil. CS2 ist so garnicht schwer für die GPU sondern wird garantiert von dem 5900X eingebremst. Meine 4080 langweilt sich in CS2 in WQHD.

Du kannst mal noch mit dem anderen BIOS der Karte testen, das Silent BIOS sollte auch weniger Power freigeben. Warscheinlicher ist hier jedenfalls das der Treiber unter Linux oder die Karte selbst ein Problem haben und das die Steuerung des PT im Bezug auf Partnerkarten ggf. noch nicht sauber implementiert ist.

Könntest du eigentlich realtiv schnell gegentesten. Pack ne SSD ins System, Windows mit Treiber drauf und deine Kandidaten kurz mit den selben Settings durchjagen. Geht die Karte da auch stiften, hat sie ein Problem, wenn nicht ist Treiber/Kernelimplementierung in Linux einfach noch nicht perfekt.
 
  • Gefällt mir
Reaktionen: floTTes
Ich habe keinen Plan von Linux, aber unter Windows würde ich jetzt prime95 und Furmark gleichzeitig laufen lassen um die PSU auszuschließen. Für mich liest sich das so als wären die Lastspitzen zuviel und das könnte darauf hindeuten dass das Netzteil defekt ist.
Mojo1987 schrieb:
das kommt locker mit der 7900 XTX klar
wenn es in Ordnung ist, definitiv ja
 
  • Gefällt mir
Reaktionen: floTTes
Das Problem ist wohl, wenn die Karte bspw von 10% auf 100% Auslastung springt. Dabei zieht sie eventuell kurz zu viel Strom. Wenn sie permanent auf um die 90% arbeitet, wie in Cyberpunk oder im Furmark, wird daa nicht auftreten.

Eine Idee wäre es, eine mindest-Taktzahl für die GPU festzulegen, damit sie nicht zu sehr einnickt um dann zu heftig auf zu schrecken.
Geht glaub ich mit CoreCtrl.
 
  • Gefällt mir
Reaktionen: Natriumchlorid
oder eben mal einen Frame Limiter probieren? libstrangle, mangohud oder gamescope?
 
AGB-Leser schrieb:
Kannst Du das umstellen auf Singlerail-Betrieb?
Ich bin mir nicht sicher, ob das bei meinem Netzteil möglich ist. Ich sehe dazu keine Referenz in der Anleitung und am Netzteil. Wie kann ich das herausfinden und was bringt mir diese Eigenschaft?

Mojo1987 schrieb:
Du kannst mal noch mit dem anderen BIOS der Karte testen, das Silent BIOS sollte auch weniger Power freigeben.
Das ist eben der Grund, weshalb ich gerade primär mit dem Silent BIOS (Alternative BIOS) unterwegs bin, da das Powertarget per default von 339W auf 291W gesenkt wird. Mittels dem Treiber senke ich dann nochmal zusätzlich den Wert auf den Kleinstmöglichen, der mir angeboten wird.

Mojo1987 schrieb:
Warscheinlicher ist hier jedenfalls das der Treiber unter Linux oder die Karte selbst ein Problem haben und das die Steuerung des PT im Bezug auf Partnerkarten ggf. noch nicht sauber implementiert ist.
Da bin ich mir nicht so sicher.
Zum einen hatte ich mit RDNA1 solche Probleme nicht. Ggf. teste ich das mal nochmal explizit mit meiner 5700XT Nitro+, um es einmal zu bestätigen, dass die Powertargets eingehalten werden.
Und zum anderen kann ich durchaus beobachten, dass die aktuelle Karte üblicherweise unterhalb vom eingestellten PowerTarget agiert. Ausser bei den Lastspitzen, die ich nicht kontrollieren kann. :D

Tevur schrieb:
Eine Idee wäre es, eine mindest-Taktzahl für die GPU festzulegen, damit sie nicht zu sehr einnickt um dann zu heftig auf zu schrecken.
Das klingt noch interessant, das werde ich testen. Danke. :)

drake23 schrieb:
Frame Limiter probieren?
Der Frame Limiter ist gerade mein Workaround. Wenn ich die FPS auf 60 begrenze (und zusätzlich die Settings runterschraube) wirke ich den Abstürzen gut entgegen, aber eliminiert hab ich sie damit noch nicht.

Das Netzteil hab ich im Juni 2022 gekauft und konnte damit bereits eine 5700XT und GTX 1660 Super gleichzeitig befeuern. Anfang 2023 hab ich beide Karten gegen die 7900XTX getauscht und konnte erst bei CS2 die ersten Abstürze beobachten. Die Abstürze sind auch nur exklusiv bei den beiden genannten Spielen vorhanden. Sonst kann ich mit der Karte alles spielen und machen.

Mein 5900X läuft mit Standardwerten, da wurde nichts geändert. Einzig der RAM läuft mit 3200 MHz, aber dort hab auch nichts manuell verändert, sondern verwende die vorhandenen XMP-Profile.

Mojo1987 schrieb:
CS2 ist so garnicht schwer für die GPU sondern wird garantiert von dem 5900X eingebremst. Meine 4080 langweilt sich in CS2 in WQHD.
Ich gehe aktuell davon aus, dass CS2 zu schwer für meine 7900 XTX / PSU in der aktuellen Konstellation ist. Wenn ich bei 4K die Settings auf die höchste Stufe stelle, dann sind Abstürze während dem Match vorhanden. Bei 4K und mittleren bis hohen Settings hab ich die nicht.

Dann teste ich die Tage das Verhalten unter Windows 11, um die Sicherheit zu gewinnen, dass das Problem unabhängig vom Betriebssystem ist.

Und so wie ich das verstehe, gibt es keine Möglichkeit diese Lastspitzen zu verhindern, richtig?
 
Natriumchlorid schrieb:
Und so wie ich das verstehe, gibt es keine Möglichkeit diese Lastspitzen zu verhindern, richtig?
Nein gibt es nicht, aber die sind nicht dein Problem, vorausgesetzt dein Netzteil ist nicht defekt.
Du versteifst dich da auf eine Sache die keine Grundlage hat.

RDNA1 mit RDNA3 zu vergleichen was Lastspitzen und Leistungskurven angeht macht übrigens auch kein Sinn, allein schon weil der Fertigungsprozess ein anderer ist, was das Verhalten grundlegend beeinflusst.

Aber teste es mit Windows gegen, sollte damit ja dann problemlos reproduzierbar sein.
Ich bleib aber dabei, das ist ein Problem des Linuxtreibers/der Implementierung der Interfaces in Verbindung mit deinem Szenario.
 
Übrigens, hab im GitLab noch einen Benutzer gefunden, welcher genau das selbe Problem beschreibt. Dort reportieren Nutzer sogar Lastspitzen von bis zu 521W. Der Ersteller schreibt von dem gleichen Verhalten unter Windows.

Seine Lösung war auch ein Netzteilwechsel (1050W -> 1500W).

Muss das Verhalten unter Windows noch gegen testen, um die Gewissheit zu haben. :D
 
  • Gefällt mir
Reaktionen: drake23
Also gut, nun hab ich die Gewissheit. Unter Windows beobachte ich exakt das gleiche Verhalten.

Ich hab als Testgrundlage Windows 10 mit dem Adrenalin 23.12.1 (WHQL Recommended) Treiber verwendet. HWInfo64 als Monitoring und SotF mit den gleichen Settings gestartet. Den höchsten Leistungswert, den ich beobachten konnte war 453W. Beim Absturz wurde wieder alles schwarz, wie unter Linux.

Unter Windows wird nochmal zwischen einem kurzen Powertarget und einem langen Powertarget unterschieden (laut HWInfo). Während der langanhaltende PT-Wert bei 339W lag (BIOS 1) liegt der kurzzeitige PT-Wert bei 406.8W (x1,2). Diesen Wert sehe ich unter Linux zwar nicht, aber er wird ja auch unter Windows nicht eingehalten.

Jetzt führt nichts mehr an einem stärkeren Netzteil vorbei, oder hat jemand noch andere Meinungen dazu? Wäre das ggf. ein Fall für die Garantie? Ich kann mir nämlich auch nicht vorstellen, dass die Leistungsspitzen über 840W betragen sollen, das klingt schon fast nach einem Defekt.
 
Schau mal nach einem BIOS Update für die Grafikkarte und die Hauptplatine.

Ansonsten mal im Netz schauen, ob die Werte der Grafikkarte überhaupt in Ordnung sind. Das Netzteil, was Du hast, ist ausreichend, ich halte die Grafikkarte für fehlerhaft
Ergänzung ()

Natriumchlorid schrieb:
Ich bin mir nicht sicher, ob das bei meinem Netzteil möglich ist. Ich sehe dazu keine Referenz in der Anleitung und am Netzteil. Wie kann ich das herausfinden und was bringt mir diese Eigenschaft?
Wenn nichts da steht, dann geht das wohl nicht. Was steht auf dem Typenschild? Da kannst Du ja die maximale Leistung auf den jeweiligen Leitungen sehen
 
AGB-Leser schrieb:
Ansonsten mal im Netz schauen, ob die Werte der Grafikkarte überhaupt in Ordnung sind. Das Netzteil, was Du hast, ist ausreichend, ich halte die Grafikkarte für fehlerhaft
Im Testbericht von Igors Lab werden in einem Unterkapitel die Lastspitzen der Karte analysiert. Dort sind Werte von bis zu 581W gemessen worden. Das ist ein gutes Stück oberhalb der angegebenen Herstellerwerte und meiner eigenen Beobachtungen.
Dort wird auch ein Netzteil mit mindestens 850W empfohlen. Ich bin aber mittlerweile der Meinung, dass diese kurze Lastspitzen nicht von jedem Netzteil gestemmt werden können. Mein Netzteil mag zwar theoretisch 840W stemmen können, aber nicht, wenn der Stromverbrauch sprunghaft ansteigt.

Ich werde heut Abend mal schauen, ob es ein neues BIOS für meine Karte gibt.

AGB-Leser schrieb:
Was steht auf dem Typenschild?
Im vierten Post sind die richtigen Werte abgebildet.
 
Diese Leistung klingt zwar erstmal wahnsinnig, aber nach einem Blick ins Datenblatt und auf die Tabelle von Igor, sieht man dann, dass alles nur halb so wild ist. Diese Leistung taucht, ich rate jetzt mal, nur maximal zwei Millisekunden auf. Und wenn sich alle an die Spezifikationen halten, dann tritt sowas auch nicht auf.

Ich bleibe dabei:
Schau dich nach einem neuen BIOS um
Ergänzung ()

Natriumchlorid schrieb:
Im Testbericht von Igors Lab werden in einem Unterkapitel die Lastspitzen der Karte analysiert. Dort sind Werte von bis zu 581W gemessen worden. Das ist ein gutes Stück oberhalb der angegebenen Herstellerwerte und meiner eigenen Beobachtungen.
Dort wird auch ein Netzteil mit mindestens 850W empfohlen. Ich bin aber mittlerweile der Meinung, dass diese kurze Lastspitzen nicht von jedem Netzteil gestemmt werden können. Mein Netzteil mag zwar theoretisch 840W stemmen können, aber nicht, wenn der Stromverbrauch sprunghaft ansteigt.

Ich werde heut Abend mal schauen, ob es ein neues BIOS für meine Karte gibt.


Im vierten Post sind die richtigen Werte abgebildet.
Und selbst die 581W sind noch weit weg von den 840W, die deine 12V-Schiene liefert.
Ich würde auch versuchen, die Energiespareinstellungen nicht zu straff einzustellen, damit die Schwankungen nicht so krass werden

Ich nutze dafür ein Programm, das Radeon* irgendwas heißt. Sty, grade nicht am Rechner
Damit kann ich die Energieeinstellungen ändern. Stelle das auf Leistung und dann teste noch mal
 
mcg00 schrieb:
Was ist denn der konkrete Vorschlag?

Ich habe CoreCtrl gerne mit meiner 5700 XT verwendet.
Aber mit der 7900 XTX war es bis zur Version 6.7 des Kernels nicht möglich umfangreiche Anpassungen an einer RDNA 3 Karte durchzuführen, unabhängig welches GUI-Frontend verwendet wird. Die notwendigen Interfaces waren dafür nicht (vollständig) vorhanden.
CoreCtrl hat zusätzlich aktuell das Problem, dass nur ein einzelner Parameter geändert werden kann. Ich kann zum Beispiel nur den maximalen Takt oder das Voltageoffset festlegen. Aber nicht beides. Sobald ein Wert geändert wird, wird der andere wieder zurückgesetzt. Das ist auch der Grund weshalb ich direkt ohne Frontend-Applikation mit den Interfaces spreche - die ganze Sache ist eben noch nicht stable.

Mit LACT hab ich keine Erfahrung, aber es steht auch direkt auf der GitHub-Seite geschrieben, dass der Support für RDNA 3 noch nicht vorhanden ist. Gründe sind bereits genannt worden. Der Kernel 6.7 wird erst nächste Woche als Stable-Release verfügbar sein.

AGB-Leser schrieb:
Nein, unter Linux braucht es für den normalen Benutzer mit AMD-Karte keinen zusätzlichen Treiber. Die sind bereits im Linux-Kernel vorhanden. Für die 3D-Beschleunigung braucht es nur das mesa Paket.

Aktuell benötigen nur NVIDIA-Nutzer zusätzliche Treiber und die AMD-Nutzer im Pro-Bereich mit speziellen Anforderungen.
 
Zuletzt bearbeitet:
Natriumchlorid schrieb:
Nein, unter Linux braucht es für den normalen Benutzer mit AMD-Karte keinen zusätzlichen Treiber. Die sind bereits im Linux-Kernel vorhanden. Für die 3D-Beschleunigung braucht es nur das mesa Paket.

Aktuell benötigen nur NVIDIA-Nutzer zusätzliche Treiber und die AMD-Nutzer im Pro-Bereich mit speziellen Anforderungen.
Ich rede ja auch von der Software, nicht vom Treiber. Die Sache mit dem Treiber kenne ich ja, habe ja selber eine 6900xt.

Das Programm, was ich meine, heißt radeon-profile
 
Zurück
Oben