RDNA3 Powertarget unter Linux

@Natriumchlorid Nutzt du VRR (vsync)? Falls ja, wie aktivierst du es? Ich habe da so eine Vermutung.
 
Ja, ich nutze VRR. Unter den Systemeinstellungen von KDE hab ichs aktiviert.

Screenshot_20240415_191226.png
 
Komischerweise seh ich die Einstellung bei mir gar nicht mehr.

Edit:
Ich konnte gestern einen ganzen Tag ohne Crashes zocken/streamen. Ich werde das noch weiter bis über das Wochenende testen aber was ich gemacht habe ist, von Wayland (labwc) auf X11 (Plasma/KDE) zurück zu wechseln.
Ich bin mir relativ sicher, dass ich das zu Beginn der Probleme schon einmal probiert hatte und auch dort Crashes unter X11 bemerkt hatte. Daher wäge ich mich noch nicht in Sicherheit...

Falls es aber tatsächlich unter X11 zu deutlich weniger/gar keinen Crashes mehr kommt, muss ich noch herausfinden woran es genau unter Wayland hakt. Eine Vermutung war eben VRR bzw. adaptive vsync, dass ich für Helldivers 2 explizit deaktiviert habe nun. Daraufhin werde ich auch mal die Plasma Wayland session testen um zu schauen wie es sich dort verhält.
 
Zuletzt bearbeitet:
Also irgendwie versteh ich die Werte der Karte unter Linux nicht. Generell, die Karte läuft jetzt recht stabil, seit knapp ner halben Woche keine Abstürze. Teste jetzt sogar unter Plasma Wayland. Ich bin noch nicht ganz weiter herauszufinden woran es lag, aber ich vermute weiterhin VRR.

Hier wird ein Boot-Takt von 2450 Mhz erwähnt, warum wird in Linux ein höherer Takt als maximum GPU Clock angegeben? Auch ist mir das Powerlimit ein Rätsel, selber Link sagt 331 Watt, unter Linux hab ich sie jetzt auf 260/333W?! Wenn ich auf Default setze packt er mir die Karte auf 265.

Ich ralls echt nicht...
 
Zuletzt bearbeitet:
Snakeeater schrieb:
wird ein Boot-Takt von 2450 Mhz erwähnt, warum wird in Linux ein höherer Takt als maximum GPU Clock angegeben?
bezüglich des taktes kommt es ganz auf das entsprechende spiel an. In deinem link wird ein ein boost takt von 2450mhz angegeben, bei den darunter gezeigten spielen taktet sie bis 2600mhz. Deine Karte taktet so weit hoch bis sie ein limit erreicht hat, max clock oder TBP. Die 2450mhz sind wahrscheinlich ein min boost. und kein max clock.
 
Vielleicht war ich nicht ganz eindeutig in meiner Aussage: Ich meine die höhere max GPU Clock in bspw. LACT. Denn obwohl dort 2600 eingetragen ist, geht der Wert in Spielen laut Mangohud manchmal etwas höher, wenn auch nur marginal.
 
Zuletzt bearbeitet:
Code:
cat /sys/class/drm/card*/device/hwmon/hwmon2/power1_cap_max                         ─╯
───────┬────────────────────────────────────────────────────────────────────────────────
       │ File: /sys/class/drm/card1/device/hwmon/hwmon2/power1_cap_max
───────┼────────────────────────────────────────────────────────────────────────────────
   1   │ 333000000
───────┴──────────────

Code:
cat /sys/class/drm/card*/device/hwmon/hwmon2/power1_cap_default                     ─╯
───────┬────────────────────────────────────────────────────────────────────────────────
       │ File: /sys/class/drm/card1/device/hwmon/hwmon2/power1_cap_default
───────┼────────────────────────────────────────────────────────────────────────────────
   1   │ 265000000
───────┴─────────────
Code:
cat /sys/class/drm/card*/device/hwmon/hwmon2/power1_cap                             ─╯
───────┬────────────────────────────────────────────────────────────────────────────────
       │ File: /sys/class/drm/card1/device/hwmon/hwmon2/power1_cap
───────┼────────────────────────────────────────────────────────────────────────────────
   1   │ 260000000

Versteh nichtmal was das bedeuten soll, cap, default und max. xD
 
Snakeeater schrieb:
Versteh nichtmal was das bedeuten soll, cap, default und max. xD
Dann lohnt sich ein Blick in die aktuelle Dokumentation.

hwmon interfaces for GPU power:
  • power1_average: average power used by the SoC in microWatts. On APUs this includes the CPU.
  • power1_input: instantaneous power used by the SoC in microWatts. On APUs this includes the CPU.
  • power1_cap_min: minimum cap supported in microWatts
  • power1_cap_max: maximum cap supported in microWatts
  • power1_cap: selected power cap in microWatts
*_cap_max beschreibt also das maximale Powertarget, welches von der Karte angeboten wird.
*_cap_default beschreibt den Standardwert des PT, welches im BIOS der Karte definiert ist.
*_cap beschreibt das aktuell definierte PT.

Sprich deine Karte unterstützt maximal 333W, hat per default 265W gesetzt und in der aktuellen Session liegt das Limit bei 260W.
 
  • Gefällt mir
Reaktionen: Snakeeater
Ich bin jetzt über Plasma X11, Plasma Wayland wieder bei meiner Ausgangsumgebung labwc (Wayland) gelandet. Bisher ohne Abstürze, wobei ich da noch etwas verhalten bin, muss das noch bis einschließlich Wochenende durch testen.

Ich habe nichts geändert, außer die VRR (adaptive vsync) Einstellung zu deaktivieren.
Natriumchlorid schrieb:
Dann lohnt sich ein Blick in die aktuelle Dokumentation.


*_cap_max beschreibt also das maximale Powertarget, welches von der Karte angeboten wird.
*_cap_default beschreibt den Standardwert des PT, welches im BIOS der Karte definiert ist.
*_cap beschreibt das aktuell definierte PT.

Sprich deine Karte unterstützt maximal 333W, hat per default 265W gesetzt und in der aktuellen Session liegt das Limit bei 260W.
Hier nochmal kurz zu, d.h. das cap_max kann man gar nicht verändern? Und wenn ich mein *_cap nun wieder von 260 auf 265 setze und Crashes erlebe, deutet das das mein NT zu wenig Watt liefert?
 
Snakeeater schrieb:
Hier nochmal kurz zu, d.h. das cap_max kann man gar nicht verändern?
Genau. Der Wert darf als oberes Limit verstanden werden. Das PT kann nicht über dem Wert vom cap_max liegen.

Snakeeater schrieb:
wenn ich mein *_cap nun wieder von 260 auf 265 setze und Crashes erlebe, deutet das das mein NT zu wenig Watt liefert?
Nein. Wenn du den Wert von 260 auf 265 erhöhst, dann drosselt die Karte erst ab 265W und nicht schon bei 260W (Stichwort: Power Throttling).
Da du auch Crashes bei geringer Last hast, vermute ich das Problem nicht beim Netzteil.
 
Also ich will nochmal kurz zurück melden. Ich spiele momentan leider nur ein Spiel Helldivers 2, daher kann ich keine großartigen Aussagen machen die auf alles zutreffen. Ich kann nur bestätigen das meine RX 7900 XT nach der Anschaffung sehr gut und stabil lief mit Hunt: Showdown. Bis vor etwa 2-3 Monaten, die Probleme begannen etwa mit Kernel Versions Upgrades von 6.4+ aufwärts. Ist schwierig genau festzumachen.

Auf jedenfall kann ich jetzt relativ stabil unter labwc (wayland) Helldivers 2 spielen. Ich hatte 2-3 crashes, die aber nur das Spiel haben abschmieren lassen. Nicht wie zuvor den gesamten Computer, ich gehe davon aus, dass es sich hierbei um eine etwas andere Problematik handelt.

Was ich seitdem gemacht habe:
  • über Mangohud config explizit Adaptive Vsync deaktiviert
  • Fullscreen adaptive refresh rate config aus labwc entfernt
  • statt Corectrl auf LACT gewechselt und dort die Config etwas angepasst (ich editiere die genauen Einstellungen später)
    • fühlt sich für mich viel runder an das Programm, kein dummes Profil Rumgeklicke jedes mal beim booten
  • keine Systemupdates mehr durchgeführt
    • um einfach nicht noch mehr Variablen in den Test einfließen zu lassen
Was ich noch machen will:
  • testweise das Powertarget wieder auf 265W setzen
  • schauen wie ich adaptive Vsync doch evtl. zum Laufen bekomme
    • herausfinden ob es hier am Spiel oder am WM liegt, welches im Zusammenhang mit Vsync abschmiert
  • Systemupdates durchführen 😱
 
Also für mich ergibt sich momentan folgendes Bild:
  • die unter LACT konfigurierten Einstellungen werden nur im Spiel aktiv, wenn ich LACT dazu bringe die config "zu schreiben" während das Spiel aktiv ist
    • beliebigen Wert ändern, apply, yes
  • tu ich das nicht, verbleibt die Karte in einem ziemlich gekappten Zustand von etwa ~230W, ~2200 Mhz Takt und recht konstant ~750mV
  • issue dazu
Was mich allerdings noch wundert ist das das
Code:
/sys/class/drm/card5/device/pp_power_profile_mode
immer auf BOOTUP_DEFAULT verbleibt. Sollte das nicht automatisch auf bspw. 3D_FULL_SCREEN wechseln wenn ich ein Spiel starte? An sich bemerke ich allerdings keine Performanceunterschiede wenn ich manuell das profile ändere.
Trotzdem scheint mir das Verhalten merkwürdig bzw. ist mir nicht ganz klar wozu es das power_profile überhaupt gibt wenn es sich nie ändert?
 
Zurück
Oben