GPU-Performance brach plötzlich ein unter Pop_OS

Shy Bell

Lt. Junior Grade
Registriert
Jan. 2020
Beiträge
472
Hallo zusammen,

ich musste leider feststellen, dass mein PC von Heute auf Morgen circa 90% seiner GPU-Leistung unter Linux (Pop_OS) verloren hat.
Ich nutze Pop_OS seit circa 1,5 Jahren und habe hiermit meine ersten Linuxerfahrungen im privaten Umfeld gesammelt.
Seit kurzem habe ich mit der mitgelieferten GNOME Desktopumgebung immer wieder Systemabstürze beobachtet. Dazu habe ich ungelöste Bugtickets gefunden, also war ich schon kurz vor der Neuinstallation.
Ich wollte dann auf Cinnamon wechseln, was mir nicht gelang, weil irgendeine Abhängigkeit der GNOME POP Shell nicht aufgelöst werden konnte (unmet dependencies oder so). Guides im Internet befolgt, kein Erfolg.
Dann habe ich glücklicherweise KDE installieren können und das war auch erfolgreich. Damit konnte ich einige Tage Elden Ring spielen. Das stürzte zwar auch gelegentlich ab, das war aber auch schon vor Wochen der Fall, bevor die GNOME-Probleme in Vorschein traten.
Nun aber zu meinem eigentlichen Problem. Gestern mache ich meinen PC an und ich kann quasi nichts mehr spielen, Elden Ring stottert mit 10 FPS und sogar Dorfromantik läuft nur auf 10 FPS, obwohl es vorher locker über 100 bei 4K geschafft hat.
Anhand von Mangohud kann ich erkennen, dass die GPU permanent auf 100% ist, während die CPU Leerlauf hat - kein Wunder bei 10 FPS.
Irgendwas stimmt damit also nicht.

Was habe ich getestet:
GNOME Desktop und KDE Plasma Desktop Umgebung. GPU Tweaks in Corectrl auf Standard.
Alles ohne Erfolg.

Dann mal wieder Windows 10 gebootet und nach unzähligen Updates Dorfromantik gestartet, welches wie zu erwarten flüssig lief.

Meine Schlussfolgerung, die Linuxkiste ist softwareseitig verfriemelt und ich habe keine Ahnung, was ich machen kann, außer das System platt zu machen, was ich vermutlich tun werde, wenn ich durch euch keine Lösung finden werde. Was müsste ich da sichern, außer wichtige Dateien im Home Verzeichnis?

Kurz zu meinem System:

3700X, B550 MSI A-Pro, 32 GB GSkill RAM, RX 6600 XT Nitro+, LG OLEDC42, POP_OS 22.04, ich nutze den amdgpu Treiber.

Wenn ich noch irgendetwas Sinnvolles zur Verfügung stellen kann, bitte fragen. Ich habe wie gesagt, bis vor 2 Jahren nur Windows genutzt und weiß daher nicht einmal, wie ich GPU Treiber neu installieren bzw. zurücksetzen kann. Ich lese nur irgendwie ist das im Kernel drin und geht nicht.
 
Kernel 4.4? Da hab ich auch irgendwelche Probleme, die den RAM-Takt der Grafikkarte auf 100MHz festnageln. Soll in 4.5 gelöst sein. Wenn es dasselbe Problem ist, sind die Workarounds: Bildwiederholrate auf 60Hz reduzieren, eine andere Kernelversion verwenden, X statt Wayland benutzen.
 
  • Gefällt mir
Reaktionen: Shy Bell
Shy Bell schrieb:
ich nutze den amdgpu Treiber.
Hast du den schon immer benutzt? Poste bitte mal das Ergebnis von "vulkaninfo --summary".
Generell bietet radv bessere Performance.
 
war es geraten, dass die abstürze am desktopenvironment liegen?
de auf installiertem system wechseln zur behebung von adhoc-abstürzen ist ein bisschen fragwürdig.

meine empfehlung. desktopenvironments auf online vms testen -> distrosea.com oder per live-cd lokal.
nach persönlichen vorlieben für eins entscheiden. dann dein linux frisch aufsetzen.
wenn es mit deinem frischen linux abstürze geben sollte, dann auf journal/kernel logs zurückgreifen um fehlerursache zu identifizieren.

sichern musst du alle daten, die du persönlich brauchst, egal wo du sie abgelegt hast (home verzeichnis, evtl andere ordner, ich lege auch oft als root mal etwas irgendwo außerhalb von home ab und muss das für backup berücksichtigen).
welche daten du von dem system brauchst, musst du ja am besten wissen.
 
@Garmor
Kernel 4.4 ist doch super alt oder nicht?
Also unter Corectrl steht, dass ich 6.4.6 und Mesa 23.1.3 nutze.
Ich habe gerade nachgeschaut und die Karte läuft tatsächlich auf 96 Mhz RAM Takt.
Eben beim Test den TV auf 60 Hz gestellt und die GPU taktet normal.

Zu deinen anderen Hinweisen:
1. Ich dachte ich benutze X11 und nicht Wayland? habe zumindest immer X11 gelesen.
2. Wie ändere ich denn die Kernelversion?

@mytosh
Edit:
Code:
==========
VULKANINFO
==========

Vulkan Instance Version: 1.3.204


Instance Extensions: count = 20
-------------------------------
VK_EXT_acquire_drm_display             : extension revision 1
VK_EXT_acquire_xlib_display            : extension revision 1
VK_EXT_debug_report                    : extension revision 10
VK_EXT_debug_utils                     : extension revision 2
VK_EXT_direct_mode_display             : extension revision 1
VK_EXT_display_surface_counter         : extension revision 1
VK_EXT_swapchain_colorspace            : extension revision 4
VK_KHR_device_group_creation           : extension revision 1
VK_KHR_display                         : extension revision 23
VK_KHR_external_fence_capabilities     : extension revision 1
VK_KHR_external_memory_capabilities    : extension revision 1
VK_KHR_external_semaphore_capabilities : extension revision 1
VK_KHR_get_display_properties2         : extension revision 1
VK_KHR_get_physical_device_properties2 : extension revision 2
VK_KHR_get_surface_capabilities2       : extension revision 1
VK_KHR_surface                         : extension revision 25
VK_KHR_surface_protected_capabilities  : extension revision 1
VK_KHR_wayland_surface                 : extension revision 6
VK_KHR_xcb_surface                     : extension revision 6
VK_KHR_xlib_surface                    : extension revision 6

Instance Layers: count = 11
---------------------------
VK_LAYER_INTEL_nullhw             INTEL NULL HW                 1.1.73   version 1
VK_LAYER_MANGOHUD_overlay         Vulkan Hud Overlay            1.2.135  version 1
VK_LAYER_MANGOHUD_overlay         Vulkan Hud Overlay            1.2.135  version 1
VK_LAYER_MESA_device_select       Linux device selection layer  1.3.211  version 1
VK_LAYER_MESA_overlay             Mesa Overlay layer            1.3.211  version 1
VK_LAYER_TORKEL104_libstrangle    Libstrangle framerate limiter 1.1.125  version 1
VK_LAYER_VALVE_steam_fossilize_32 Steam Pipeline Caching Layer  1.3.207  version 1
VK_LAYER_VALVE_steam_fossilize_64 Steam Pipeline Caching Layer  1.3.207  version 1
VK_LAYER_VALVE_steam_overlay_32   Steam Overlay Layer           1.3.207  version 1
VK_LAYER_VALVE_steam_overlay_64   Steam Overlay Layer           1.3.207  version 1
VK_LAYER_VKBASALT_post_processing a post processing layer       1.2.136  version 1

Devices:
========
GPU0:
        apiVersion         = 4206838 (1.3.246)
        driverVersion      = 96473091 (0x5c01003)
        vendorID           = 0x1002
        deviceID           = 0x73ff
        deviceType         = PHYSICAL_DEVICE_TYPE_DISCRETE_GPU
        deviceName         = AMD Radeon RX 6600 XT (RADV NAVI23)
        driverID           = DRIVER_ID_MESA_RADV
        driverName         = radv
        driverInfo         = Mesa 23.1.3-1pop0~1689084530~22.04~0618746
        conformanceVersion = 1.3.0.0
        deviceUUID         = 00000000-2d00-0000-0000-000000000000
        driverUUID         = 414d442d-4d45-5341-2d44-525600000000
GPU1:
        apiVersion         = 4206838 (1.3.246)
        driverVersion      = 1 (0x0001)
        vendorID           = 0x10005
        deviceID           = 0x0000
        deviceType         = PHYSICAL_DEVICE_TYPE_CPU
        deviceName         = llvmpipe (LLVM 15.0.7, 256 bits)
        driverID           = DRIVER_ID_MESA_LLVMPIPE
        driverName         = llvmpipe
        driverInfo         = Mesa 23.1.3-1pop0~1689084530~22.04~0618746 (LLVM 15.0.7)
        conformanceVersion = 1.3.1.1
        deviceUUID         = 6d657361-3233-2e31-2e33-2d31706f7000
        driverUUID         = 6c6c766d-7069-7065-5555-494400000000

@Redundanz
Die Abstürze wurden durch die GNOME DE ausgelöst - das habe ich nicht geraten, sondern durch Internetrecherche in Erfahrung gebracht. Ein Prozess spammt im Fehlerfall das Syslog voll, sodass der Computer still steht und das Log binnen Sekunden in GB Größe wächst.
Da der Fehler nicht innerhalb von 2 Jahren gelöst wurde und der Ersteller POP_OS deinstalliert hat, habe ich da auch keine Hoffnung diesen Pfad weiter zu betreten.


Danke für die Hilfe schon einmal.
 
Zuletzt bearbeitet:
Mit 6.4 gab's eine erhebliche Performance-Regression dank des bereits erwähnten Bugs. Aber eigentlich müsste das mit 6.4.6 längst wieder behoben sein.

Angeblich hilft es die Monitor-Bildwiederholrate auf 120Hz/119Hz zu setzen.

Edit:

1691327069669.png
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: floTTes und Shy Bell
Also der MCLK scheint bei RX 6000 und Linux ein Sorgenkind zu sein.
Ich umreiße mal kurz meine Erfahrungen:

Windows 10 Übertaktung auf 2150 ohne Probleme.
Unter Linux ging erstmal nur 2000 (Standard), weil es da einen Bug im Treiber oder Corectrl gab, bin mir nicht mehr sicher.
Irgendwann ging es dann, sodass ich auch die 2150 gefahren bin. Dann wechsel ich auf den 4K OLED und habe ständig schwarzes Flackern. Dieses tritt vor allem dann auf, wenn die Karte runtertaktet, z.B. auf 1350. Stelle ich auf 2000, läuft es ohne Flackern, aber taktet auch niemals herunter.

Ich habe jetzt erstmal auf 100 Hz limitiert, weil es gut zu laufen scheint und mein aktuelles Hauptspiel Elden Ring ist sowieso auf 60 limitiert.

Also ich möchte ja wirklich Linux treu bleiben, aber ich kann auch verstehen, warum man keine Lust auf einen Wechsel hat. Diese Probleme treten nachweislich unter Windows nicht auf, weil ich jederzeit dank Dualboot Hardwareprobleme ausschließen kann...
 
Shy Bell schrieb:
Also ich möchte ja wirklich Linux treu bleiben, aber ich kann auch verstehen, warum man keine Lust auf einen Wechsel hat.

Ja, solche Quirks gibt es leider immer wieder mal.
Wie du siehst ist die Community recht fix hinterher und identifiziert die Probleme oder bietet Lösungsvorschläge an. Aber gerade bei Problemen mit dem Kernel kann es meiner Erfahrung nach länger dauern bis ein echter Fix released wird.

Ein andere Möglcihkeit wäre natürlich ein Rollback auf eine Kernelversion, bei der das Problem noch nicht aufgetreten ist. LTS wäre beispielsweise 6.1.xx
Dort hat man dann wiederum das Problem, dass mitunter Funktionen für aktuelle Hardware fehlen. Bei 6.1 gäbe es beispielsweise das neue P-State Powermanagement für AMD CPUs nicht.


Ich fahre auch nach über 10 Jahren Linux noch zweigleisig, wobei mein Windows-Rechner fast nur noch fürs Zocken gebootet wird.
 
Zurück
Oben