RX 7900 XT Throttling Temp

Snakeeater

Commander
Registriert
Aug. 2004
Beiträge
2.215
  • Netzteil: Corsair SF 750
  • Gehäuse: Dan C4-SFX
  • Grafikkarte: Sapphire Pulse RX 7900 XT
  • 3 Noctua Case Fans und einen Noctua Tower für die CPU
  • OS: Linux
Meine RX 7900 XT ruft plötzlich die volle Leistung nicht mehr ab und wirkt meist gedrosselt. Im MangoHUD (Linux) wird angezeigt das die Karte wohl "Throttling" betreibt aufgrund von "Temp". Die Temperaturen kratzen aber nicht mal an 80°.

Ich habe mal Testweise die Gehäuselüfter auf Turbo laufen lassen ohne Erfolg. Mir kommt es generell spanisch vor das die Karte so früh "throttled". Gibt es evtl. einen bekannten Bug der das hervor ruft?
 
Zuletzt bearbeitet:
Wie heiß wird der VRam der Karte?
 
Die GPU hat ja irgendwie 3 temp werte, edge, junction und mem. Keiner der Werte übersteigt bisher 80 Grad wie oben erwähnt.
 
Hmm kannst du mit einem Programm auslesen wie hoch die Karten dann nur noch taktet wenn sie "gedrosselt" wirkt.
 
Ja etwa ~2200 Mhz, kaum höher. Auslastung dauerhaft 100%. An Watt gönnt sie sich dann so etwa 220-230.
 
Snakeeater schrieb:
Ja etwa ~2200 Mhz, kaum höher. Auslastung dauerhaft 100%. An Watt gönnt sie sich dann so etwa 220-230.
Wie viel sollte sie normal haben?
 
Ein Programm zum auslesen speziell von AMD Grafikkarten.
 
Ich bin auf Linux.
 
Woher hast du die 2600 Mhz ohne boost?
Die XT sollte 2075 MHz GPU clock und 2449 MHz Boost haben.
Hast du mal ein GPU-Z Screenshot von der Karte?
 
Hotspot wird vermutlich deutlich höher sein als die normale GPU Temp.

Tritt bereits in gut belüfteten Gehäusen auf, in dem kleinen Backofen wird das viel schlimmer sein, deshalb taktet die Karte von sich aus runter damit nichts kaputt geht.

Keine Ahnung ob es ein Linux Äquivalent zu GPU-Z gibt das alle Sensoren auslesen kann.

Kurzer Test in Cinebench24 weil es eine gleiche Auslastung erzeugt.

Normales GPU Profil ohne Anpassungen:

~13000 Punkte, ~2850Mhz, max 323W, 62° GPU Temp, 81° Hot Spot Temp, 1,057v

Angepasster Profil mit 2500Mhz, 1,045v max (90% Takt und 95% Voltage) und -10% Power Limit:

~12200 Punkte, ~2500Mhz, max 221W Verbrauch, 51° GPU, 63° Hot Spot, 0,844v

Da sieht man wie krass sich der Hotspot verändert und aus 10° Unterschied einfach 20° werden, weil 100W mehr abgeführt werden müssen, zB kein perfekter Sitz des Kühlers, was eh nicht möglich ist (müsste eigentlich Kelvin sein und nicht Grad, aber zum Verständnis...)
 

Anhänge

  • profil.png
    profil.png
    823,3 KB · Aufrufe: 93
  • 2500.png
    2500.png
    1,8 MB · Aufrufe: 96
  • 2800.png
    2800.png
    1,8 MB · Aufrufe: 91
Meine Taktet wie gesagt nichtmal in den Bereich von 2500 Mhz, wenn dieses Problem besteht. Und das bestand nicht immer.
 
Laut Specs
Gameclock ist 2075Mhz - Boost 2449. Von daher passen die Werte die du angibst doch? MangoHud hatte das schonmal, dass es "Throttling" reported hatte obwohl es wohl "normal" ist. siehe zwar sollte das mittlerweile gefixt sein aber ggf. ist das Problem wieder mit einer neueren Kernel zurückgekehrt?

Ansonsten woran konkret bemerkst du denn dass deine Karte "bremst" und wo entnimmst du deine Temperaturen? Von "lm_sensors" ?
 
Wenn sie nicht "bremst" dann hat sie keine konstante 100% Auslastung, fährt deutliche höhere Takte 2600+ Mhz, leistet mehr FPS, zieht mehr Watt.
Ergänzung ()

Okay kann eigentlich zu, ich kann den Fehler reproduzieren. Es hat irgendetwas mit dem AMD Treiber bzw. den Schnittstellen zum OCen in Linux zu tun.
 
Zuletzt bearbeitet:
Bei mir sagt LACT auch ständig etwas von Thermalthrottling,
ich glaube es handelt sich um einen Auslesefehler.
Die Lüfter sind flüsterleise, die Temps absolut OK und die Performance passt auch.

Um das PPT auf ein Windowsähliches Level zu hiefen, musst du es manuell erhöhen.
Ich habe 280Watt und -100mV Offset eingestellt.
 
  • Gefällt mir
Reaktionen: Marmormacker
Snakeeater schrieb:
Ich bin auf Linux.
Zeigt der Adrenalin Treiber für Linux nicht die Hotspot/Junktion Temperatur an?
csm_Radeon_Software_BB7_Performance_Metrics_2_96cc7f2fbd.png
 
Snakeeater schrieb:
Okay kann eigentlich zu, ich kann den Fehler reproduzieren. Es hat irgendetwas mit dem AMD Treiber bzw. den Schnittstellen zum OCen in Linux zu tun.
Kannst du das bitte genauer ausführen, bzw. verlinken, damit die Lösung auch hier im Thread steht? Danke!
 
  • Gefällt mir
Reaktionen: Capet
mytosh schrieb:
Bei mir sagt LACT auch ständig etwas von Thermalthrottling,
ich glaube es handelt sich um einen Auslesefehler.
Die Lüfter sind flüsterleise, die Temps absolut OK und die Performance passt auch.

Um das PPT auf ein Windowsähliches Level zu hiefen, musst du es manuell erhöhen.
Ich habe 280Watt und -100mV Offset eingestellt.
Anhang anzeigen 1480206
https://gitlab.freedesktop.org/drm/amd/-/issues/3251

Jo das Problem ist bei mir nur das eben die Performance nicht stimmt. Ich kann das Problem aber "beheben" wenn ich einen beliebigen Wert im LACT ändere und mit apply bestätige. Dann schießen die Werte wieder dahin wo sie sein sollten.
Mein Befürchtung ist aber, dass das dazu führt das die gesetzten Limits im LACT gar nicht mehr beachtet werden. Bspw. hab ich 2600 Mhz als Maximum GPU Clock mit einem Voltage offset von -56mV, aber die Karte taktet nach dem "Trick" deutlich über 2700 Mhz sogar in 2800er Bereiche. Das bereitet mir etwas Sorge, da ich ja eben LACT nutze um meine Karte zu undervolten.

Mir ist auch nicht ganz klar wie ich anhand der geleistete mV checken kann ob mein Offset nun greift oder nicht.

@mytosh
Um das PPT auf ein Windowsähliches Level zu hiefen, musst du es manuell erhöhen.
Ich habe 280Watt und -100mV Offset eingestellt.
Woher hast du diese Info? Und nutzt du in deinem Video auch eine 7900 XT? Mein ursprüngliches Ziel mit LACT war wie gesagt Undervolting.
 
Zuletzt bearbeitet:
Zurück
Oben