Leserartikel AMD RX 6900XT auf Effizienz getrimmt

Eigentlich wollte ich diesen Artikel längst geschrieben haben, aber private Umstände ließen es leider nicht zu. Weitere Projekte mit Igor´s Lab, Prad und Gamestar musste ich auch aufschieben. Vielleicht tröstet es etwas zu wissen, dass ComputerBase nicht als einzige Anlaufstelle zu kurz kam.

Und natürlich ergibt so ein Beitrag am meisten zu Lebzeiten einer Hardware Generation Sinn. Nun sind bei AMD und Nvidia leider schon die neuen 4000er und 7000er Serien auf dem Markt und die 6000er Serie ca. 2 Jahre alt. Doch sind die neusten Karten nicht nur teuer und haben jeweils so ihre Kinderkrankheiten oder sind vergriffen, die 6000er Serie von AMD bietet nach wie vor viel Leistung für´s Geld und ist eigentlich auch erst jetzt zu vernünftigen Preisen verfügbar, so dass das Thema sicher noch relevant ist. Sofern man seine 6000er Karte optimal einstellt läuft die auch sehr effizient, was ebenfalls so wichtig wie nie zu vor ist. Im Fall einer 6900XT bekommt man auch so viel Leistung, dass man praktisch auf nichts verzichten muss und zukunftssicher ist.

Um diese Karten soll es in diesem Artikel gehen, wobei sich hier prinzipell die Geschichte der Artikel zur 6700XT und 6600XT wiederholt.

Wie damals beschrieben arbeite ich mit dem MPT, dem RadeonSoftwareSlimmer und der Leistungskonfiguration des AMD Adrenalin Treibers.

Im MPT lege ich die Minimal- und Maximalspannung der jeweiligen Komponente auf der Grafikkarte fest. Mit dem Treiber stelle ich dann die Taktraten und das Spannungs-Offset, sowie die Lüfterkurve ein. Der RadeonSoftwareSlimmer hilft mir das Ryzen Master SDK und Automatisierungen des Treibers garantiert zu unterbinden.

Während die 6700XT relativ üppig dimensionierten Speicher und Cache hat und mehr vom Speicher-OC als dem OC des Infinity-Caches profitiert, verhält sich die 6900XT ähnlich wie die 6600XT, die von größerem und schnellerem Cache deutlicher profitiert. Insofern habe ich die 6900XT´s die ich bisher einstellen konnte auf einen FCLK-Takt von 2000MHz gebracht und den Speicher auf die jeweils erlaubten 2150MHz gestellt. Die dadurch gesteigerte Bandbreite versorgt den großen Chip besser mit Daten, weshalb bei gleichem Kerntakt in vielen Fällen die Rechenleistung steigt und vorallem die Minimum-FPS besser werden und damit auch der Frameverlauf homogener.

Hauptsächlich holt auch AMD aus dieser Erkenntnis die Mehrleistung einer 6950XT im Gegensatz zu einer 6900XT, die es teilweise auch mit dem hochwertigen Binning in Form des XTXH Chips gibt. Ursprünglich hätte man neben dem Cache auch gerne HBM2 Speicher verbaut, doch aus Kostengründen hatte man das verworfen.

In Benchmarks und Spielen mit RayTracing limitieren öfter die eigentliche Architektur und der Kerntakt, weswegen die Leistungsvorteile des Speicher- und Cache-OC hier nicht ganz so stark durchschlagen. Bemerkenswert bleibt in diesen Fällen aber immer noch der gesunkene Stromverbrauch.

In Summe sorgen die Optimierungen dafür, dass wenn die Karte mit Standarteinstellungen ins PowerLimit laufen würde, sie ihren Takt voll halten kann und so konstant Leistung abgibt, nicht schwankt und dann auch mehr Punkte holt. Noch mehr Leistung wäre dann über echtes Übertakten des Kerns möglich, aber Effizienz ist mir wichtig und das was dann noch an Leistung zu holen ist, steht in keinem Verhältnis zum dafür nötigen Stromverbrauch. Der brächte dann auch wieder höhere Temperaturen und lautere Lüftergeräusche mit sich. 2,4GHz sehe ich also auch bei den großen Karten wie bei der 6700XT als den Sweetspot an.

Diese Angabe beziehe ich auf die konstant erreichte minimale Taktgeschwindigkeit unter voller Auslastung. Boost-Taktraten liegen in der Regel höher. Als Realtakt habt ihr in solchen Situationen übrigens ca. 80MHz weniger Takt als vom Treiber angepeilt. 2480MHz ergeben also einen Realtakt unter Last von etwas über 2400MHz. Man könnte die 2480 respektive 80MHz also als Boost-Spielraum für weniger Last oder als Offset beschreiben.

Sollte die Rechenleistung bei diesem Takt nicht ausreichen, werden auch 2,5 oder 2,6 GHz keinen so großen Unterschied machen, als dass man um den Austausch der Karte herrum käme. Vernünftig, sofern man das sein möchte, ist es also an Speicher und Cache zu gehen, alles zu undervolten und die Taktrate des Kern zu stabilisieren, anstatt sie selbst noch weiter zu erhöhen.


Die folgenden Fotos belegen z.B. schon eine Ersparnis von ca. 50 Watt unter voller Auslastung bei höher Leistung und im Durchschnitt, bei besseren Frametimes ca. 30 Watt Ersparnis. Vorallem senkt das UV auch die Stromspitzen, die über Fotos schwer darstellbar sind. Das hat teilweise drastische Folgen für die Temperaturen und die Lüfterkurve, die nun flacher verlaufen kann und die Karte unauffällig macht. Vorallem das Delta zwischen Gesamttemperatur des Kerns und HotSpot-Temperatur verbessert sich.


Im CyberPunk 2077 Vergleich zwischen Stock und Optimiert seht ihr mit jeweils 87 vs 70°C auf dem HotSpot eine Differenz von 17 Grad. Die Kerntemperatur differiert dabei um 12 Grad zwischen 69 und 57°C. Und das bei weniger Lüfterdrehzahl.
Eine Legende, zum Verständnis für die Messwerte von FPS-Monitor, findet ihr im Anhang des Artikels.
Beachtet bitte auch, dass die Grafikeinstellungen der Spiele nur für die Vergleichbarkeit gewählt wurden.
Tatsächlich spiele ich immer mit einem Mix aus Einstellungen, je nach optischem Vorteil und damit einhergehenden Kosten.
Hier ging es nicht darum, die maximale Leistung der GPU zu demonstrieren, oder RT und Ultra Einstellungen als immer sinnvoll darzustellen :heilig:

6900XT CyberPunk.jpg
6900XT Doom Eternal.jpg

6900XT FarCry 6 mit Framelimiter.jpg

In den 3D-Mark Läufen erkennt man gut, wie konstant der Takt verläuft. Das Leistungsergebnis, obwohl nicht auf die Höchstepunktzahl abgezielt, kann sich auch sehen lassen.

6900XT 2,4GHz Fire Strike.jpg

6900XT 2,4GHz Port Royal.jpg

Dies sind die Einstellungen die ich für die 6900XT verwendet habe. Leser können sie gerne als Orientierung verwenden, 1 zu 1 übertragen lassen sich die Einstellungen in der Regel nicht, da jeder Karte und sogar die einzelnen Chips darauf sich individuell voneinander in ihrer Güte unterscheiden. Einen guten Hinweis wie ihr noch mehr Energie sparen könnt findet ihr auch hier: https://www.computerbase.de/forum/t...fizienz-getrimmt.2123443/page-8#post-27884580


Sappphire 6900XT Nitro+ SE AMD Adrenalin Treiber Konfiguration.jpg.jpg

Generell empfehle ich den GANZEN Thread chronologisch zu lesen. Viele Fragen erübrigen sich dann und ihr könnt noch weiter ins Thema einsteigen :)


Nachtrag: Da mir in The Last of Us Part I die Differenzen zwischen der Standartkonfiguration und meiner Optimierung besonders dramatisch aufgefallen sind, hier noch ein weiterer Vergleich, den ich relativ aufwendig gemacht habe :) Spielversion war die 1.0.4.1 und genutzt wurde der 23.4.3 Treiber.

The Last of Us Part I - 6950XT - Ultra Pre-Set @ WQHD & 30 FPS - Stock vs Optimiert.jpg

The Last of Us Part I - 6950XT - Ultra Pre-Set @ WQHD & 60 FPS - Stock vs Optimiert.jpg

The Last of Us Part I - 6950XT - Ultra Pre-Set @ WQHD & im CPU Limit - Stock vs Optimiert.jpg

Einen ähnlichen Test habe ich mit Cyberpunk 2.0 und der 6950XT gemacht, auch dort sind die Unterschiede im Verbrauch ganz deutlich: https://www.computerbase.de/forum/t...er-als-ihr-denkt.2129358/page-4#post-28642262
 

Anhänge

  • 6900XT CyberPunk.jpg
    6900XT CyberPunk.jpg
    1,3 MB · Aufrufe: 5.876
  • 1672862209203.jpeg
    1672862209203.jpeg
    2,5 MB · Aufrufe: 3.369
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: NMA, Blende Up, Gravlens und 71 andere
Quasi so:
Screenshot 2023-02-12 172337.jpg
 
Ja und ggf. den min. Wert von 550 auch auf 500 runter, sollte die Minimalspannung die ich empfohlen habe nicht stabil laufen.
 
DannyA4 schrieb:
Das war jetzt doch nicht schwierig? :)

Dein Setting: Min GFX 825, Wattmann 1000, Max GFX 1000
Vorschlag: Min [775], Wattman [975], Max [1050], in eckige Klammern eigene Werte einsetzen.

Unterschied: Wattman-Spannung liegt dann zwischen MPT Min und Max.
Effekt: rausfinden, ob's einen gibt.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: DannyA4
der-Kalli schrieb:
FCLK hast du auch auf 2000 erhöht?
Da geht bei meiner Karte gar nichts, auf 2000Mhz gestellt..Abbruch des Benchmarks.
Wollte dann erstmal klein beginnen...also auf 1950Mhz gestellt..Abbruch des Benchmarks!
Erst bei Originalen 1940Mhz lief der Bench wieder durch.
 
Du hast ja auch schon SoC untervoltet!!
Wie von mir beschrieben wirkt sich das auf die Stabilität des FCLK Takts aus.
 
Ok, erstmal bedanke ich mich recht herzlich für eure Hilfe und Geduld mit mir! :-)

Weiter konnte ich nicht runter, bei 985mV bricht der Benchmark ab.
Screenshot 2023-02-12 181132.jpg

der-Kalli schrieb:
Du hast ja auch schon SoC untervoltet!!
Wie von mir beschrieben wirkt sich das auf die Stabilität des FCLK Takts aus.
Heißt das im Umkehrschluss, dass wenn ich den SOC nicht untervolte, ich den FCLK auf bis zu 2000Mhz bekommen würde?
Was wäre effektiver, UV, wie in meinem Fall oder SOC so lassen und FCLK auf 2000Mhz?
 
DannyA4 schrieb:
Was wäre effektiver, UV, wie in meinem Fall oder SOC so lassen und FCLK auf 2000Mhz?
Ist doch schnell getestet!

Grundsätzlich: 60 MHz Fclk sind ingame nicht spür- und in Time Spy gerade so messbar. 10 MHz (1950) weder das eine noch das andere.
 
Ok, dann lasse ich es so. Danke dir!
 
Wieso "wenn ich nicht untervolte"? Klar geht beides, da muss man sich nicht für das Eine und gegen das Andere entscheiden. Aber es läuft vielleicht nicht bei 1000mv.

OC ist übrigens ein relativer Begriff. Die 6950XT kommt mit 2050MHz auf dem Cache ab Werk. Dafür braucht sie auch mehr Spannung, bzw. bei gleichem Takt genauso viel.

Es spricht nichts dagegen 2000MHz laufen zu lassen. Es sei denn, du kannst gar kein Undervolting mehr damit machen oder es läuft gar nicht stabil.

Mit meiner 6700XT lief es, aber es war ineffizient. Außerdem war die Sättigung des Kerns durch Daten aus Cache und Speicher ausreichend. Bin bei der sogar auf 1800MHz runter gegangen. Die 6600XT hat traurige Proportionen und die 6900XT profitiert ebenfalls gut von mehr Cache- und Speichertakt.

Aber auch nicht unendlich. Auflösung und Anwendung spielen ebenfalls eine Rolle.

2000MHz bei 1050 oder 1025mv wären mein Tip. Ansonsten halt mehr.

Wenn 1940mv schon mit 1000mv liefen, dann werden es kaum 1150mv sein die tatsächlich benötigt werden. Auch nicht für 60MHz mehr Takt.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: DannyA4
der-Kalli schrieb:
OC ist übrigens ein relativer Begriff. Die 6950XT kommt mit 2050MHz auf dem Cache ab Werk. Dafür braucht sie auch mehr Spannung, bzw. bei gleichem Takt genauso viel.
Naja, OC ist schon absolut und nicht relativ. Der deutlichste hardwareseitige Unterschied zwischen 6900 XT Ref und 6950 XT ist der Speicher, in dieser Hinsicht sind das verschiedene Kartenmodelle. Wenn wir Soc und Fclk dem Bereich Speicher zuordnen, ist alles über 1940 MHz bei der Ref Overclocking.

Das heißt nicht, dass ich ein Gegner davon wäre, im Gegenteil. Ich lese "3 x 1440p" und "ACC", rechne die zu bespielende Pixelanzahl hoch und denke, uff, mit wie wenig Fps (ersatzweise wie niedrigen Grafiksettings) wird dieses anspruchsvolle Rennspiel denn gezockt?

Einer Karte, die wie @DannyA4s Exemplar offenbar Potenzial hat und die in einem Custom Loop hängt, würde ich die Sporen geben, um mehr Fps rauszuholen. Allerdings der GPU, denn dort spielt die Musik. Lauter als beim Fclk.
 
Zuletzt bearbeitet:
Shir Khan schrieb:
Einer Karte, die wie @DannyA4s Exemplar offenbar Potenzial hat und die in einem Custom Loop hängt, würde ich die Sporen geben, um mehr Fps rauszuholen. Allerdings der GPU, denn dort spielt die Musik.

Auch dazu kommen wir noch, denn ich habe hier noch eine HP Reverb G2 rumliegen, die ich auch mal wieder aufsetzen möchte.
Dazu hätte ich dann gern ein Treiberprofil, welches so ziemlich alles aus meiner Grafikkarte rausholt, denn VR braucht alles was geht an Leistung.
Ich fürchte aber, dass das hier im Thread nicht so gut passt, denn hier geht es wohl ausschließlich um Effizienz.

ACC geht mit drei Monitoren übrigens ganz gut, ich liege da so zwischen 80 und 90FPS bei hohen bis sehr hohen Grafikeinstellungen.
PXL_20230212_190758983.jpg
PXL_20230212_190815418.jpg
 
  • Gefällt mir
Reaktionen: Shir Khan
Habe jetzt nochmal etwas anderes probiert.
Im MPT auf 1025mV gegangen und im Treiber den Offset reduziert.
Screenshot 2023-02-12 211142.jpg
Kann es sein, dass dort auf einmal so viel geht?
Weiter runter als 920mV komme ich nicht, bei 910mV bricht der Benchmark ab.

Vorher, bei 1000mV MPT bin ich im Treiber gerade so auf 990mV Offset gekommen.

Finde das irgendwie seltsam.
 
Es ist tatsächlich ein prozentualer Wert, der sich auf den Bereich zwischen der minimalen und maximalen Spannung bezieht. Die Zahl, auch wenn mv dran steht, bedeutet nicht das was sie zu sein scheint. Je niedriger die maximale Spannung, desto weniger Offset bleibt noch möglich.

Lies doch bitte was ich / wir hier schon mehrfach erklärt haben.

Wir können dir nichts erzählen was hier nicht schon steht.
 
  • Gefällt mir
Reaktionen: hanjef
Oh, das tut mir dann Leid, muss ich übersehen haben.
...oder gelesen und nicht verstanden.^^
 
Ich habe hier einen starken Vergleich zu den Treiber Profilen die ich ansprach. In einigen Fällen besteht kaum ein Unterschied, aber in Doom Eternal lässt sich z.B. der Worstcase abbilden. Und zwar für die automatische Takt- und Spannungsverwaltung.

Die führt nämlich zu höheren Taktraten, Spannungen und Energieverlust als eigentlich nötig wäre. Der einzige Vorteil kann es sein, dass im dynamischen Geschehen eines Spiels so Leistungsreserven vorgehalten werden, damit die nächste, evtl. stressigere Szene nicht bei den FPS absackt.

Ansonsten ist es immer deutlich sparsamer selbst den Takt zu limitieren. In meinem Beispiel bringt das ganze 70 Watt Differenz, bei gleicher Leistung und obwohl hier schon die auf Effizienz optimierten SPPT´s genutzt wurden. Nur die maximal erlaubte Taktrate wurde im Treiberprofil geändert. Der Framelimiter stand auf 90 FPS, alle Grafikeinstellungen und die Szene waren identisch.

Vergleich meines Energiesparprofils gegenüber automatischer Verwaltung.jpg


Ich würde also jedes Spiel an stressigen Stellen testen und meistens dann im Energiesparprofil spielen. Erst wenn die Leistung nicht reicht, würde ich das normale Profil laden. Bzw. kann man sich mit etwas Mühe weitere Profile zwischen 1,6 und 2,4 GHz anlegen.

Mit 1,6GHz und meinen Spannungen kommt meine XFX 6950XT MERC319 auf 120 Watt maximal. Und sie leistet dabei mehr, als kleinere Karten.

Einen Effizienzvergleich zwischen Navi 22 und Navi 21 habe ich vor ein paar Monaten schon vorbereitet und bringe den demnächst auch mal hier.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: schilra, Pjack und (gelöschtes Mitglied)
DannyA4 schrieb:
Kann es sein, dass dort auf einmal so viel geht?
Ja. Das liegt daran, dass du Min GFX im MPT reduziert hast. Deshalb habe ich dir empfohlen, das auszuprobieren.

DannyA4 schrieb:
Finde das irgendwie seltsam.
Ist es nicht. Karten mit guten UV-Fähigkeiten reagieren auf niedrige Min GFX mit niedriger möglicher Treiberspannung.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: DannyA4
DannyA4 schrieb:
Weiter runter als 920mV komme ich nicht,
Da wärs denn auch interessant mitzuloggen wieviel Spannung wirklich anliegt.
Bei Wunschtakt von ~2450-2500Mhz z.B. kann ich auch noch 925mV Einstellen(1000mV MPT +75mV Offset), laut hwinfo wird aber nicht unter 950-60mV angelegt bei Volldampf. Irgendwie ne Brandmauer bei mir..
 
Sehr interessanter Hinweis!
Screenshot 2023-02-13 171027.jpg
Screenshot 2023-02-13 171226.jpg
MPT 1025mV
 
  • Gefällt mir
Reaktionen: Ardan Redburn
1025mv Cap mit 950mv im Offset, das läuft niemals stabil.

Teste 1,8 und 2,2GHz mit deinen Einstellungen.

Ich sehe da eher 1000 oder 975 beim Offset.
 
Klar ist 1025/950 sehr anspruchsvoll und vielleicht hält es dem Alltag nicht stand. Ich wundere mich trotzdem jedes Mal, mit welcher Gewissheit du bei Karten anderer User in fremden Hardware-Umgebungen feststellst, was stabil laufen muss bzw. nicht stabil laufen kann wie hier. :) Ich könnte das nicht.

Heute sind die letzten Korrekturen zum in Kürze erscheinenden zweiten Teil des PCGH-Effizienz-Guides Radeon 6000 erfolgt, deshalb habe ich das gerade vor mir. Die niedrigsten Beispielsettings bei 2500 und 2525 MHz sind - und das ist wirklich reiner Zufall - genau die von @DannyA4. Meine Karte, stabil in Time Spy, nicht 24/7-getestet.

Exklusiv-Spoiler, nur hier: ;)

Screenshot 2023-02-13 180843.png
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: hanjef und DannyA4
Zurück
Oben