Leserartikel AMD RX 6900XT auf Effizienz getrimmt

Eigentlich wollte ich diesen Artikel längst geschrieben haben, aber private Umstände ließen es leider nicht zu. Weitere Projekte mit Igor´s Lab, Prad und Gamestar musste ich auch aufschieben. Vielleicht tröstet es etwas zu wissen, dass ComputerBase nicht als einzige Anlaufstelle zu kurz kam.

Und natürlich ergibt so ein Beitrag am meisten zu Lebzeiten einer Hardware Generation Sinn. Nun sind bei AMD und Nvidia leider schon die neuen 4000er und 7000er Serien auf dem Markt und die 6000er Serie ca. 2 Jahre alt. Doch sind die neusten Karten nicht nur teuer und haben jeweils so ihre Kinderkrankheiten oder sind vergriffen, die 6000er Serie von AMD bietet nach wie vor viel Leistung für´s Geld und ist eigentlich auch erst jetzt zu vernünftigen Preisen verfügbar, so dass das Thema sicher noch relevant ist. Sofern man seine 6000er Karte optimal einstellt läuft die auch sehr effizient, was ebenfalls so wichtig wie nie zu vor ist. Im Fall einer 6900XT bekommt man auch so viel Leistung, dass man praktisch auf nichts verzichten muss und zukunftssicher ist.

Um diese Karten soll es in diesem Artikel gehen, wobei sich hier prinzipell die Geschichte der Artikel zur 6700XT und 6600XT wiederholt.

Wie damals beschrieben arbeite ich mit dem MPT, dem RadeonSoftwareSlimmer und der Leistungskonfiguration des AMD Adrenalin Treibers.

Im MPT lege ich die Minimal- und Maximalspannung der jeweiligen Komponente auf der Grafikkarte fest. Mit dem Treiber stelle ich dann die Taktraten und das Spannungs-Offset, sowie die Lüfterkurve ein. Der RadeonSoftwareSlimmer hilft mir das Ryzen Master SDK und Automatisierungen des Treibers garantiert zu unterbinden.

Während die 6700XT relativ üppig dimensionierten Speicher und Cache hat und mehr vom Speicher-OC als dem OC des Infinity-Caches profitiert, verhält sich die 6900XT ähnlich wie die 6600XT, die von größerem und schnellerem Cache deutlicher profitiert. Insofern habe ich die 6900XT´s die ich bisher einstellen konnte auf einen FCLK-Takt von 2000MHz gebracht und den Speicher auf die jeweils erlaubten 2150MHz gestellt. Die dadurch gesteigerte Bandbreite versorgt den großen Chip besser mit Daten, weshalb bei gleichem Kerntakt in vielen Fällen die Rechenleistung steigt und vorallem die Minimum-FPS besser werden und damit auch der Frameverlauf homogener.

Hauptsächlich holt auch AMD aus dieser Erkenntnis die Mehrleistung einer 6950XT im Gegensatz zu einer 6900XT, die es teilweise auch mit dem hochwertigen Binning in Form des XTXH Chips gibt. Ursprünglich hätte man neben dem Cache auch gerne HBM2 Speicher verbaut, doch aus Kostengründen hatte man das verworfen.

In Benchmarks und Spielen mit RayTracing limitieren öfter die eigentliche Architektur und der Kerntakt, weswegen die Leistungsvorteile des Speicher- und Cache-OC hier nicht ganz so stark durchschlagen. Bemerkenswert bleibt in diesen Fällen aber immer noch der gesunkene Stromverbrauch.

In Summe sorgen die Optimierungen dafür, dass wenn die Karte mit Standarteinstellungen ins PowerLimit laufen würde, sie ihren Takt voll halten kann und so konstant Leistung abgibt, nicht schwankt und dann auch mehr Punkte holt. Noch mehr Leistung wäre dann über echtes Übertakten des Kerns möglich, aber Effizienz ist mir wichtig und das was dann noch an Leistung zu holen ist, steht in keinem Verhältnis zum dafür nötigen Stromverbrauch. Der brächte dann auch wieder höhere Temperaturen und lautere Lüftergeräusche mit sich. 2,4GHz sehe ich also auch bei den großen Karten wie bei der 6700XT als den Sweetspot an.

Diese Angabe beziehe ich auf die konstant erreichte minimale Taktgeschwindigkeit unter voller Auslastung. Boost-Taktraten liegen in der Regel höher. Als Realtakt habt ihr in solchen Situationen übrigens ca. 80MHz weniger Takt als vom Treiber angepeilt. 2480MHz ergeben also einen Realtakt unter Last von etwas über 2400MHz. Man könnte die 2480 respektive 80MHz also als Boost-Spielraum für weniger Last oder als Offset beschreiben.

Sollte die Rechenleistung bei diesem Takt nicht ausreichen, werden auch 2,5 oder 2,6 GHz keinen so großen Unterschied machen, als dass man um den Austausch der Karte herrum käme. Vernünftig, sofern man das sein möchte, ist es also an Speicher und Cache zu gehen, alles zu undervolten und die Taktrate des Kern zu stabilisieren, anstatt sie selbst noch weiter zu erhöhen.


Die folgenden Fotos belegen z.B. schon eine Ersparnis von ca. 50 Watt unter voller Auslastung bei höher Leistung und im Durchschnitt, bei besseren Frametimes ca. 30 Watt Ersparnis. Vorallem senkt das UV auch die Stromspitzen, die über Fotos schwer darstellbar sind. Das hat teilweise drastische Folgen für die Temperaturen und die Lüfterkurve, die nun flacher verlaufen kann und die Karte unauffällig macht. Vorallem das Delta zwischen Gesamttemperatur des Kerns und HotSpot-Temperatur verbessert sich.


Im CyberPunk 2077 Vergleich zwischen Stock und Optimiert seht ihr mit jeweils 87 vs 70°C auf dem HotSpot eine Differenz von 17 Grad. Die Kerntemperatur differiert dabei um 12 Grad zwischen 69 und 57°C. Und das bei weniger Lüfterdrehzahl.
Eine Legende, zum Verständnis für die Messwerte von FPS-Monitor, findet ihr im Anhang des Artikels.
Beachtet bitte auch, dass die Grafikeinstellungen der Spiele nur für die Vergleichbarkeit gewählt wurden.
Tatsächlich spiele ich immer mit einem Mix aus Einstellungen, je nach optischem Vorteil und damit einhergehenden Kosten.
Hier ging es nicht darum, die maximale Leistung der GPU zu demonstrieren, oder RT und Ultra Einstellungen als immer sinnvoll darzustellen :heilig:

6900XT CyberPunk.jpg
6900XT Doom Eternal.jpg

6900XT FarCry 6 mit Framelimiter.jpg

In den 3D-Mark Läufen erkennt man gut, wie konstant der Takt verläuft. Das Leistungsergebnis, obwohl nicht auf die Höchstepunktzahl abgezielt, kann sich auch sehen lassen.

6900XT 2,4GHz Fire Strike.jpg

6900XT 2,4GHz Port Royal.jpg

Dies sind die Einstellungen die ich für die 6900XT verwendet habe. Leser können sie gerne als Orientierung verwenden, 1 zu 1 übertragen lassen sich die Einstellungen in der Regel nicht, da jeder Karte und sogar die einzelnen Chips darauf sich individuell voneinander in ihrer Güte unterscheiden. Einen guten Hinweis wie ihr noch mehr Energie sparen könnt findet ihr auch hier: https://www.computerbase.de/forum/t...fizienz-getrimmt.2123443/page-8#post-27884580


Sappphire 6900XT Nitro+ SE AMD Adrenalin Treiber Konfiguration.jpg.jpg

Generell empfehle ich den GANZEN Thread chronologisch zu lesen. Viele Fragen erübrigen sich dann und ihr könnt noch weiter ins Thema einsteigen :)


Nachtrag: Da mir in The Last of Us Part I die Differenzen zwischen der Standartkonfiguration und meiner Optimierung besonders dramatisch aufgefallen sind, hier noch ein weiterer Vergleich, den ich relativ aufwendig gemacht habe :) Spielversion war die 1.0.4.1 und genutzt wurde der 23.4.3 Treiber.

The Last of Us Part I - 6950XT - Ultra Pre-Set @ WQHD & 30 FPS - Stock vs Optimiert.jpg

The Last of Us Part I - 6950XT - Ultra Pre-Set @ WQHD & 60 FPS - Stock vs Optimiert.jpg

The Last of Us Part I - 6950XT - Ultra Pre-Set @ WQHD & im CPU Limit - Stock vs Optimiert.jpg

Einen ähnlichen Test habe ich mit Cyberpunk 2.0 und der 6950XT gemacht, auch dort sind die Unterschiede im Verbrauch ganz deutlich: https://www.computerbase.de/forum/t...er-als-ihr-denkt.2129358/page-4#post-28642262
 

Anhänge

  • 6900XT CyberPunk.jpg
    6900XT CyberPunk.jpg
    1,3 MB · Aufrufe: 5.876
  • 1672862209203.jpeg
    1672862209203.jpeg
    2,5 MB · Aufrufe: 3.368
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: NMA, Blende Up, Gravlens und 71 andere
Devcom hat den besten Chip weltweit und zusätzlich Kondensatoren auf seinen Vram gelötet.
... sollte man sich nicht z.Vgl. bezgl. Score nehmen

bei den niedrigen Temps kaum Leckströme, daher so effizient

Den Unterschied zu normal guten Chips@higherTemps sieht man auch bei seinem 300W-Run.
Da sinds locker >700points mehr ggü. Erdy.
 

Anhänge

  • Devcom300W.png
    Devcom300W.png
    778,9 KB · Aufrufe: 67
Zuletzt bearbeitet:
machen denn ~70-80mhz beim vram dann 1.000+ Punkte im TimeSpy aus?
 
FT2 nicht vergessen!

für mehr Takt+FT2 brauchts natürlich ein paar W mehr als bei den 6900, die nur eff. 2138MHz laufen

Devcom mit hohem Vramtakt+FT2
DevcomVram+SOC.jpg


Das sind 19,5+21+9,7= ca. 50W. (nach m.E. sparsam für scharfen Vram)

Diesen Verbrauch könntest Du Dir auf der 6950 mal anschauen.

bei derKalli im 6950-Thread siehts so aus, bei moderatem Vramtakt und FT1 für 24/7
SOC+Vram derKalli.png


Wenn Du mit Deinem 24/7-Setting noch ein mue sparsamer als derKalli rauskommst, kannst Du zufrieden sein mit dem UVen von SOC+Vram. (derKalli wird natürlich in seinen Userthreads nicht ganz ans Limit gehen)


btw.
Nach meiner Erfahrung ist man im Timespy GT1 selten am PL, so das der hohe Verbrauch für SOC+Vram nicht stört.
Und in GT2 profitiert man dann optimal vom scharfen Vram.
(wenn man bei sich selbst das 24/7-Setting durch den maxTakt+Voltcap begrenzt)

Wenn mans genauer wissen will, mit HWinfo mitloggen und sich im GenericLogViewer anschauen.
 

Anhänge

  • derKalli@318W.jpg
    derKalli@318W.jpg
    411 KB · Aufrufe: 60
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: NasterX21
Macht es sinn bei der FCLK-Boost Freq hoch zu gehen? Hatte die vorher auf 1400 und habe die nun auf 1300 analog zu den devcom settings
 
FCLK Boost soll nur der max.Takt sein, der benutzt wird um den gespeicherten Framebuffer an den Moni zu schicken.
Es werden evtl. 2 Bilder gleichzeitig im Vram abgelegt= Doublebuffer und nacheinander an den Moni geschickt.
(mit Vsync gäbs sogar Triplebuffer)

das richtige fclk ist jedoch der IF-Cache, wo man mit mehr Takt schneller sein kann, aber auch etwas mehr Strom verbraucht
muss man probieren ob entspr. passend zum GPU-Takt der fclk was bringt
(viiiiel fclk kann instabiler sein, oder mehr SOC-Volt brauchen)

z.Bsp.
falls Dein Moni für YT-4k-HDR-Videos noch mit fclk boost 800MHz klar kommt
könnte man max fclk 1433 bei nem 180W-Setting nehmen, das mit Vram 2250 läuft
und
theoretisch könnte 800+1433 < 2250-12 gleichzeitig ausgelesen werden
oder 700+1550 < 2270-12 (Vramtakt bei nem 200W-Setting)

bei mir sieht das so Ähnlich etwas sparsamer dann so aus: siehe Anhang
(die 6800nonXT ist da etwas special ala Mining eingestellt, ... k.A. ob der SOC tatsächlich PAM3 nutzt,
ohne Gewähr, das andere Monis+Grakas auch so tief mit dem fclkboost gehen können)


Das sind aber nur theoretische Spielereien.
 

Anhänge

  • 0_fclkBoost@625MHz.JPG
    0_fclkBoost@625MHz.JPG
    56,4 KB · Aufrufe: 65
Zuletzt bearbeitet:
20900@210w.jpg

So sieht der ganze spaß jetzt erstmal bei mir aus, einige TS runs durch.
Obs GameStable ist wird dann mal ans nächstes getestet.
 
  • Gefällt mir
Reaktionen: GerryB
Ging bei Dir im Treiberpaneel auch 991mV?
wenn nicht, langsam rantasten 1018mV ... 1012mV ... 1006mV ... 1000mV ... 996mV ... 993mV
(übersetzt= anfangen mit 50mV Offset und vergrößern)
 

Anhänge

  • Offset.jpg
    Offset.jpg
    225,2 KB · Aufrufe: 63
Zuletzt bearbeitet:
sorry, im Treiber sind 978mv :D
 
  • Gefällt mir
Reaktionen: GerryB
Krass!
 
Okay, das kommt überraschend 😅
Bei 200w (PT -10%) bekomme ich allerdings Abbrüche im TS.

Irgendwelche ideen, was ich testen kann. Dachte bisweilen das die Karte eigentlich nicht so gut ist, aber aktuell bin ich mit dem jetzigen Stettings doch positiv gestimmt.
 
mit weniger Watt ist vllt. der max.Takt zu hoch
würde da erstmal 10MHz und dann in 5MHz-Schritten runter gehen
kann ja nicht viel sein, weil 222W mit PL-10 nicht groß anders ist
als vorher Asic 211W
Zusätzlich mal das Offset etwas kleiner setzen, =Volt höher ... statt 978mV nur 980mV ... 981mV.

Das ist übrigens der Grund, warum ich nicht ala DaHell mit hohen Volt und maxTakt operiere, sondern
etwas mehr eingegrenzt arbeiten muss, weil mein Chip sich sonst zu Tode boostet.

in echten Games können die Lastwechsel noch viel heftiger sein als im TS
da kommen dann die Spawas vllt. nicht schnell genug hinterher beim Runter+Hochtakten
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: NasterX21
Im TS war GPU-Takt(effektiv) 2300MHz maximal, sieht man in seinem HWinfo.
Von Daher braucht NasterX21 nicht unbedingt maxTakt 2659MHz ala Devcom einstellen.(x)
(vermutlich mit <2600MHz auch noch 24/7 tauglich, gerade im Bereich 200...240W)

(x) das so ein hoher maxTakt mit dem groooßen Offset ging ist ein sehr gutmütger Chip
= ein Lottogewinn
 
  • Gefällt mir
Reaktionen: Evgasüchtiger
Okay...sehe ich jetzt auch🙈

Warum ist so ein großes Offset eingestellt?
 
sparsamer, = im PL performanter

kann leider nicht jeder Chip soooo gut verkraften
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Evgasüchtiger
20608@200.jpg


Ich verabschiede mich damit mal ins Bett. TS und TSE sind paar mal durchgelaufen. D4 konnte ich jetzt auch ne weile zocken. Testen muss ich wohl mal noch was "anspruchsvolleres" ^^

Aber denke das Ergebnis kann sich doch erstmal sehen lassen, oder?
 
  • Gefällt mir
Reaktionen: GerryB
Supi!

Nicht nur ein heavy Game testen, vllt. auch mal leichte Kost wie SoTR.
TS sagt einem ja nur was bei Volldampf stabil ist.
 
tja, ich verzweifle gerade ein wenig.. die Settings aus #356 laufen im TS durch.
Möchte ich die Taktrate etwas weiter senken um weiter zu testen wie sich das auswirkt.. Crasht TS..!?
 
Da kannst Du nur die Volt im Treiber etwas nachregeln.
978-->981mV oder gar 984mV

dann maxTakt
2632--> 2617 ... 2612 ... 2607 ... 2602 ... 2597


btw.
So wie ich das im Luxx sehe, muss auch Devcom für jede größere Watt-Stufe die Volt + maxTakt neu austesten.
Da geht nicht pauschal immer das selbe Offset, wenn man es denn möglichst exakt/sparsam haben will.

Wenn man ein passendes MPT-Setting für den Bereich 200W bis 255W hat ist das ja schon anspruchsvoll genug.
das sind schon deutliche Unterschiede beim eff.GPUtakt und den zug. eff.Volt
(222W mit PL-10 bis PL+15)
 
Zuletzt bearbeitet:
Zurück
Oben