Ryzen 9 3950X Overclocking

Also in Krautmaster seinen Test hat der 3900X 6:33min laut seiner Liste, ich hab beim 9900k 6:38min.

Ich denke auch das einerseits die Kerne nicht sauber genutzt werden, in den anderen Fällen scheint die Latenz zu fehlen, vielleicht Bandbreite in manchen Fällen auch.
Ich sag mal 24 Kerne HT und nur 51% schneller als 8HT das ist etwas Mau, wenn ich laut 3D Center bei X265 Multi vergleiche.

Extremes Beispiel ist der Schach Benchmark http://www.jens-hartmann.at/Fritzmarks/, da tut sich der AMD sehr schwer.

Mich hat es in dem Fall gewundert, da ich eigtl. dachte das ist eine der Stärken des AMD.
Ansich ist es aber auch egal, die Rechenintensive Szenarien unterstützen oft Cuda Schnittstelle.
 
Zuletzt bearbeitet:
Eine ältere Version der FFMPEG.exe war bei mir 40 Sekunden schneller:

https://www.computerbase.de/forum/threads/ryzen-9-3950x-overclocking.1916750/post-23570718

Wie und ob man hier Schlussforderungen schließen kann kommt ja drauf an wie representativ dieser Benchmark ist und ob man z.B. zwei oder mehrere Instanzen auf einmal nutzen kann, um parallel Dateien zu encodieren oder nicht.

Aber allein schon der Unterschied zwischen den beiden FFMPEG.exe compiles zeigt ja das da softwaretechnisch noch was möglich sein sollte, da 40 Sekunden weniger bei gleicher Hardware schon eine Menge ausmacht. Da ist wahrscheinlich noch mehr möglich mit besserer Ryzenunterstützung, aber ich bin da jetzt auch nicht der Profi. Hätte halt wenigstens mehr CPU Auslastung erwartet.

E: Ich hab mal zum Spaß den Fritzmark ausprobiert. Der findet aber nur maximal 16 Threads (anstatt der erwarteten 24). Genauso wie beim Ryzen 3950X in der Tabelle. Ist also kein Wunder, warum AMD hier nicht so gut abschneidet wenn das Limit bei 16 Threads liegt. Da macht der höhere Takt wie z.B. beim 9900K dann mehr aus.
 
Zuletzt bearbeitet:
Du bei Fritzmark komm ich auf knapp über 80 mit 9900k, keine Ahnung was da los ist, der 3900X hat da irgendwas mit 65, der liegt noch unter 16Kerne.
Ich denke viel liegt auch an der Software, bei AMD bringt auf jeden Fall ne super Latenz was, so 62-63ns, aber das schaffst du so bis 32GB und passenden Speicher, z.B. mein selektierten Patriot 4400CL19, auch schlechtere Kits sind noch Top.
Bei 64GB wird das schon problematischer.
 
PhoenixMDA schrieb:
[3900X] liegt noch unter 16Kerne

16 Threads. 8 der 24 Threads machen einfach gar nix.

Das heißt ein 9900k hat genauso viele Threads wie ein 3950X oder 3990X was das Programm angeht.
 
ich baue gerade mit folgenden Options:
https://www.phoronix.com/scan.php?page=article&item=amd-3900x-gcc10&num=1

CFLAGS/CXXFLAGS and then again when targeting the Zen 2 optimizations with "-O3 -march=znver2"

mal schauen ob ichs hinbekomm. Erst mach ich noch eine ohne Cflags also eine "neutrale" ffmpeg. Top aktuell vom aktuellen Master Branch. Ich mach auch nen neuen Thread auf dafür.

Dann kann man mal vergleichen ob die Optimierungen was bringen. Ist euch ein 8K Video File lieber? Ggf macht das erst die CPU richtig platt... is nur iwi nicht so ganz praxisnah. 4K HDR lastet zumindest meine 36C schon ganz anständig aus.

Edit. Muss erst 18.04 auf 19.10 updaten und kompletten Clean machen ;) morgen dann soweit
 
Zuletzt bearbeitet:
4K sollte doch reichen oder?

8k würde doch nur heißen, dass es doch nur vier mal so lange dauert es zu verarbeiten, aber nicht vier mal soviel Auslastung. Oder sehe ich das falsch?

E: 8k wäre vielleicht einen Test wert falls 4k die Ryzens wieder nicht auslastet. Aber das sieht man dann.
 
2700X / UV-0.075v / PBO off

encoded 1497 frames in 616.36s (2.43 fps),
20051.42 kb/s, Avg QP:22.89
Time elapsed: 0:10:16,96

1578504420555.png
 
  • Gefällt mir
Reaktionen: Krautmaster
Das kann ich locker unterbieten:
3400G/2x16GBCL16@3000Mhz

encoded 1497 frames in 1166.33s (1.28 fps)
Time elapsed: 0:19:26,97

bench2.PNG

bench1.PNG
 
  • Gefällt mir
Reaktionen: Krautmaster
Das mit dem Auslasten ist so ne Sache. Wie schaut die Auslastung bei euch aus... Ggf ist zugleich 1 Thread am Anschlag und die anderen 31 Threads sind nur zu 80 belastet? Bei mir ist sie zeitweise bei 100%, bricht aber zeitweise kurz ein, dann auch auf unter 50%, im Mittel ist sie bei 4k aber bei um 80-95%, als Integral gesehen ^^

Müsste mal den Takt reduzieren und schauen ob's nen anderer Flaschenhals ist.
 
Krautmaster schrieb:
im Mittel ist sie bei 4k aber bei um 80-95%, als Integral gesehen

Im Mittel liegt der Average Effective Clock bei mir bei 2.8 GHz mit der älteren FFMPEG.exe (2.2 GHz mit der neuesten).

Im Vergleich mit dem Worst Case bekomme ich einen Average Effective Clock von 3.8 GHz bei P95 Small FFT (mit AVX Load). Da liegt die CPU auch konstant am 100% TDC Limit und 80%-82% PPT/EDC Limit. Das heißt die CPU kann/darf nicht höher takten ohne PBO.

Und wie gesagt, das ist der Worst Case. "Normale" Programm sollten die CPU niemals so stark auslasten können, sodass der Takt nie so gering ist. Bei CB20 zum Beispiel ginge der Takt nochmal auf 4100 -4150 MHz.

Aber nun gut, gehen wir mal von dem unrealistischen Szenario aus das Video Encoding genauso ein Power Virus wie Prime 95 ist (was es ja nicht ist in der Praxis), da kommen wir auf ein Verhältnis von:

2.8 : 3.8 = ~74% Auslastung

PS: Welchen Takt bekommst du mit Prime 95? Das Verhältnis von dem Takt während des Encodes und dem Prime95 Takt wäre hier sehr interessant zum Vergleich. (Natürlich AVX offset beachten, falls es einen gibt sonst bringt der Vergleich wenig.)
 
in Prime bekomme ich denselben Takt außer ich mache AVX 512, wobei in FFMPEG und Prime bei AVX2 der gleiche Takt anliegen. Also 24/7 habe ich ein Offset von -3, bei Multi 44 für alle 18C (für normale AVC Last).

Ich teste gerade den neusten FFMPEG Build mit diversen X265 presets. Wenn ich mit "SLOW" teste dann sinkt meine Auslastung auf CPU Seite auch gegen 70-85%, Medium sieht besser aus (95%) und richtig an den 100% klebt er mit FAST (lastet bei mir am besten aus).

Zudem braucht es sicher auch ein etwas längeres TestFile mit mehr Frames. Manche Benches nutzen da ja nur so Mini Files mit 250 Bildern was dann keine 10s Video entspricht... wer weiß wie FFMPEG da vorgeht, zumal der ja die darauffolgenden Frames analysieren muss und im Prinzip bei längeren Videos sogar Abschnitte intern parallelisieren kann.
Ergänzung ()

wenn du Lust hast mal laufen zu lassen

https://1drv.ms/u/s!Ar_eIBtD4lGqhfpBtA5UbFVFu-1TqA?e=DSjlxI

Ist eine aktuelle FFMPEG von heute morgen (gebaut auf Ubuntu 19.10), ohne Skylake oÄ Optimierungen. Laut GIT optimiert der Encoder ohnehin je nach Architektur und Zen2 Optimierungen dürften durch den aktuellen Build gegeben sein. Wobei beide Architekturen seit Zen 2 eh recht ähnlich sind.
1578557422190.png


edit. Hab grad die FFMPEG.exe noch durch die 10Bit ersetzt, hatte mich schon gewundert wieso das restult kein HDR is.

Edit hat noch nen Prob wen Leerzeichen im Pfad, fix ich noch eben.
Done
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Tonks
SLOW hat die CPU diesmal gut ausgelastet. Nicht 100%, aber viel näher an den Limits als irgendeine FFMPEG-Version davor.

FAST war auch nicht schlecht, mehr als MEDIUM und VERY FAST.

---------------------------------- PRESET VERYFAST X265 ----------------------------------------
converting ...
duration=86.109000
size=131995122
bit_rate=12263073
Time elapsed: 0:04:08,48

---------------------------------- PRESET FAST X265 ----------------------------------------
converting ...
duration=86.109000
size=132779825
bit_rate=12335976
Time elapsed: 0:04:38,77

---------------------------------- PRESET MEDIUM X265 ----------------------------------------
converting ...
duration=86.109000
size=130958658
bit_rate=12166780
Time elapsed: 0:07:01,02

---------------------------------- PRESET SLOW X265 ----------------------------------------
converting ...
duration=86.109000
size=160548548
bit_rate=14915843
Time elapsed: 0:15:07,59

EDIT: Die Spalte ganz rechts sind die Average-Werte. Hab da wohl zu viel ausgeschnitten.
 

Anhänge

  • HWiNFO_FAST.png
    HWiNFO_FAST.png
    77,2 KB · Aufrufe: 346
  • HWiNFO_SLOW.png
    HWiNFO_SLOW.png
    78,3 KB · Aufrufe: 351
  • Gefällt mir
Reaktionen: Krautmaster
dieses mal kommen auch keine Fehler beim FFMPEG oder? Also Display warning usw...

Ah ich sehe deine CPU Taktet gerade deutlich niedriger, dachte schon woher kommen die Unterschiede...

Ich war auch mal so frei das HW Info etwas umkonfigurieren. Krass ist echt wie gut meine über Durchfluss und Temp Delta errechneten Verbrauchswerte vom Aquaero stimmen ^^


---------------------------------- PRESET VERYFAST X265 --------------------------------------
converting ...
duration=86.109000
size=131995122
bit_rate=12263073
Time elapsed: 0:02:49,10
1578572595831.png

---------------------------------- PRESET FAST X265 ----------------------------------------
converting ...
duration=86.109000
size=132779825
bit_rate=12335976
Time elapsed: 0:03:16,63
1578572827531.png

---------------------------------- PRESET MEDIUM X265 ----------------------------------------
converting ...
duration=86.109000
size=130958658
bit_rate=12166780
Time elapsed: 0:04:48,87
1578573111049.png

---------------------------------- PRESET SLOW X265 ----------------------------------------
converting ...
duration=86.109000
size=160548548
bit_rate=14915843
Time elapsed: 0:11:29,11
1578573594064.png


Was 100 Mhz ausmachen sieht man hier. Da is der All Core Multi auf 41 statt 40 und da die Spannung dynamisch ist ist sie damit auch höher. Direkt 100°C Package und einige W mehr (max, hab hier etwas zu spät abgebrochen)

SLOW @ 4.1 Ghz
1578572178555.png


Krass wie gut das Aquaero ermittelt welche Wärme / Leistung übers Wasser abgeführt wird.
Siehe Package Power, Mainboard Sensoren und Aquaero das CPU + Spawas + GPU kühlt.
 
Zuletzt bearbeitet:
Keine Fehler gehabt.

Was ist denn dein Average Effective Clock bei FAST und SLOW?

Und ja, Takt ist immer noch unter dem normalen All Core Boost, den ich von anderen Programmen her kenne und auch noch nicht an dem minimalen Prime95 Boost dran.

Wäre die Auslastung zeitlich gesehen länger an den Power Limits, wäre wahrscheinlich noch mehr drin gewesen. Aber im Unterschied zu Prime95, wo die Auslastung sehr konstant ist, fluktuiert es noch zu sehr mit FFMPEG.

Wäre mal gespannt über Werte mit PBO, aber bin mir nicht sicher ob sich da was tun würde, da die Limits eh nicht bis zum Anschlag ausgenutzt werden.
 
finde den Reiter nicht bei mir im HW Info, also hab ich mal einen Kern ausgegriffen - über den Zeitraum von mehreren Min stellt der ziemlich genau auch den CPU Average dar.

Bei FAST also 4086 Mhz im Mittel, was hinkommt da ich 4000 Mhz bei All Core Last hab aber weniger Threads höher takten dürfen. SLOW ist die Durchschnittliche Auslastung etwas höher, das ist der Average Clock wie man im Screen sieht 4065 Mhz.
 
  • Gefällt mir
Reaktionen: Tonks
Knapp 700 MHz mehr Takt und mehr Threads erklärt dann jedenfalls den Unterschied. :daumen:
 
ja absolut. Ich glaube dass sich SLX und Zen 2 wirklich nicht viel geben was IPC angeht, Cinebench liegt dem Ryzen etwas besser, in AVX mit FFMPEG es ziemlich ausgeglichen, ein 16C Ryzen 3950X etwa so fix wie ein 18C SLX bei ähnlichem Takt. Der Ryzen ist dabei natürlich viel effizienter, wobei ein Intel auch nicht mehr auf der höhe der Zeit ist, bei 4 Ghz sind die aktuellen sparsamer aber keiner kauft sich Cascade Lake X, wieso sollte jemand auch... ^^
 
Zurück
Oben