News Smart Access Memory: Ryzen 3000 und Vorgängern fehlt es an Hardware-Support

Bei nem schnellen Shooter stellt man eh RT off, um jedes Fps zu gewinnen.
Da interessieren nur noch Frametimes.
 

Anhänge

  • ColdWar-SAMoff.png
    ColdWar-SAMoff.png
    27 KB · Aufrufe: 335
Na so ein Pech aber auch. Dann muss bedauerlicherweise ja jeder eine neue CPU für 30% über UVP kaufen.
 
Man wechselt/kauft eigentlich weder ne Graka noch ne CPU wenn der Leistungszuwachs net adäquat ist.
SAM wird net überall helfen. Da würde ich auf jeden Fall vorher recherchieren.

Gerade bei Dir müsste Es dann schon ein einzelnes Game sein, Welches überdurchschnittlich bei den minFps profitiert: und auf das passende Bios fürs Board musste auch noch warten, falls net AsRock-B450 wie Cracky
 

Anhänge

  • HOT-RDR2.jpg
    HOT-RDR2.jpg
    82,4 KB · Aufrufe: 310
Zuletzt bearbeitet:
RDRD2 ist auf bei meiner 1080Ti eines der Spiel wo man mehr das die GPU von 2017 ist.

Da merkste das es langsam zeit wird für was neues
 
Berserkervmax schrieb:
Bei NV wird es aber nicht soviel bringen weil NV nicht das Speicherbandbreiten Problem der AMD Karten hat.
Es geht nicht um den Zugriff der GPU auf den RAM, sondern von der CPU auf den VRAM!
therealcola schrieb:
eventuell ist das nicht genügend vram lastig oder von amd noch nicht supportet
Wie oben, es geht nicht darum der GPU mehr Speicher oder Bandbreite zuzuweisen, sondern den Zugriff der CPU auf den VRAM zu beschleunigen ;).
ZeroStrat schrieb:
Da kommt die genannten Instruktion zum Einsatz, welche bei Zen 2 250 mal länger braucht. Das wird nichts mit Zen 2.
Technisch funktionieren würde es schon - nur sollte der Befehl bei jedem Zugriff benötigt werden gleichzeitig auch in einer deutlichen Performancereduktion enden: bei 250 mal weniger häufigen möglichen Ausführung pro Sekunde und 100 mal längerer Latenz war es das mit der Performance...
 
  • Gefällt mir
Reaktionen: Colindo
Berserkervmax schrieb:
Genau das meine ich.
RT Leistung noch nicht mal Mittelklasse
Wenn du einen Test mit 5 Spielen bekommst, und deine Argumente dann nur mit der Performance bei Crysis:Remastered belegst, nennt man das Cherrypick!
 
  • Gefällt mir
Reaktionen: LukS
Mal eine umfangreiches Review zu oldGames mit SAM on/off: für high Fps-Gamer interessant
AMD Radeon Smart Access Memory Review - 22 Games Tested | TechPowerUp
In WQHD in den meisten Fällen hilfreich. (in 4k limitiert dann eher die Shaderauslastung)
In ME besser advanced PhysX= off, das Ergebnis ist sonst net aussagekräftig.(wie in dem Review=Murks)
Es fehlen e-Sports und einige nextGen-Titel. Da müsste man separat googlen.

btw.
MF hat anscheinend sowohl RTX 3080 als auch RX6800(xt).
Wenn man den UVP der FE+Ref net kennen würde...vgl. mit alten Preise der 2080Ti>1k ...gar net so bad.
Das ist schliesslich unteres Enthusiasmus-Segment.
LIVE: Overclocking AMD RX 6800 XT Custom Cards (Sapphire, PowerColor, XFX) - YouTube
(die Merc´s sollten auch deutlich mehr OCing-Spielraum als die Ref haben. dito Aorus+Co.)

btw.
Bei den ganzen Reviews bin ich mir net sicher ob Vram@2150-FAST tatsächlich ideal ist.
Vorsichthalber auch mal 2124-FAST probieren, net das die Fehlerkorr. zuschlägt.
Wenn man ganz schlechten Vram erwischt ist u.U. sogar schon bei 2059-FAST das Optimum.
 

Anhänge

  • Verfügbarkeit3080_6800.png
    Verfügbarkeit3080_6800.png
    434,2 KB · Aufrufe: 312
  • MERC.png
    MERC.png
    529,3 KB · Aufrufe: 304
  • MERC-Temps.png
    MERC-Temps.png
    217 KB · Aufrufe: 299
  • MERC-dB.png
    MERC-dB.png
    232,4 KB · Aufrufe: 297
Zuletzt bearbeitet:
Berserkervmax schrieb:
Aber das wird AMD nicht helfen bei RT aufzuholen weil die Hardware es eben nicht so gut kann !
Die bisherigen RT Umsetzungen wurden idR. auf nvidias Architektur optimiert, sie war schließlich die einzige die verfügbar war, und dürfte damit entsprechend suboptimal mit AMDs Variante laufen.
Erstmal abwarten wie sich das entwickelt denn beide Hersteller haben bei ihren Umsatzungen unterschiedliche Schwerpunkte.
Ergänzung ()

Berserkervmax schrieb:
Somit ist AMD bezogen auf RT nicht zu gebrauchen !

Die RTX 3060 ist genau so schnell im RT wie die RX 6800

https://www.computerbase.de/2020-12...i-test/2/#abschnitt_benchmarks_mit_raytracing
Wenn die Aussage im Golem Test stimmt dann dürfte vor allem Crysis das denkbar schlechteste Beispiel dafür sein da es offenbar nur einseitig Hardware Beschleunigung nutzt.

Bei Crysis Remastered wird Raytracing für Spiegelungen eingesetzt, allerdings ist nur bei Nvidia eine Hardwarebeschleunigung aktiv. Auf Nachfrage sagte Crytek, eine Unterstützung für AMD sei "derzeit" auch nicht geplant, was die niedrige Bildrate erklärt.
 
Zuletzt bearbeitet von einem Moderator:
  • Gefällt mir
Reaktionen: LukS, Colindo und GerryB
Konnte jetzt endlich die Dolphin Benchmarks auf der Broadwell CPU durchführen. PDEP/PEXT ist bei dem povray.elf Benchmark um 0,4% schneller als der Workaround. Bei dem luabench sieht es ähnlich aus. Ob und wie man das ganze nun auf "unseren" Use-Case hier adaptieren kann, ist jedoch fragwürdig.
Ich habe hier noch einen interessanten Polyfill gefunden: https://github.com/zwegner/zp7/blob/master/zp7.c
Der Author selbst sagt, dass der signifikant schneller ist als die Emulation auf <Zen3 aber dennoch deutlich langsamer als nativ auf Haswell+.
 

Anhänge

  • SAM-1440p.png
    SAM-1440p.png
    48,4 KB · Aufrufe: 298
  • SAM-4k.png
    SAM-4k.png
    48 KB · Aufrufe: 298
  • SAM-Takt.png
    SAM-Takt.png
    51,9 KB · Aufrufe: 290
Zuletzt bearbeitet:
lordfritte schrieb:
Also benötigt man eine RX6000 und einen Ryzen5000... Beides was man nicht kaufen kann.. toll.

Ist ja nur die erste Generation.
Wer in paar Jahren ein upgrade macht hat die Features ;)
 
lordfritte schrieb:
Also benötigt man eine RX6000 und einen Ryzen5000... Beides was man nicht kaufen kann.. toll.
Man kann alternativ auch Intel+Z490/B460 nehmen.(sobald die Bios`verfügbar sind)
Intel Core i5-10600K, 6C/12T, 4.10-4.80GHz, boxed ohne Kühler ab € 238,00 (2021) | Preisvergleich Geizhals Deutschland
Die RX6800 ist erhältlich, nur halt rel. teuer. (die Merc macht mehr Sinn)
Suche nach ''rx 6800'' in Radeon RX Serie -> Grafikkarten (VGA) -> Hardware: 2 Treffer
 
Also zumindest mit dem Satz hier hat er ja recht:
"Ryzen 5000 "Vermeer" processors introduce a PCIe physical-layer feature called full-rate _pdep_u32/64, which is required for resizable-BAR to work."
Das war von TPU wirklich etwas unglücklich formuliert
 
  • Gefällt mir
Reaktionen: Teralios
Das hatten wir auch schon erarbeitet hier im Thread. Es geht aber jetzt, um die Frage, ob pdep/pext wirklich im Kontext von rBar überhaupt genutzt wird. Wir haben ja letztlich keinen klaren Beweis, dass das Mapping der Adressräume unter Verwendung dieser Instruktion geschieht.

Und hier der nächste: https://twitter.com/gr1nd4/status/1335620630381785089

"For sure, rBAR has absolutely nothing to do w/ pdep/pext."

@Teralios Du hattest zwar den Code mit den pdep Aufrufen verlinkt, aber es nicht klar, ob der Compiler "le32_to_cpu" wie vermutet damit auflöst.
 
  • Gefällt mir
Reaktionen: Teralios
Naja, der Tweet geht ja noch weiter. Es ist ja so, dass resizable Bar erstmal nichts mit pdep/pext zu tun hat. Aber um den CPU VRAM Access sinnvoll nutzen zu können, braucht man schnelle Bitmap Operationen der CPU.
 
  • Gefällt mir
Reaktionen: Teralios
ZeroStrat schrieb:
Hm, schaut euch mal den Retweet + Diskussion von Sebastian Aaltonen an.

https://twitter.com/CapFrameX/status/1mit der335615382988664834
mit der
Er meint, dass rBar nichts mit pdep/pext zu tun hat. Es geht wohl nur um Tiling von Texturen.

@foo_1337 @Teralios @0x8100
das ist ja das, was ich gesagt hatte. rbar und pdep/pext sind technisch zwei unabhängige sachen. wenn man aber mittels rbar mit der cpu zugriff auf den gesamten speicher der gpu hat, dann kann man z.b. dort die texturen direkt bearbeiten, was dann mit einem performaten pdep/pext natürlich besser geht :)
 
  • Gefällt mir
Reaktionen: LukS, Teralios und foo_1337
foo_1337 schrieb:
Naja, der Tweet geht ja noch weiter. Es ist ja so, dass resizable Bar erstmal nichts mit pdep/pext zu tun hat. Aber um den CPU VRAM Access sinnvoll nutzen zu können, braucht man schnelle Bitmap Operationen der CPU.

Wirklich jetzt das Address-Mapping oder das Texure Tiling?
Ergänzung ()

0x8100 schrieb:
das ist ja das, was ich gesagt hatte. rbar und pdep/pext sind technisch zwei unabhängige sachen.
Ich habe halt ein gewisses Unbehagen, wenn gesagt wird, dass es nichts miteinander zu tun hat, aber letztlich ein natives pdep/pext benötigt wird, um überhaupt Performancevorteile daraus gewinnen zu können. Es ist am Ende auch eine Ansichtssache.
 
Zuletzt bearbeitet von einem Moderator:
@ZeroStrat Also das Adress Mapping hat erstmal nichts mit bmi2 zu tun.
Aber wie du schon schreibst: Es ist Ansichtssache bzw. Interpretationssache. Wenn man keinen entscheidenden Vorteil daraus ziehen kann, ist es recht nutzlos :)
 
  • Gefällt mir
Reaktionen: ZeroStrat
Zurück
Oben