News Smart Access Memory: Ryzen 3000 und Vorgängern fehlt es an Hardware-Support

Nun SAM bringt schon einiges.. vielleicht nicht immer bei der max frameraten.. aber Minimum und average scheinen doch ordentlich davon zu profitieren...

Ich denke es ist schon sinnvoll das Feature auf breiter Basis Verfügbar zu machen und hoffe Mal sehr das Nvidia bald einen entsprechenden Treiber rausbringt.
 
Ganz ehrlich: Mir bzw. meinem Sohn wäre es als Zen2 Besitzer auch lieber, wenn es diese Limitation nicht gäbe, aber wat willste machen :)
Dolphin bzw. Qt unter macOS ist einfach nur Pain. Ich hab jetzt qt 5.15.1 neu gebaut und compiliere Dolphin nochmal. Ich hoffe, dass die Runtime dann endlich mal funktioniert. Ansonsten boote ich ein live linux und mach das da ;)

Code:
~/dolphin-emu/build (git)-[master] % Binaries/Dolphin.app/Contents/MacOS/Dolphin
qt.qpa.plugin: Could not load the Qt platform plugin "cocoa" in "" even though it was found.
This application failed to start because no Qt platform plugin could be initialized. Reinstalling the application may fix this problem.

Available platform plugins are: cocoa.
 
bad_sign schrieb:
so wie es aussieht, hilft SAM eher in niedrigen Auflösungen und verbessert die Auslastung. Wobei eine klare Linie sehe ich nicht wirklich^^
Der ist doch recht leicht absehbar denn es beeinflußt vor allem den CPU intensiven Teil der Berechnung und dort hin verschiebt sich auch das Limit beim Senken der Auflösung weil die GPU selbst weniger zu berechnen hat.
Die CPU hat einfach weniger Zeit um diese abzuschließen damit die GPU weiter arbeiten kann. ;)
 
Ich habs jetzt in 12 Games die ich spiele getestet, es ist nicht viel. Mit RAM Optimierung hole ich mehr raus, oder leichtem GPU OC.
Bei der Hälfte meiner Games ist es fast nicht messbar.
Habs eingeschaltet, was man bekommt nimmt man mit, aber wichtig ist mir SAM nicht.

Blackfirehawk schrieb:
Nun SAM bringt schon einiges.. vielleicht nicht immer bei der max frameraten.. aber Minimum und average scheinen doch ordentlich davon zu profitieren...

Ich denke es ist schon sinnvoll das Feature auf breiter Basis Verfügbar zu machen und hoffe Mal sehr das Nvidia bald einen entsprechenden Treiber rausbringt.
 
@Maxxx800

Du hast aber mit ziemlicher Sicherheit nicht im CPU limitierten Bereich getestet (wie sollte sonst GPU OC groß was bringen) und es ist keine "entweder/oder" Frage für die Mehrleistung sondern ein "und" das noch zusätzlich drauf kommt. ;)

Und ja, auch der CPU limitierte Bereich ist wichtig weil er ja auch die min. FPS beeinflußt.
Das wurde schließlich vor nicht allso langer Zeit immer wieder gebetsmühlenartig wiederholt und deren Priorität noch über die anderen FPS Angaben gestellt. Allerdings ging es da idR. um eine Argumentation gegen AMDs Produkte. ;)
 
Berserkervmax schrieb:
und dir ist schon klar das ich von der RT Leistung rede !
@Teralios hat ja schon geantwortet. Die Spiele sind Dirt5 und WoW, wo Stand jetzt die RX6800 bessere RT-Leistung liefert als die 3070. Es hängt also, wie so oft, von der Spiele-Auswahl ab. Und da kann es auch zukünftig noch Verbesserungen geben.
 
Teralios schrieb:
… doch, dass was ich schreibe ist korrekt und wir haben sogar bereits hier nun gezeigt, dass das PCI-Subsystem von Linux in dieser Art arbeitet - natürlich ausgefeilter. Siehe Linux-Quelltext.

Der Linux-Quelltext zeigt, dass bestimmte Transformationen mit PDEP bzw. PEXT abgekuerzt werden koennen - im dritten Code-Beispiel von foo_1337 z.B. eine RGB-Farbtransformation von 10 auf 3 Befehle (wie auch schon von anderen angemerkt bedeutet das im Uebrigen nicht notwendiger Weise, dass diese 3 Befehle auf Zen 3 wirklich schneller ausgefuehrt werden koennen als die 10 unteren, da der PDEP-Befehl ja auch auf Zen 3 eine gewisse Latenz hat, aber es ist zumindest relativ plausibel, dass auf Zen 3 die PDEP-Variante etwas schneller ausgefuehrt werden kann als die Alternative).

Allerdings geht es in unserem Fall ja nicht um Farbtransformationen, sondern um einen Datenaustausch mit der GPU, die Nuetzlichkeit der PDEP/PEXT-Funktionen im Anwendungsfall von Emulatoren bedeutet also nicht, dass sie in dem ganz anderen Fall eines Grafiktreibers auch nuetzlich sind.

Teralios schrieb:
Das Problem ist, dass die 64 Bit der BAR in die 32 Bit der MMIO abgebildet werden muss und DAS ist nicht mit einem einfachen High- und Low-Wort Teilung getan.

Im Wikipedia-Artikel (https://en.wikipedia.org/wiki/Memory-mapped_I/O) steht etwas anderes:

"Memory-mapped I/O is the cause of memory barriers in older generations of computers, which are unrelated to memory barrier instructions. The 640 KB barrier is due to the IBM PC placing the Upper Memory Area in the 640–1024 KB range within its 20-bit memory addressing. The 3 GB barrier and PCI hole are manifestations of this with 32-bit memory addressing; with 64-bit memory addressing these are usually no longer problems on newer architectures."

Das was du beschreibst, trifft also auf 32-bit Systeme zu, aber nicht auf 64-bit Systeme.
 
@HighDefinist

Wo geht es da noch gleich um die Addressierung des GPU Speichers für die CPU?
 
  • Gefällt mir
Reaktionen: Colindo, Teralios, foo_1337 und eine weitere Person
Fuchiii schrieb:
Wie kommst du darauf..? Auf Intelseite bekommt es bisher auch nur der LGA1200. Oder war das ironisch gemeint..? xD
Meine Aussage bezog sich (wie auch mutmaßlich das, was ich zitiert hatte) auf die Möglichkeit

Wahrscheinlich ist es etwas mehr, weil der Anteil an pre-Haswell CPUs in den ~80% Gesamtmarktanteil von Intel größer sein dürfte als der Anteil der Zen3 CPUs in den ~20% Gesamtmarktanteil von AMD...
 
Zuletzt bearbeitet:
Berserkervmax schrieb:
Die Neuen AMD GPU könnnen RT ein bischen ABER im Vergleich zur RTX ab 3700 eben nicht gut.
Da nutzen auch 16GB Vram nix.

Ich Spiele in 2560x1080 somit wurden 10GB Vram wohl reichen
ABER
meine 1080TI hat schon 11GBVram. Irgentwie ein Rückschritt.

Wie ich schon gesagt
Wer kein RT will kann AMD nehmen.
Da ich aber Gsync im Montor habe und kein Freesync und RT benutzen möchte kommt AMD eben nicht in die Auswahl.

Hinzu kommt das ich jetzt keine GPU kaufen würde die RT nicht gut kann.
Wenn AMD sagen würde 450€ weil die RT Leistung eben schlechter ist wär es OK.
Aber die GPU kosten im Prinzip das gleiche und dann würde ich ne RTX nehmen.

WENN ES DENN ÜBERHAUPT HIGH END GPUS GEBEN WÜRDE DIE KEIN MONATSEGEHALT KOSTEN !!!
:grr::grr::grr:

wie geschrieben: z.T. war in dem Test die RT Leistung auf Augenhöhe , z.T. sogar über der nVidia. Nur finde ich den Test dummerweise nicht mehr. Weiß jemand wo das war. Ist erst vor wenigen Tagen gewesen.
 
@HighDefinist

https://www.intel.com/content/dam/w...n-core-families-datasheet-vol-2-datasheet.pdf

https://resources.infosecinstitute....rchitecture-part-2-pci-express-based-systems/

… und bitte verwechsel das 3GB-Problem eines 32Bit-Problems nicht mit um was es hier geht. Wie ich schrieb: PCIe liefert 64Bit, dass muss auf 32 Bit für die MMIO gedrückt werden und kann dann in der CPU wieder auf 64 Bit aufgebläht werden, und genau das ist hier der Knackpunkt und wir haben bereits doch geschrieben, dass man das ohne diese Funktionen lösen kann und der Rest ist drin.
 
  • Gefällt mir
Reaktionen: foo_1337
foo_1337 schrieb:

Genau das meine ich.
RT Leistung noch nicht mal Mittelklasse

34FPS AMD 6800 zu 53,5FPS RTX 3070

Ich rede NUR über RT Leistung !
Wenn ich nur Spielen will reicht meine 1080TI immer noch locker aus.

RTX 3700 UVP 500€ GPU
AMD 6800 RT Leistung noch 2/3 von einer 500€ GPU aber gleiche Preisklasse

Somit ist AMD bezogen auf RT nicht zu gebrauchen !

Die RTX 3060 ist genau so schnell im RT wie die RX 6800

https://www.computerbase.de/2020-12...i-test/2/#abschnitt_benchmarks_mit_raytracing
 

Anhänge

  • 02-crysis-remastered,-uss-lexington-deck-(1440p,-bcirc-preset,-d3d11)-chart.png
    02-crysis-remastered,-uss-lexington-deck-(1440p,-bcirc-preset,-d3d11)-chart.png
    110,8 KB · Aufrufe: 286
Zuletzt bearbeitet:
1440p, ich bewege mich da öfters im CPU limit 😉

Wadenbeisser schrieb:
@Maxxx800

Du hast aber mit ziemlicher Sicherheit nicht im CPU limitierten Bereich getestet (wie sollte sonst GPU OC groß was bringen) und es ist keine "entweder/oder" Frage für die Mehrleistung sondern ein "und" das noch zusätzlich drauf kommt. ;)
Ergänzung ()

@Berserkervmax da liegt vermutlich noch viel an den Treibern. Kann mich noch gut an den RTX Start von den 2000er Karten erinnern, wie schlecht es auch dort am Anfang lief, bis die Treiber besser und Tests/Games optimiert wurden.
Wird also die Zeit zeigen.

Davon abgesehen hab ich derzeit nur zwei Games welche RT unterstützt, Shadows of the tomb raider und Watch Dogs Legion.
Und bei Watch Dogs muss ich sagen, ohne RT gefällt es mir besser. Spiegelungen mit RT wirken unreal und übertrieben.
Bin generell kein großer Fan von RT, von da her is mir die Leistung eigentlich recht egal.
 
Zuletzt bearbeitet:
foo_1337 schrieb:
k.A. ob Sowas in Zukunft generell zu Beachten ist:
Leider war bei o.g.Review in ColdWar das Setting auf Ultra, was eindeutig die Ampere-Generation bevorteilt.
Der optische Vorteil von Ultra vs. High ist nach m.E. gering.
Call of Duty: Black Ops Cold War: Ampere und Big Navi im Raytracing-Test - Hardwareluxx
Turing und RDNA2 sehen nur in High einigermaßen normal aus: siehe Anhang

edit: WCC hat nochmal einzeln die RT-Settings angeschaut.
Für RX6000 wäre SunShadows+AO@Medium sinnvoll, LocalShadows kann auf Ultra gesetzt werden:
 

Anhänge

  • ColdWar-RT-high.png
    ColdWar-RT-high.png
    125,2 KB · Aufrufe: 280
  • DXRultra.jpg
    DXRultra.jpg
    94,7 KB · Aufrufe: 279
  • DXRhigh.jpg
    DXRhigh.jpg
    93,3 KB · Aufrufe: 274
  • DXRmedium.jpg
    DXRmedium.jpg
    92,8 KB · Aufrufe: 273
  • CW-SunShadows-med.png
    CW-SunShadows-med.png
    203,3 KB · Aufrufe: 261
  • CW-AO-med.png
    CW-AO-med.png
    193,1 KB · Aufrufe: 266
  • CW-LocalShadows-ultra.png
    CW-LocalShadows-ultra.png
    198,7 KB · Aufrufe: 272
Zuletzt bearbeitet:
Teralios schrieb:
Ok, in diesem Dokument steht unter anderem Folgendes:

InfoSec schrieb:
There are no memory base/limit registers for devices mapped above 4GB because the PCI specification assumes all devices that require large address ranges behave like memory, i.e., their “memory” contents are prefetchable and don’t have side effects on reads. Therefore, the PCI specification implies that devices with large address range consumption should implement prefetchable memory base/limit registers instead of memory base/limit registers and all devices with memory that have side effects on read should be mapped to address ranges below the 4GB limit by the platform firmware.

Es gibt also durchaus memory-mapping ausserhalb von 32-bit Speicheradressen, wie auch in dem folgenden Bild innerhalb des Artikels dargestellt:

https://mk0resourcesinfm536w.kinstacdn.com/wp-content/uploads/010814_1515_SystemAddre14.png

Allerdings scheint das Memory Mapping jenseits des 4 GB Limits mit bestimmten Limitationen verbunden zu sein (keine side-effects). Die Theorie, dass die bis zu 10% Performancevorteil die Existenz von schnellen PDEP/PEXT-Funktionen benoetigen, setzt also insgesamt folgende Bedingungen voraus:

  • In jedem Frame gibt es im Schnitt 1 Million Aufrufe der PDEP/PEXT-Funktion (so viele Aufrufe sind notwendig, da die alternativen Funktionen ja anscheinend nur so ca. 5 Prozessor-cycles mehr benoetigen, was ca. 1ns entspricht, und erst mit 1 Million Aufrufe kaeme man auf die beobachtete Millisekunde Differenz)
  • Jeder dieser Aufrufe entspricht einer MMIO translation, welche mit side-effects auf der GPU verbunden ist (Denn, die translation benoetigen wir nur fuer den side-effect behafteten Zugriff innerhalb des 32-bit Limits, ansonsten ginge es auch einfacher, also auch ohne PDEP/PEXT-Funktion)
  • Es existiert keine Moeglichkeit, diese Aufrufe in einem separaten CPU-Thread auszufuehren oder anderwertig zu parallelisieren (denn wenn das ginge, waere es ja nicht/kaum performance-relevant, wie viel Zeit die translations benoetigen)

Nun kann es durchaus sein, dass alle diese Bedingungen zutreffen - damit wuerde dann auch meine urspruengliche Mutmassung, dass "die tatsaechlichen Operationen, die durch SAM beschleunigt werden, wesentlich komplizierter als ein einfacher Speicherzugriff" sind, zutreffen, da in den entsprechenden Spielen anscheinend eine doch recht gewaltige Menge an kleinen Datenschnipseln (1 Million pro Frame!) zur GPU uebertragen wird, im Gegensatz zu einigen wenigen groesseren Datenpaketen (denn falls das der Fall waere, braeuchte man die PDEP/PEXT-Operationen viel seltener, und der Performance-Unterschied waere vernachlaessigbar) - oder die ganze Theorie ist eben falsch.
 
Man kann sich auch alles schön reden....zb. Treiber Probleme


Nimm mal bei COD ein Außenlevel das in Vietnam zb.

Dort sieht man zb. das die Schatten mit RT viel besser ausehen.

https://www.pcgameshardware.de/Call...ld-War-Benchmark-Release-Review-1362383/2/#a3

Mir geht es nicht nur um normales Settings !
Keiner braucht eine RTX 3070 ober eine RX6800 für only High in 1080p.
Genau so wenig eine RTX 3080 oder RX 6800XT für 1440p in Standart

Wohin mit der Rechenleistung ?
Genau in Optik wie zb. RT !

Wenn SAM AMD hilft ist es OK.
Wenn SAM oder wie auch immer es heist auf Intel kommt auch Super
Wenn NV das auch nutrzen kann irgentwann schön

Aber das wird AMD nicht helfen bei RT aufzuholen weil die Hardware es eben nicht so gut kann !
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: guillome
Zurück
Oben