News DirectStorage: SSD-Benchmarks offenbaren Optimierungspotenzial

Weiß eigentlich zu diesem Thema jemand, ob die ursprünglich von MS kommunizierte Anforderung, dass die SSD mindestens 1TB groß sein muss, so stimmt? Wenn ich in die XBox Game Bar Settings schaue, wird für mein System (WD Black SN700 500GB) folgendes angezeigt:
directstorage.png
 
G00fY schrieb:
... für mein System (WD Black SN700 500GB) folgendes angezeigt:
Was sind denn bei Dir Laufwerke C: und D: jeweils?🤔
 
G00fY schrieb:
C = 500GB NVMe SSD
Na dann war das mit den "ab 1TB Kapazität" wohl nur etwas Gelaber...Wurde glaub inzwischen so "halbwegs" dementiert, finde jetzt nicht auf Anhieb.
 
  • Gefällt mir
Reaktionen: Ardadamarda
Ich hoffe das nimmt Fahrt auf und trifft auf breite Unterstützung!

Ladezeiten ADE! Nachladeruckler ADE!
 
das ist dann schon die zweite version einer schnittstelle, die kein spiel nutzt :p

btw: sie haben mit zlib verglichen, was langsameres hätte man ja auch nicht nehmen können... (http://facebook.github.io/zstd/)

edit: unter https://github.com/inikep/lzbench sind mehrere algorithmen zu finden, die mehrere GB/s auf einem(!) kern eines 8700k schaffen. die von microsoft gezeigten werte sind also auch so ohne probleme zu schaffen, was vermutlich auch zeigt, dass das eigentliche laden und dekomprimieren der daten nicht das problem ist.
 

Anhänge

  • 1665747361080.png
    1665747361080.png
    55,4 KB · Aufrufe: 180
Zuletzt bearbeitet:
SI Sun schrieb:
Ach... die guten alten Zeiten, in denen Spiele so klein waren, dass man die über eine RAM-Disk vollständig auf Arbeitsspeicher installieren und darauf spielen konnte.
Wann gab es das denn das letzte mal?

PS gibt es mittlerweile einen Benchmark dazu?
 
r4yn3 schrieb:
Habe ich ausprobiert, der läuft dann in einer Endlosschleife und spuckt immer andere Ergebnisse aus:
2023-01-12 (1).png



2023-01-12 (2).png
 
andi_sco schrieb:
Habe ich ausprobiert, der läuft dann in einer Endlosschleife und spuckt immer andere Ergebnisse aus:
Die paar %% -Schwankungen sind doch in Ordnung, da hängt doch auch sehr viel von GPU ab und Deine GPU boostet sich doch auch nicht immer konstant mit gleichem Boost.

P.S.: aber >25% CPU usage sind schon nicht ohne. Normal sind so zwischen 0 und 15%.
Und 0,78 GB/s - was ist das? :confused_alt: Lädst Du etwa von einer Sata-2-SSD? Normalerweise schaffen einigermaßen aktuelle CPUs 4-6 GB/s und GPUs so 10 bis 24 GB/s je nach SSD natürlich.
 
Ist ein Ryzen 5 3500U mit Samsung OEM SSD.
Teilweise lag ich bei 44% und warum die Samsung so vor sich hin kriecht? Keine Ahnung.


Urghs, die glänzt ja richtig, beim Schreiben:
2023-01-12 (3).png


2023-01-12 (4).png
 
andi_sco schrieb:
Wann gab es das denn das letzte mal?

PS gibt es mittlerweile einen Benchmark dazu?

Das letzte Mal, als ich so gespielt habe, ist noch vor 2010 gewesen.
Damals waren SSDs noch sehr teuer.

Deshalb habe ich günstige Arbeitsspeicher verwendet, um Spiele wie Gothic 3 (~ 4 GB) darauf zu installieren.
Der positive Effekt war sofort ersichtlich und die Performance buchstäblich extrem gut.
Das Spiel war so schlecht programmiert, dass eine HDD zu langsam war, dass sie trotz Höchstleistung für ständige Ruckler sorgte.
Mit der RAM-Disk war das Problem sofort behoben.

Danach habe ich weitere Spiele oder Programme darauf getestet und überall hat man den enormen Unterschied gemerkt. Spiele mit Ladezeiten von 10 Sekunden hatten plötzlich keine bzw. nur 1 Sekunde Ladezeiten.
Spiele, bei denen das Speichern 2-3 Sekunden dauerte, waren sofort gespeichert, sodass man das Gefühl hatte, dass es gar nicht gespeichert wurde.
Usw.
 
andi_sco schrieb:
Teilweise lag ich bei 44% und warum die Samsung so vor sich hin kriecht? Keine Ahnung.
die gpu schafft 4440 MB/s beim dekomprimieren, die ssd liefert knapp 800MB. das bedeutet eine kompressions-ratio von 4440/800 ~5,55 was realistisch für komprimierte texturen ist:
Actual number should be verified but as an example, compressed texture formats might achieve about 4-6x compression
https://loaders.gl/modules/textures/docs/using-compressed-textures

deine ipgu ist einfach nicht schneller, daher muss die ssd auch nicht schneller liefern.
 
  • Gefällt mir
Reaktionen: andi_sco
0x8100 schrieb:
deine ipgu ist einfach nicht schneller
Merci für den Hinweis

Wenn ich jetzt noch wüsste wie man ein Endresultat bekommt😵‍💫


So schaut die geringste Auslastung mit einer R9 Fury und nem Core i3 10105 aus:
Direct Storage Benchmark R9 Fury.png
 
Zuletzt bearbeitet:
andi_sco schrieb:
Urghs, die glänzt ja richtig, beim Schreiben
Ja, nicht toll - hat aber für schwache DirectStorage-Leistung weniger Gewicht, da ist das Lesen viel wichtiger. Deine PM981a entspricht in etwa einer 970Evo Plus und dafür sind die Ergebnisse beim Schreiben schon schwach - ist aber nur 512GB-Version und bei hoher Befüllung kann sie schon schwächeln. Viel schlimmer finde ich sehr schwache Ergebnisse beim 4K-Randomm-Lesen - das könnte aber teilweise mit einer schwachen CPU zusammen hängen.
0x8100 schrieb:
die gpu schafft 4440 MB/s beim dekomprimieren, die ssd liefert knapp 800MB. das bedeutet eine kompressions-ratio von 4440/800 ~5,55 was realistisch für komprimierte texturen ist:
Sehr interessant, frage mich, woher Du das alles nimmst... :lol:
die gpu schafft 4440 MB/s beim dekomprimieren
Die GPU bremst hier, schafft sicher keine 4440 MB/s, sondern eben die 790MB/s, die rauskommen.
ssd liefert knapp 800MB
wie kommst Du auf 800MB? - Die SSD könnte schon mehr liefern, darf aber maximal grob geschätzt ca. 300-400MB/s, weil die GPU nicht mehr annimmt.
das bedeutet eine kompressions-ratio von 4440/800 ~5,55 was realistisch für komprimierte texturen ist
Wieder falsch, bitte befasse Dich etwas mehr mit diesem Bench und dem, was da angezeigt wird.
GDeflate hat übrigens keine 4-6x Ratio, das ist quasi das gleiche wie Deflate, genauer gesagt "RFC 1951 DEFLATE", nur GPU-optimiert. Man kann da je nach Inhalt/Assets so 2,5 bis 4-fach, also grob etwas mehr als 3x im Schnitt erwarten.
andi_sco schrieb:
So schaut die geringste Auslastung mit einer R9 Fury und nem Core i3 10105 aus
Schon viel besser, wenn auch nicht besonders berauschend. Wäre interessant zu wissen, was genau hier limitiert - dafür fehlen zumindest die Angaben zur SSD.
 
DirectStorage ist auf der Konsole eher notwendig, weil: begrenzter RAM für CPU+GPU.
Das schaut bei PCs schon anders aus.

Schließe mich PCGH_Torsten an (Zitat):
[...]
Wenn der Entwickler den RAM vernünftig nutzt, dann wiederholt sich das erst beim nächsten Spielstart. Also für viele Anwender maximal 10 mal pro Woche. PCs sind eben keine Konsolen, sondern haben zwischen Grafik- und Massenspeicher noch einmal ein 16/32/64-GiB-Reservoir und das würde in vielen Fällen reichen, um Laufwerkszugriffe ganz einzusparen oder auf eine unbedeutende Hintergrundtätigkeit zu begrenzen. Sicherlich werden wir trotzdem vermehrt schlechte Konsolenports sehen, die ganz doll von Direct Storage profitieren, weil sie gar kein Speichermanagement mehr beherrschen und nur noch vom Laufwerk arbeiten, aber als Fortschritt würde ich das nicht betrachten. Zumal die zusätzliche GPU-Last eben auch die Renderperformance reduziert, wenn der Entwickler im laufenden Spiel große Datenmengen vom Laufwerk streamen lässt.
 
@massaker du meinst also, dass "bandwidth" den output von gdeflate bedeutet und die gpu nur 800MB/s dekomprimiert? mit lz4 schafft man schon singlethreaded mehrere GB/s auf der cpu, da wird wohl hoffentlich die gpu etwas mehr schaffen.
 
0x8100 schrieb:
du meinst also, dass "bandwidth" den output von gdeflate bedeutet und die gpu nur 800MB/s dekomprimiert?
Korrekt, die eingebaute iGPU von dem Ryzen 5 3500U ist schlicht viel zu schwach -> RX Vega 8 hat DX 12.1 und Shader Model 6.7/6.4 und somit DirectStorage tauglich...theoretisch... Die SSD hätte schon locker 3000+ MB/s geliefert und nach dem entpacken mit einer starken GPU hätte man bis ca 10GB/s haben können.
0x8100 schrieb:
mit lz4 schafft man schon singlethreaded mehrere GB/s auf der cpu, da wird wohl hoffentlich die gpu etwas mehr schaffen.
Eine ordentliche GPU - auf jeden Fall.
Hier mal meine FC530 mit 2080Ti:
1673634376065.png

Die FireCuda 530 liefert potentiell so um ~7000 MB/s, hätte also theoretisch >21 GB/s sein können, sprich: sogar 2080Ti limitiert hier. Ok, nun also 2080Ti raus und eine 4090 rein:
1673634539539.png

Wie Du siehst, erst mit einer noch stärkeren Graka kann eine schnelle Gen4-SSD sich voll entfalten. Grob geschätzt, brauch man idealerweise eine 3090Ti/4070Ti oder mindestens Radeon 6950XT, besser gleich 7900XT um alles mögliche aus einer Top-Gen4-SSD (7000-7500 MB/s im Lesen) rauszuholen. Wenn jetzt 10.000+ MB/s Gen5-SSDs kommen, dann hat man idealerweise mindestens eine 4080 oder 7900XTX - so weit meine wilde Spekulation stand heute.
 
Zurück
Oben