DirectStorage 1.2: PCIe-5.0-SSD entfaltet mit Treiber-Update ihr wahres Potenzial

Michael Günsch
105 Kommentare
DirectStorage 1.2: PCIe-5.0-SSD entfaltet mit Treiber-Update ihr wahres Potenzial
Bild: Compusemble

Tests belegen, dass die GPU-Dekomprimierung via DirectStorage 1.2 deutlich durch eine schnelle PCIe-5.0-SSD wie die Crucial T700 beschleunigt wird. Mit Optimierungen beim Grafikkartentreiber wird noch mehr SSD-Leistung abgerufen und PCIe-4.0-SSDs stoßen ans Limit.

DirectStorage ist eine Programmierschnittstelle (API) von Microsoft und soll den Weg der Spieldateien vom Massenspeicher bis in den Videospeicher der Grafikkarte beschleunigen. Ultimativ sinken dadurch Ladezeiten oder es können im gleichen Zeitraum weitaus mehr Daten für hübschere oder größere Spiele übertragen werden.

Seit DirectStorage 1.1 wird die Dekomprimierung von (Spiel-)Daten auf der GPU unterstützt, was schneller als zuvor auf der CPU erfolgt. Letztere wird dabei ganz umgangen und somit entlastet.

Datenstrom der Spieldateien bisher
Datenstrom der Spieldateien bisher (Bild: Microsoft)
Datenstrom der Spieldateien mit DirectStorage
Datenstrom der Spieldateien mit DirectStorage (Bild: Microsoft)

Der Einsatz der API ruft auch mehr Leistung von schnellen NVMe-SSDs ab, deren Potenzial zumindest auf dem PC bei Spielen oft brachliegt. Bisher gibt es mit Forspoken (Test) aber wohl nur einen Titel, der DirectStorage bereits nutzt.

Wie viel schneller die GPU-Dekomprimierung via DirectStorage abläuft, hatte Microsoft mit dem „Avocado Benchmark“ demonstriert, der die Dauer, den maximalen Durchsatz und die CPU-Auslastung misst.

GPU-Dekomprimierung im Benchmark

In einem Video der Firma Compusemble wird dieser Benchmark genutzt, um zu zeigen, dass nicht nur schnelle PCIe-5.0-SSDs dabei Vorteile bieten, sondern auch der jeweilige Grafikkartentreiber Einfluss nimmt. Dabei kam bereits DirectStorage 1.2 mit weiteren Optimierungen zum Einsatz.

Beim Test auf einem System mit Ryzen 7 7700X (Test) und GeForce RTX 3080 Ti (Test) wurde der Benchmark zum einen mit der Crucial T700 (Test) mit PCIe 5.0 und bis zu 12,4 GB/s durchgeführt, zum anderen kam die Sabrent Rocket 4 Plus-G mit PCIe 4.0 und bis zu 7,3 GB/s zum Einsatz.

Mit dem Treiber GeForce 532.03 benötigte die 3080 Ti lediglich 0,24 Sekunden zur Dekomprimierung der 6,66 GB großen Daten, die von der schnellen Crucial T700 zugespielt wurden. Der Durchsatz lag somit bei rund 28 GB/s. Die gleiche Prozedur dauerte mit der PCIe-4.0-SSD deutlich längere 0,30 Sekunden, was rund 22 GB/s bedeutet. Erst mit DirectStorage 1.2 seien solche Unterschiede zwischen den SSDs aufgetreten, während es mit DirectStorage 1.1 zuvor ein Unentschieden gegeben habe.

GPU-Dekomprimierung mit PCIe-5.0- und PCIe-4.0-SSD
GPU-Dekomprimierung mit PCIe-5.0- und PCIe-4.0-SSD (Bild: Compusemble)
Dekomprimierung auf PCIe-5.0-SSD mit neuem Nvidia-Treiber weiter beschleunigt
Dekomprimierung auf PCIe-5.0-SSD mit neuem Nvidia-Treiber weiter beschleunigt (Bild: Compusemble)

Das folgende neue Feature von DirectStorage 1.2 sorge dafür, dass mehr Leistung von der PCIe-5.0-SSD abgerufen werden kann:

Move the copy after GPU decompression onto the compute queue for GPUs where this is faster.

Eines der neuen Features von DirectStorage 1.2 (Quelle: Microsoft)

Mit neuem GeForce-Treiber eilt PCIe 5.0 davon

Mit dem Beta-Treiber GeForce 535.50 konnten die Daten noch deutlich schneller dekomprimiert werden, sofern die SSD mithalten konnte. Mit der PCIe-5.0-SSD waren dann 0,20 Sekunden oder 33 GB/s machbar, eine Steigerung der Leistung um 18 Prozent durch den neuen Treiber. Die PCIe-4.0-SSD stieß aber offenbar an ihr Limit, denn mit 0,29 Sekunden oder 22,8 GB/s gab es hier kaum noch eine Steigerung. „Das Gen4 Drive scheint an eine Wand gestoßen zu sein“, urteilten die Tester. Somit konnte die Crucial T700 einen Vorsprung von satten 45 Prozent bei Durchsatz und Ladezeit ermöglichen.

Diagramme
Datentransferrate
    • RTX 3080 Ti + 535.05 Beta + T700 (PCIe 5.0)
      33,12
    • RTX 3080 Ti + 532.03 + T700 (PCIe 5.0)
      28,09
    • RTX 3080 Ti + 535.05 Beta + Rocket 4 Plus-G (PCIe 4.0)
      22,80
    • RTX 3080 Ti + 532.03 + Rocket 4 Plus-G (PCIe 4.0)
      22,26
Einheit: Gigabyte pro Sekunde (GB/s)

Praktische Beispiele fehlen

Unterm Strich zeigen diese Messungen zum einen, dass die GPU-Dekomprimierung via DirectStorage selbst noch von den aktuell schnellsten SSDs profitieren kann. Zum anderen wird klar, dass es dafür Optimierungen im Grafikkartentreiber bedarf. Bis Spiele von der Technik aber wirklich Gebrauch machen, wird es wohl noch einige Zeit dauern. Erst dann wird sich zeigen, ob das theoretische Potenzial aus dem Benchmark auch in der Praxis existiert.

Wie Tom's Hardware berichtet, sollen diese Optimierungen aus dem Beta-Treiber auch im aktuellen Treiber GeForce 535.98 als Game-Ready-Driver für Diablo IV (Test) vorhanden sein, der wegen eines Problems inzwischen den Hotfix 536.09 (Beta) erhalten hat.