Test AMD Radeon R9 Fury X im Test: Eine ernsthafte Alternative zu Nvidias Topmodellen

Volker schrieb:
Gerade letztes Beispiel ist schön: Schreiben sowas, aber posten auch den neuen Kram. Klickfang eben.

Deshalb hab ich nie viel mit PCGH zu tun gehabt. Aber auch bei euch erwischt man mal den ein oder anderen klickbait, aber das muss ja auch hier nicht durchgekaut werden ;) (trotzdem relativ zu PCGH deutlich seltener!)
 
SiSoftware Sandra

Benchmarkresultate
Latenzzeit Speicher : 341.0ns
Base 10 Ergebnis Multiplikatoren : 1s = 1000ms, 1ms = 1000µs, 1µs = 1000ns, usw.
Gschwindigkeitsfaktor : 2.20
Ergebnisse : Geringere Werte sind besser.

Gegenüberstellung Leistung und Geschwindigkeit
Latenzzeit Speicher : 0.68ns/MHz
Ergebnisse : Geringere Werte sind besser.

Benchmarkabbruch
2kB Bereich : 153.9ns / 162.0clocks
4kB Bereich : 153.9ns / 162.0clocks
8kB Bereich : 153.6ns / 161.0clocks
16kB Bereich : 154.8ns / 163.0clocks
32kB Bereich : 210.9ns / 221.0clocks
64kB Bereich : 235.6ns / 247.0clocks
128kB Bereich : 251.3ns / 264.0clocks
256kB Bereich : 264.5ns / 278.0clocks
512kB Bereich : 280.5ns / 295.0clocks
1MB Bereich : 283.1ns / 297.0clocks
2MB Bereich : 320.7ns / 337.0clocks
4MB Bereich : 341.0ns / 358.0clocks
8MB Bereich : 341.0ns / 358.0clocks
16MB Bereich : 328.7ns / 345.0clocks
32MB Bereich : 328.7ns / 345.0clocks
64MB Bereich : 313.0ns / 329.0clocks
Schnittstelle : OpenCL

Leistungsteststatus
Ergebnis-ID : AMD Radeon R9 Series (4096SP 64C 1GHz, 4GB 500MHz 4096-bit) (OpenCL)
System : ASRock Z77 WS
Kompatibel mit Plattform : x64
Gesamtspeicher : 128MB
Systemtakt : 1GHz

Grafikprozessor
Modell : AMD Radeon R9 Series
Schnittstellenversion : 2.00
Treiberversion : 1774.04
Geschwindigkeit Shader : 1GHz
Spitzenprozessorleistung (PPP) : 8.6TFLOPS
Eingestellte Spitzenleistung (APP) : 7.74WT
Gesamtspeicher : 4GB
Speicherbusgeschwindigkeit : 500MHz
OEM Hardware Nr. : VEN_1002 DEV_7300 REV_C8

Neuester Gerätetreiber
Herstellungsdatum : Dienstag, 30. Juni 2015
Update URL : In dieser Version (Lite) nicht verfügbar.

Führen Sie bitte ein Upgrade durch, um diese Funktion zu aktivieren und um weitergehenden Support und andere Vorteile zu erhalten.

(Gehen Sie zu 'Hilfe - Upgrade')

Leistungstipps
Tipp 1702 : Update für Modul/Dienst/Treiber verfügbar. Um das Update herunterzuladen und zu installieren besuchen Sie die Webseite der Entwickler.
Tipp 2 : Drücken Sie die Eingabetaste oder doppelklicken Sie auf einen Tipp, um mehr Informationen zu erfahren.

SiSoftware Sandra

Benchmarkresultate
Gesamtspeicherleistung : 50.31GB/s
Bandbreite interner Speicher : 302GB/s
Bandbreite Datentransfer : 8.38GB/s
Typ : D3D 11
Ergebnisse : Höhere Werte sind besser.
Base 2 Ergebnis Multiplikatoren : 1GB(/s) = 1024MB(/s), 1MB(/s) = 1024kB(/s), 1kB(/s) = 1024 bytes(/s), usw.

Benchmark Timings
Zum Kopieren benötigte Zeit : 13.25ms
Zum Lesen benötigte Zeit : 531.6ms
Zum Schreiben benötigte Zeit : 428.23ms
Ergebnisse : Geringere Werte sind besser.

Leistung pro Thread
Gesamtspeicherleistung : 12MB/s
Bandbreite interner Speicher : 75MB/s
Threadanzahl : 4096
Ergebnisse : Höhere Werte sind besser.
Base 2 Ergebnis Multiplikatoren : 1GB(/s) = 1024MB(/s), 1MB(/s) = 1024kB(/s), 1kB(/s) = 1024 bytes(/s), usw.

Gegenüberstellung Leistung und Geschwindigkeit
Gesamtspeicherleistung : 103.04MB/s/MHz
Bandbreite interner Speicher : 618.36MB/s/MHz
Bandbreite Datentransfer : 17.17MB/s/MHz
Ergebnisse : Höhere Werte sind besser.

Benchmarkabbruch
Bandbreite interner Speicher : 302GB/s
Bandbreiteneffizienz : 60.39%
Bandbreite System zu Gerät : 9.34GB/s
Bandbreiteneffizienz : 59.78%
Bandbreite Gerät zu System : 7.52GB/s
Bandbreiteneffizienz : 48.16%
Ergebnisse : Höhere Werte sind besser.

Leistungsteststatus
Ergebnis-ID : AMD Radeon R9 Series (64CU 4096SP SM5.2 1GHz, 4GB 500MHz 8192-bit, PCIe 3.00 x16) (D3D 11)
System : ASRock Z77 WS
Kompatibel mit Plattform : x64
Gesamtspeicher : 4GB
Vom Test verwendeter Speicher : 508.75MB
Threadanzahl : 1
Systemtakt : 3.42MHz

Grafikkarte
Modell : AMD Radeon R9 Series
Treiberversion : 8.17.10.1387
Chipsatz
Geschwindigkeit : 1GHz
Minimale/Maximale/Turbo Geschwindigkeit : 300MHz - 1GHz
Geschwindigkeit Shader : 1GHz
Minimale/Maximale/Turbo Geschwindigkeit : 300MHz - 1GHz
Spitzenprozessorleistung (PPP) : 8.6TFLOPS
Eingestellte Spitzenleistung (APP) : 7.74WT
Unified Shader : 4096 Einheit(en)
Kerne pro Prozessor : 64 Einheit(en)
OEM Hardware Nr. : VEN_1002 DEV_1002 REV_C8

Logische/Chipsatz Speicherbänke
Gesamtspeicher : 4GB
Speicherbusgeschwindigkeit : 500MHz
Maximale Speicherbusbandbreite : 500GB/s

Video BIOS
Version : 015.048.000.063
Modell : 113-C8800100-101

Bus
Typ : PCIe 3.00 x16 8Gbps
Maximale Busbandbreite : 15.63GB/s

Leistungstipps
Tipp 223 : Prozessorgeschwindigkeit ist unter Last geringer als erwartete Geschwindigkeit. Prüfen Sie die Energie- bzw. Leistungseinstellungen.
Tipp 2 : Drücken Sie die Eingabetaste oder doppelklicken Sie auf einen Tipp, um mehr Informationen zu erfahren.

Komisches UI. :D Speicher werd ich erstmal nicht übertakten, bis es "offiziell" funktioniert. Keine Lust hier was abrauchen zu lassen.
 
Zuletzt bearbeitet:
@JiJiB! von welchem partner ist die 2. karte? und von welchem die erste?
 
SiSoftware Sandra

Benchmarkresultate
Latenzzeit Speicher : 178.7ns
Base 10 Ergebnis Multiplikatoren : 1s = 1000ms, 1ms = 1000µs, 1µs = 1000ns, usw.
Gschwindigkeitsfaktor : 3.60
Ergebnisse : Geringere Werte sind besser.

Gegenüberstellung Leistung und Geschwindigkeit
Latenzzeit Speicher : 0.02ns/MHz
Ergebnisse : Geringere Werte sind besser.

Benchmarkabbruch
2kB Bereich : 49.9ns / 73.0clocks
4kB Bereich : 49.9ns / 73.0clocks
8kB Bereich : 49.9ns / 73.0clocks
16kB Bereich : 49.9ns / 73.0clocks
32kB Bereich : 113.6ns / 167.0clocks
64kB Bereich : 138.5ns / 203.0clocks
128kB Bereich : 143.5ns / 211.0clocks
256kB Bereich : 145.7ns / 214.0clocks
512kB Bereich : 147.0ns / 216.0clocks
1MB Bereich : 147.7ns / 217.0clocks
2MB Bereich : 147.9ns / 217.0clocks
4MB Bereich : 168.6ns / 247.0clocks
8MB Bereich : 171.4ns / 252.0clocks
16MB Bereich : 178.7ns / 262.0clocks
32MB Bereich : 178.7ns / 262.0clocks
64MB Bereich : 176.5ns / 259.0clocks
Schnittstelle : CUDA


Leistungsteststatus
Ergebnis-ID : NVIDIA GeForce GTX 980 Ti (2816SP 22C 1.19GHz, 3MB L2, 6GB 7.78GHz 384-bit) (CUDA)
System : ASUS All Series ASUS MB (ASUS X99-S)
Kompatibel mit Plattform : x64
Gesamtspeicher : 128MB
Systemtakt : 595MHz

Schon interessant. Hat noch jemand zb ne R9 290X zum Vergleich?
Ob es an CUDA oder OpenCL liegt ka, ich versuch grad iwi mit OpenCL zu benchen aber bisher scheinen die Speicherlatenzen bei der GTX980 Ti doppelt so gut zu sein. Hier müsste man mal mit ner R9 290X oder 390X vergleichen ob diese langsamen Latenzen HBM bedingt sind.

Die Bandbreite der HBM Karte ist super, hier erreiche ich deutlich weniger:

SiSoftware Sandra

Benchmarkresultate
Gesamtspeicherleistung : 53.15GB/s
Bandbreite interner Speicher : 237.07GB/s
Bandbreite Datentransfer : 11.91GB/s
Ergebnisse : Höhere Werte sind besser.
Base 2 Ergebnis Multiplikatoren : 1GB(/s) = 1024MB(/s), 1MB(/s) = 1024kB(/s), 1kB(/s) = 1024 bytes(/s), usw.

Benchmark Timings
Zum Kopieren benötigte Zeit : 25.31ms
Zum Lesen benötigte Zeit : 489.72ms
Zum Schreiben benötigte Zeit : 517.91ms
Ergebnisse : Geringere Werte sind besser.

Leistung pro Thread
Gesamtspeicherleistung : 2.42GB/s
Bandbreite interner Speicher : 10.78GB/s
Threadanzahl : 22
Ergebnisse : Höhere Werte sind besser.
Base 2 Ergebnis Multiplikatoren : 1GB(/s) = 1024MB(/s), 1MB(/s) = 1024kB(/s), 1kB(/s) = 1024 bytes(/s), usw.

Gegenüberstellung Leistung und Geschwindigkeit
Gesamtspeicherleistung : 8.24MB/s/MHz
Bandbreite interner Speicher : 36.74MB/s/MHz
Bandbreite Datentransfer : 1.85MB/s/MHz
Ergebnisse : Höhere Werte sind besser.

Benchmarkabbruch
Bandbreite interner Speicher : 237.07GB/s
Bandbreiteneffizienz : 76.54%
Bandbreite System zu Gerät : 11.58GB/s
Bandbreiteneffizienz : 74.14%
Bandbreite Gerät zu System : 12.25GB/s
Bandbreiteneffizienz : 78.41%
Schnittstelle : CUDA
Ergebnisse : Höhere Werte sind besser.

Leistungsteststatus
Ergebnis-ID : NVIDIA GeForce GTX 980 Ti (2816SP 22C 1.1GHz/1.7GHz, 3MB L2, 6GB 6.61GHz/7.78GHz 384-bit) (CUDA)
System : ASUS All Series ASUS MB (ASUS X99-S)
Kompatibel mit Plattform : x64
Gesamtspeicher : 6GB
Vom Test verwendeter Speicher : 1GB
Threadanzahl : 1
Systemtakt : 3.22MHz
Ergänzung ()

nospherato schrieb:
Und hier ist das was ich meinte, FuryX Schnittstelle OpenCl und 980ti Cuda :D schlecht vergleichbar...

weiß jemand wie ich mit der GTX 980 TI in OpenCL benche? Bei Rohdaten müsste das schon halbwegs vergleichbar sein oder?
Muss ich das CUDA 7 SDK laden? :D

Edit: Kann natürlich auch sein dass OpenCL bei Win10 noch fehlt?
 
Zuletzt bearbeitet:
sehr cool dann haste auch HBM OpenCL vs GDDR5 OpenCL im Vergleich. Wie gesagt, ich kann mir vorstellen dass Gerade HBM 1 mt dem niedrigen Takt von 500 Mhz noch latenztechnisch krankt.
 
Ergebnisse 290X

Latenz kaputt? GP Treiber Fehler

SiSoftware Sandra

Benchmarkresultate
Gesamtspeicherleistung : 31.65GB/s
Bandbreite interner Speicher : 215.17GB/s
Bandbreite Datentransfer : 4.66GB/s
Typ : D3D 11
Ergebnisse : Höhere Werte sind besser.
Base 2 Ergebnis Multiplikatoren : 1GB(/s) = 1024MB(/s), 1MB(/s) = 1024kB(/s), 1kB(/s) = 1024 bytes(/s), usw.

Benchmark Timings
Zum Kopieren benötigte Zeit : 18.59ms
Zum Lesen benötigte Zeit : 747ms
Zum Schreiben benötigte Zeit : 988ms
Ergebnisse : Geringere Werte sind besser.

Leistung pro Thread
Gesamtspeicherleistung : 11MB/s
Bandbreite interner Speicher : 78MB/s
Threadanzahl : 2816
Ergebnisse : Höhere Werte sind besser.
Base 2 Ergebnis Multiplikatoren : 1GB(/s) = 1024MB(/s), 1MB(/s) = 1024kB(/s), 1kB(/s) = 1024 bytes(/s), usw.

Gegenüberstellung Leistung und Energieverbrauch
Geräteleistung : 250.000W
Gesamtspeicherleistung : 129.65MB/s/W
Bandbreite interner Speicher : 881.32MB/s/W
Bandbreite Datentransfer : 19.07MB/s/W
Ergebnisse : Höhere Werte sind besser.

Gegenüberstellung Kapazität zu Leistung
Speicherkapazität : 16.38MB/W
Ergebnisse : Höhere Werte sind besser.

Gegenüberstellung Leistung und Geschwindigkeit
Gesamtspeicherleistung : 6.48MB/s/MHz
Bandbreite interner Speicher : 44.07MB/s/MHz
Bandbreite Datentransfer : 0.95MB/s/MHz
Ergebnisse : Höhere Werte sind besser.

Benchmarkabbruch
Bandbreite interner Speicher : 215.17GB/s
Bandbreiteneffizienz : 68.85%
Bandbreite System zu Gerät : 4GB/s
Bandbreiteneffizienz : 103.65%
Bandbreite Gerät zu System : 5.35GB/s
Bandbreiteneffizienz : 137.07%
Ergebnisse : Höhere Werte sind besser.

Leistungsteststatus
Ergebnis-ID : AMD Radeon R9 200 Series (44CU 2816SP SM4.1 1GHz, 4GB DDR5 5GHz 512-bit, PCIe 3.00 x16) (D3D 11)
System : MSI MS-7586 (MSI P55-CD53 (MS-7586))
Kompatibel mit Plattform : x64
Gesamtspeicher : 4GB
Vom Test verwendeter Speicher : 509.19MB
Threadanzahl : 1
Systemtakt : 2.61MHz

Grafikkarte
Modell : AMD Radeon R9 200 Series
Treiberversion : 8.17.10.1387
Chipsatz : RX9290
Geschwindigkeit : 1GHz
Minimale/Maximale/Turbo Geschwindigkeit : 300MHz - 1GHz
Geschwindigkeit Shader : 1GHz
Minimale/Maximale/Turbo Geschwindigkeit : 300MHz - 1GHz
Spitzenprozessorleistung (PPP) : 5.8TFLOPS
Eingestellte Spitzenleistung (APP) : 5.22WT
Unified Shader : 2816 Einheit(en)
Kerne pro Prozessor : 44 Einheit(en)
Einheiten Rasteroperationen (ROP) : 64 Einheit(en)
Textur-Mapping-Einheiten (TMU) : 176 Einheit(en)
Maximale Pixel-Füllrate : 65.92GPixel/s
Maximale Textur-Füllrate : 181.28GTexel/s
OEM Hardware Nr. : VEN_1002 DEV_1002 REV_00

Neuester Gerätetreiber
Herstellungsdatum : Montag, 30. März 2015
Update URL : In dieser Version (Lite) nicht verfügbar.

Führen Sie bitte ein Upgrade durch, um diese Funktion zu aktivieren und um weitergehenden Support und andere Vorteile zu erhalten.

(Gehen Sie zu 'Hilfe - Upgrade')

Logische/Chipsatz Speicherbänke
Gesamtspeicher : 4GB DDR5
Speicherbusgeschwindigkeit : 4x 1.25GHz (5GHz)
Maximale Speicherbusbandbreite : 312.5GB/s

Video BIOS
Version : 015.042.000.000
Modell : 113-C6710151_100

Neuestes BIOS
Herstellungsdatum : Samstag, 1. Februar 2014
Update URL : In dieser Version (Lite) nicht verfügbar.

Führen Sie bitte ein Upgrade durch, um diese Funktion zu aktivieren und um weitergehenden Support und andere Vorteile zu erhalten.

(Gehen Sie zu 'Hilfe - Upgrade')

Bus
Typ : PCIe 3.00 x16 2.5Gbps
Maximale Busbandbreite : 3.9GB/s

Leistungstipps
Tipp 223 : Prozessorgeschwindigkeit ist unter Last geringer als erwartete Geschwindigkeit. Prüfen Sie die Energie- bzw. Leistungseinstellungen.
Tipp 1702 : Update für Modul/Dienst/Treiber verfügbar. Um das Update herunterzuladen und zu installieren besuchen Sie die Webseite der Entwickler.
Tipp 1101 : Es ist ein Update für das Video BIOS verfügbar. Besuchen Sie hierzu die Webseite des Herstellers.
Tipp 2 : Drücken Sie die Eingabetaste oder doppelklicken Sie auf einen Tipp, um mehr Informationen zu erfahren.

Also OpenCL Speicherlatenz läuft auf der 290X nicht, gibt's n Fehler.
 
Zuletzt bearbeitet:
Das ist wirklich mal interessant....paar Leute hier bringen interessantere Informationen zusammen, wie sämtliche Onlineportale, welche immer nur nach Schema XY die Sache abhacken!

CUDA oder OpenCL dürfte keinen Einfluss auf Latenz- oder Bandbreitendaten haben.
Und da die Speicherbandbreite zwar bei der FuryX besser ist (auch nicht mal durchgehend), diese aber ja sowieso generell keine Limitierung darstellt, dafür aber die Latenzen so schlecht, welche viel mehr Auswirckungen haben, bekommt man auch schnell und einfach die Begründung, warum die FuryX im Vergleich trotz HBM bzw. eben grade weil mit HBM, nur so "unspektakulär" abschneidet wie sie es halt tut.

Wie schon gesagt, HBM ist einfach nicht ausgereift und in seiner ersten Generation keineswegs profitabel. Sieht man ja auch jetzt gut an den 290er Werten, die ebenfalls viel bessere Latenzen zeigen (warum jetzt auch immer die Werte wieder gelöscht wurden.....).
 
Zuletzt bearbeitet:
Compute Shader Latenz AMD Fury X

SiSoftware Sandra

Benchmarkresultate
Latenzzeit Speicher : 173.6ns
Base 10 Ergebnis Multiplikatoren : 1s = 1000ms, 1ms = 1000µs, 1µs = 1000ns, usw.
Gschwindigkeitsfaktor : 4.60
Ergebnisse : Geringere Werte sind besser.

Gegenüberstellung Leistung und Geschwindigkeit
Latenzzeit Speicher : 0.35ns/MHz
Ergebnisse : Geringere Werte sind besser.

Benchmarkabbruch
2kB Bereich : 38.0ns / 40.0clocks
4kB Bereich : 38.1ns / 40.0clocks
8kB Bereich : 38.1ns / 40.0clocks
16kB Bereich : 38.1ns / 40.0clocks
32kB Bereich : 94.9ns / 100.0clocks
64kB Bereich : 122.6ns / 129.0clocks
128kB Bereich : 135.9ns / 143.0clocks
256kB Bereich : 141.8ns / 149.0clocks
512kB Bereich : 141.8ns / 149.0clocks
1MB Bereich : 145.5ns / 153.0clocks
2MB Bereich : 146.8ns / 154.0clocks
4MB Bereich : 173.6ns / 182.0clocks
8MB Bereich : 173.6ns / 182.0clocks
16MB Bereich : 168.2ns / 177.0clocks
32MB Bereich : 171.0ns / 180.0clocks
Schnittstelle : DX-CS

Leistungsteststatus
Ergebnis-ID : AMD Radeon (TM) R9 Series (4096SP 64C 1GHz, 4GB 500MHz 8192-bit) (DX-CS)
System : ASRock Z77 WS
Kompatibel mit Plattform : x64
Gesamtspeicher : 128MB
Systemtakt : 3.42MHz

Grafikprozessor
Modell : AMD Radeon (TM) R9 Series
Schnittstellenversion : 11.02
Treiberversion : 8.17.10.1387
Geschwindigkeit Shader : 1GHz
Gesamtspeicher : 4GB
Speicherbusgeschwindigkeit : 500MHz
OEM Hardware Nr. : VEN_1002 DEV_7300 REV_C8

Compute Shader Latenz AMD 290X
SiSoftware Sandra

Benchmarkresultate
Latenzzeit Speicher : 194.2ns
Base 10 Ergebnis Multiplikatoren : 1s = 1000ms, 1ms = 1000µs, 1µs = 1000ns, usw.
Gschwindigkeitsfaktor : 10.00
Ergebnisse : Geringere Werte sind besser.

Gegenüberstellung Leistung und Energieverbrauch
Geräteleistung : 250.000W
Latenzzeit Speicher : 0.78ns/W
Ergebnisse : Geringere Werte sind besser.

Gegenüberstellung Kapazität zu Leistung
Speicherkapazität : 16.38MB/W
Ergebnisse : Höhere Werte sind besser.

Gegenüberstellung Leistung und Geschwindigkeit
Latenzzeit Speicher : 0.04ns/MHz
Ergebnisse : Geringere Werte sind besser.

Benchmarkabbruch
2kB Bereich : 19.6ns / 20.0clocks
4kB Bereich : 19.6ns / 20.0clocks
8kB Bereich : 19.6ns / 20.0clocks
16kB Bereich : 21.1ns / 22.0clocks
32kB Bereich : 57.5ns / 59.0clocks
64kB Bereich : 74.9ns / 77.0clocks
128kB Bereich : 85.5ns / 88.0clocks
256kB Bereich : 87.7ns / 90.0clocks
512kB Bereich : 90.2ns / 93.0clocks
1MB Bereich : 147.5ns / 152.0clocks
2MB Bereich : 181.6ns / 187.0clocks
4MB Bereich : 186.9ns / 193.0clocks
8MB Bereich : 186.9ns / 193.0clocks
16MB Bereich : 186.8ns / 192.0clocks
32MB Bereich : 190.5ns / 196.0clocks
64MB Bereich : 194.2ns / 200.0clocks
Schnittstelle : DX-CS

Leistungsteststatus
Ergebnis-ID : AMD Radeon R9 200 Series (2816SP 44C 1GHz, 4GB DDR5 5GHz 512-bit) (DX-CS)
System : MSI MS-7586 (MSI P55-CD53 (MS-7586))
Kompatibel mit Plattform : x64
Gesamtspeicher : 128MB
Systemtakt : 2.61MHz

Grafikprozessor
Modell : AMD Radeon R9 200 Series
Schnittstellenversion : 11.00
Treiberversion : 8.17.10.1387
Kerne pro Prozessor : 1 Einheit(en)
Geschwindigkeit Shader : 1GHz
Gesamtspeicher : 4GB
Speicherbusgeschwindigkeit : 1.25GHz
OEM Hardware Nr. : VEN_1002 DEV_67B0 REV_00
 
Es ist interessant, dass die maximale Auslastung der Peak-Bandbreite bei HBM je nach Benchmark von circa 60 \% bis 70 \% deutlich niedriger als bei GDDR5 ist, wo man Auslastungen von 80 \% bis 90 \% erzielen kann. Und das obwohl man die Auslastung der Peak-Bandbreite durch Single-Bank-Refresh eigentlich erhöhen wollte.
Eventuell ist es aber auch nur ein Problem mit den Benchmarks. . . . .
 
980 TI Compute Shader Latenzen

SiSoftware Sandra

Benchmarkresultate
Latenzzeit Speicher : 170.8ns
Base 10 Ergebnis Multiplikatoren : 1s = 1000ms, 1ms = 1000µs, 1µs = 1000ns, usw.
Gschwindigkeitsfaktor : 3.50
Ergebnisse : Geringere Werte sind besser.

Gegenüberstellung Leistung und Geschwindigkeit
Latenzzeit Speicher : 0.03ns/MHz
Ergebnisse : Geringere Werte sind besser.

Benchmarkabbruch
2kB Bereich : 49.1ns / 54.0clocks
4kB Bereich : 49.1ns / 54.0clocks
8kB Bereich : 49.1ns / 54.0clocks
16kB Bereich : 49.1ns / 54.0clocks
32kB Bereich : 112.6ns / 124.0clocks
64kB Bereich : 135.9ns / 150.0clocks
128kB Bereich : 141.2ns / 156.0clocks
256kB Bereich : 143.4ns / 158.0clocks
512kB Bereich : 144.6ns / 159.0clocks
1MB Bereich : 145.1ns / 160.0clocks
2MB Bereich : 145.3ns / 160.0clocks
4MB Bereich : 168.8ns / 186.0clocks
8MB Bereich : 168.8ns / 186.0clocks
16MB Bereich : 170.8ns / 188.0clocks
32MB Bereich : 170.8ns / 188.0clocks
64MB Bereich : 169.8ns / 187.0clocks
Schnittstelle : DX-CS

Leistungsteststatus
Ergebnis-ID : NVIDIA GeForce GTX 980 Ti (2816SP 22C 1.1GHz/1.7GHz, 3MB L2, 6GB 6.61GHz/7.78GHz 384-bit) (DX-CS)
System : ASUS All Series ASUS MB (ASUS X99-S)
Kompatibel mit Plattform : x64
Gesamtspeicher : 128MB
Systemtakt : 3.22MHz

Grafikprozessor
Modell : NVIDIA GeForce GTX 980 Ti
Schnittstellenversion : 11.02
Treiberversion : 10.18.13.5338
Geschwindigkeit Shader : 1.1GHz
Gesamtspeicher : 6GB
Speicherbusgeschwindigkeit : 3.3GHz
OEM Hardware Nr. : VEN_10DE DEV_17C8 REV_A1

Vergleichbar würde ich sagen, schenkt sich so nich viel. Müsste Nai was zu sagen.
 
Open CL mit GTX 970 SSC+


SiSoftware Sandra

Benchmarkresultate
Latenzzeit Speicher : 291.5ns
Base 10 Ergebnis Multiplikatoren : 1s = 1000ms, 1ms = 1000µs, 1µs = 1000ns, usw.
Gschwindigkeitsfaktor : 1.10
Ergebnisse : Geringere Werte sind besser.

Gegenüberstellung Leistung und Energieverbrauch
Geräteleistung : 145.000W
Latenzzeit Speicher : 2.01ns/W
Ergebnisse : Geringere Werte sind besser.

Gegenüberstellung Kapazität zu Leistung
Speicherkapazität : 28.25MB/W
Ergebnisse : Höhere Werte sind besser.

Gegenüberstellung Leistung und Geschwindigkeit
Latenzzeit Speicher : 0.05ns/MHz
Ergebnisse : Geringere Werte sind besser.

Benchmarkabbruch
2kB Bereich : 264.4ns / 314.0clocks
4kB Bereich : 264.4ns / 314.0clocks
8kB Bereich : 263.4ns / 313.0clocks
16kB Bereich : 262.9ns / 313.0clocks
32kB Bereich : 262.7ns / 312.0clocks
64kB Bereich : 262.8ns / 312.0clocks
128kB Bereich : 262.8ns / 312.0clocks
256kB Bereich : 262.8ns / 312.0clocks
512kB Bereich : 262.8ns / 312.0clocks
1MB Bereich : 262.9ns / 313.0clocks
2MB Bereich : 273.9ns / 326.0clocks
4MB Bereich : 289.0ns / 344.0clocks
8MB Bereich : 291.5ns / 347.0clocks
16MB Bereich : 291.5ns / 347.0clocks
32MB Bereich : 290.1ns / 345.0clocks
64MB Bereich : 291.4ns / 347.0clocks
Schnittstelle : OpenCL

Leistungsteststatus
Ergebnis-ID : NVIDIA GeForce GTX 970 (1664SP 13C 1.19GHz/1.53GHz, 1.8MB L2, 4GB 6GHz/7GHz 256-bit) (OpenCL)
System : ASUS All Series ASUS MB (ASUS MAXIMUS VII HERO)
Kompatibel mit Plattform : x64
Gesamtspeicher : 128MB
Systemtakt : 1MHz

Grafikprozessor
Modell : NVIDIA GeForce GTX 970
Schnittstellenversion : 1.02.05.02
Treiberversion : 353.30
Kerne pro Prozessor : 1 Einheit(en)
Geschwindigkeit Shader : 1.19GHz
Spitzenprozessorleistung (PPP) : 4.47TFLOPS
Eingestellte Spitzenleistung (APP) : 4WT
Gesamtspeicher : 4GB
Speicherbusgeschwindigkeit : 3GHz
OEM Hardware Nr. : VEN_10DE DEV_13C2 REV_A1

---------

Computer Shader:

SiSoftware Sandra

Benchmarkresultate
Latenzzeit Speicher : 202.9ns
Base 10 Ergebnis Multiplikatoren : 1s = 1000ms, 1ms = 1000µs, 1µs = 1000ns, usw.
Gschwindigkeitsfaktor : 3.90
Ergebnisse : Geringere Werte sind besser.

Gegenüberstellung Leistung und Energieverbrauch
Geräteleistung : 145.000W
Latenzzeit Speicher : 1.40ns/W
Ergebnisse : Geringere Werte sind besser.

Gegenüberstellung Kapazität zu Leistung
Speicherkapazität : 27.81MB/W
Ergebnisse : Höhere Werte sind besser.

Gegenüberstellung Leistung und Geschwindigkeit
Latenzzeit Speicher : 0.03ns/MHz
Ergebnisse : Geringere Werte sind besser.

Benchmarkabbruch
2kB Bereich : 52.5ns / 62.0clocks
4kB Bereich : 52.5ns / 62.0clocks
8kB Bereich : 52.5ns / 62.0clocks
16kB Bereich : 52.5ns / 62.0clocks
32kB Bereich : 119.1ns / 142.0clocks
64kB Bereich : 138.6ns / 165.0clocks
128kB Bereich : 144.0ns / 171.0clocks
256kB Bereich : 146.1ns / 174.0clocks
512kB Bereich : 147.3ns / 175.0clocks
1MB Bereich : 147.7ns / 176.0clocks
2MB Bereich : 166.2ns / 198.0clocks
4MB Bereich : 173.3ns / 206.0clocks
8MB Bereich : 202.9ns / 241.0clocks
16MB Bereich : 202.9ns / 241.0clocks
32MB Bereich : 176.4ns / 210.0clocks
64MB Bereich : 175.8ns / 209.0clocks
Schnittstelle : DX-CS

Leistungsteststatus
Ergebnis-ID : NVIDIA GeForce GTX 970 (1664SP 13C 1.19GHz/1.53GHz, 1.8MB L2, 4GB 6GHz/7GHz 256-bit) (DX-CS)
System : ASUS All Series ASUS MB (ASUS MAXIMUS VII HERO)
Kompatibel mit Plattform : x64
Gesamtspeicher : 128MB
Systemtakt : 3.9MHz

Grafikprozessor
Modell : NVIDIA GeForce GTX 970
Schnittstellenversion : 11.02
Treiberversion : 10.18.13.5330
Kerne pro Prozessor : 1 Einheit(en)
Geschwindigkeit Shader : 1.19GHz
Gesamtspeicher : 4GB
Speicherbusgeschwindigkeit : 3GHz
OEM Hardware Nr. : VEN_10DE DEV_13C2 REV_A1
 
Zuletzt bearbeitet:
JiJiB! schrieb:
Kleines Update: Hab jetzt noch eine Sapphire Fury X besorgt. Diese hat kein nerviges Pumpengeräusch mehr.
Anhang anzeigen 501103

Das ist doch schon mal sehr gut :daumen: wird immer besser wenn die Pumpengeräusche weg sind.
 
Krautmaster schrieb:
Schon interessant. Hat noch jemand zb ne R9 290X zum Vergleich?
Ob es an CUDA oder OpenCL liegt ka, ich versuch grad iwi mit OpenCL zu benchen aber bisher scheinen die Speicherlatenzen bei der

haB ne 290x von sapphire.
aber mit dem hotFix treiber für HDMI problme

wo bzw. soll i noch testen? und natürlich wo und wie mach ich das? sandra hab i nicht mehr drauf. (oh icxh hasse diesen namen)
 
Mal ein Vorschlag an alle mit den Benchmarks:

Bitte Tabellen benutzen! Dafür sind die da und die erleichtern die Lesbarkeit extrem!

z.B.

[TABLE="class: grid, width: 500, align: center"]
[TR]
[TD]980 Ti
[/TD]
[TD]R9FX
[/TD]
[/TR]
[TR]
[TD][/TD]
[TD][/TD]
[/TR]
[TR]
[TD][/TD]
[TD][/TD]
[/TR]
[/TABLE]
 
Zurück
Oben