Nai's Benchmarkthread

Re

Also ich meine zu wissen das es bei XP noch ging , aber ob dannach noch die Windows GUI noch was im VRAM Ablegt kann ich dir nicht sagen

Es soll wohl noch folgende Methoden geben

1. DWM Deaktivieren die belegt auch VRAM
2. die IGPU als Primär verwenden so das die Ded. GPU sowohl auch der VRAM von nicht beeinflusst werden kann , ist aber eben sehr aufwendig

mfg.
Ergänzung ()

Melchior schrieb:
im Netz finde ich immer nur Anleitungen mit der nur das Fenster vergrößert wird. Task-Leiste bleibt.

Sieht das dann so aus wie in Bild 4 ?

http://techzend.com/cmd-full-screen-windows-81/

mfg.
 
Zuletzt bearbeitet:
Ja genau so siehts bei mir dann aus. Hab diese Anleitung gestern probiert.

Na mal abwarten - wollte nur mal testen
 
Dieses "Performance Loch" erscheint bei mir schon früher als bei den anderen und bei 3,5 ist es wieder anders ?
hennich schrieb:
...
L2 cache bandwidth of chunk no. 21 (2688 MiByte to 2816 MiByte):433.81 GByte/s
L2 cache bandwidth of chunk no. 22 (2816 MiByte to 2944 MiByte):217.22 GByte/s
L2 cache bandwidth of chunk no. 23 (2944 MiByte to 3072 MiByte):78.01 GByte/s
L2 cache bandwidth of chunk no. 24 (3072 MiByte to 3200 MiByte):78.01 GByte/s
L2 cache bandwidth of chunk no. 25 (3200 MiByte to 3328 MiByte):78.02 GByte/s
L2 cache bandwidth of chunk no. 26 (3328 MiByte to 3456 MiByte):156.07 GByte/s
L2 cache bandwidth of chunk no. 27 (3456 MiByte to 3584 MiByte):433.84 GByte/s
L2 cache bandwidth of chunk no. 28 (3584 MiByte to 3712 MiByte):217.22 GByte/s
L2 cache bandwidth of chunk no. 29 (3712 MiByte to 3840 MiByte):13.08 GByte/s
Drücken Sie eine beliebige Taste . . .
[/Spoiler]
 
So ich habe mal eine Diskussion des Benchmarks in den Eröffnungspost noch eingebaut, falls es noch jemanden interessiert.

@ Hennich: Das hat etwas mit dem Swapping zu tun. CUDA belegt als letztes die Bereiche die bereits reserviert sind. Dementsprechend kommt das Loch bei dir früher. Allerdings wird die Performance dann für die Speicherbereiche von 3456 MiByte bis 3712 MiByte wieder etwas besser. Wahrscheinlich weil die GPU die Pages des Benchmarks, die sich in einem mehrfach belegten Speicherbereich befinden, für das Benchmark in den DRAM der GPU wieder hochlädt.
 
Zuletzt bearbeitet:
kisser schrieb:
Gibt´s auch eine 32Bit-Version von dem Programm?

Ich weiß ja nicht, ob das noch was wird mit der 32 Bit Version, hätte da aber noch eine andere Frage.

Meinem Verständnis nach ist der Benchmark ein reiner Lesebenchmark, gibt also an, wie schnell aus den zuvor allozierten Speicherbereichen gelesen wird.
Lässt sich ohne größeren Aufwand auch ein Schreibbenchmark programmieren?
 
Danke!!

Alles ok auf der 750Ti.
Beim ersten Durchlauf waren noch 181MB Grafikspeicher belegt, der letzte Block war langsamer. Nach dem Beenden des Benches waren nur noch 98MB belegt, so dass beim 2. Durchlauf nicht mehr geswappt wurde.

OS ist Vista 32Bit.
 

Anhänge

  • GTX750Ti.jpg
    GTX750Ti.jpg
    249,4 KB · Aufrufe: 555
Nai schrieb:
CUDA konnte sich allerdings nur 3840 MiByte allozieren. Das heißt 256 MiByte konnten durch das Benchmark nicht untersucht werden. Wahrscheinlich liegen diese 256 MiByte im schnellen DRAM-Segment und sind ein Teilrest, da sich das Benchmark nur 128 MiByte große Blöcke alloziert.

Ist es möglich das die 256mb für CUDA/Physx-Anwendungen fest reserviert sind und somit nicht alloziert werden können?

Video games supporting hardware acceleration by PhysX can be accelerated by either a PhysX PPU or a CUDA-enabled GeForce GPU (if it has at least 256MB of dedicated VRAM), thus offloading physics calculations from the CPU, allowing it to perform other tasks instead
Quelle

Habe dazu jetzt auch nicht mehr gefunden.
 
Zuletzt bearbeitet:
Das bedeutet nur, dass Physx auf GPUs nur läuft auf Karten mit 256MB RAM und mehr.

Bei meinem Benchmark oben mit der 750Ti waren nur 128MB nicht belegbar durch den Benchmark. Die waren da wohl fest reserviert (evtl. durch Windows?).

Der Bench hat aber den Rest des Speichers (1920MB) freigeschaufelt.
Vor dem ersten Durchlauf waren 181MB RAM in Benutzung, nach dem Bench nur noch 98MB (und nach dem 2. Durchlauf des Benches sogar nur noch 81MB).

Ich hatte übrigens nichts an Windows deaktiviert (Aero, DWM).
 
bei panda wird der 64bit bench als virus erkannt.

Also es ist *definitiv* kein Virus. Leider kenne ich mit mit der Softwareentwickling zu schlecht aus, um zu wissen, wie man diese False-Positives bei Virenscannern vermeidet. Falls du mir nicht glaubst, dann kannst du es gern selbst kompilieren.

Ich dachte das Googlen von DLLs wäre allgemein bekannt . . . . Wie dem auch sei, habe das mal mit in den Eröffnungspost getan.

Ist es möglich das die 256mb für CUDA/Physx-Anwendungen fest reserviert sind und somit nicht alloziert werden können?
Physix auf keinen Fall. Wie bereits erwähnt: Wahrscheinlich sind das OS, der Treiber andere Programme oder die GPU selbst dafür verantwortlich. Denn alle das kann potentiell Speicher auf der GPU belegen, der nicht ausgelagert werden kann oder darf. Ein möglicher Kandidat dafür ist zum Beispiel die Primary Surface (siehe CUDA C Programming Guide). Was genau für die 250 Megabyte verantwortlich ist, kann man ohne "reverse Engineering" nicht sagen, da NVIDIA keine Dokumentationen diesbezüglich veröffentlicht oder Untersuchungen ermöglicht.
 
tnoay schrieb:
bei panda wird der 64bit bench als virus erkannt.

Ich habe auch Panda und da wird der Benchmark nicht als Virus erkannt, vielleicht ist ja Deine Grafikkarte der Virus :evillol:


@Nai

Normal soll man soll man ja eigentlich in das System mit der iGpu booten um den Vram Speicher der dezidierten Graka freizuhalten bevor man den Benchmark von Dir durchführt, gibt es da auch noch eine andere Möglichkeit, weil ich habe ja einen Xeon somit fällt die iGpu bei mir weg. Oder ist das dann nicht möglich, ansonsten wird doch das Ergebnis verfälscht, Oder ?

Screenshot Nai Benchmark:

Nai Benchmark 1 GTX 970 @Zotac2012.jpg Nai Benchmark 2 GTX 970 @Zotac2012.jpg
 
Zuletzt bearbeitet:
So hab jetzt einmal den Benchmark auf meiner 970 laufen lassen, sieht so aus als würde es schon ab 3GB bergab gehen ?

moasvx.png
 
Zysor schrieb:
So hab jetzt einmal den Benchmark auf meiner 970 laufen lassen, sieht so aus als würde es schon ab 3GB bergab gehen ?

Anhang anzeigen 471827

Hi, bei meiner Zotac Omega ist es auch bis 3072 MB normal, dann geht es runter.
 
@Zysor / @Melchior

Das liegt daran, das schon Daten vom BS beim Booten in den Vram geladen werden, wenn Ihr genau sehen wollt, ab wann die Leistung einbricht, müßtet Ihr mit einer internen GPU [iGPU] in das Betriebssystem Booten und dann den Test von Nai durchführen. Da ich bei meinem Xeon leider keine iGPU habe, konnte ich auch nur den Test mit bereits geladenen Vram machen.

mfg Zotac2012
 
Lest euch halt bitte zuerst die Diskussion im Eröffnungspost durch. Da habe ich das doch ausführlich beschrieben, wieso es schon bei 3 GiByte losgeht.

Oder ist er Eröffnungspost nicht nachvollziehbar oder leicht verständlich geschrieben? Wenn ja, dann kann ich die Teile überarbeiten . . . .

Normal soll man soll man ja eigentlich in das System mit der iGpu booten um den Vram Speicher der dezidierten Graka freizuhalten bevor man den Benchmark von Dir durchführt, gibt es da auch noch eine andere Möglichkeit, weil ich habe ja einen Xeon somit fällt die iGpu bei mir weg. Oder ist das dann nicht möglich, ansonsten wird doch das Ergebnis verfälscht, Oder ?

In der aktuellen Version kann man die Unterschiede zwischen Swapping und langsames Segment halbwegs gut unterscheiden, da beim Swapping kein L2-Caching stattfindet. Im langsamen Segment ist die L2-Cache-Größe 256 KiByte groß. Ansonsten circa 1800 kibyte. Deshalb ist es, falls es nur darum geht das Vorhandensein und die etwaige Größe des langsamen Segments festzustellen, unerheblich. Falls du aber möglichst viel von dem DRAM deiner GPU benchen willst, dann ist es vorteilhaft das Benchmark mit leerem DRAM auszuführen.
 
Zuletzt bearbeitet:
Kann ich leider auch nicht testen, da mein 3930k keine iGPU besitzt.
Aber danke für die Antwort.
 
Zurück
Oben