Ein Klasse Test. Danke.
Ich habe aber einige Fragen.
OpenCL/GPGPU Benchmarks:
Viele in OpenCL geschriebene Programme versuchen es zu vermeiden, Speicher vom Host zum Device (Host sind in diesem Kontext die CPU/RAM und Device die GPU), denn die Rechengeschwindigkeiten der GPUs gegenüber der CPU sind nur dann sinnvoll nutzbar, wenn die Speichertransfers möglichst gering gehalten werden. Software, die also numerische Modellierungen auf die GPU auslagert, wäre demnch implizit schon dergestalt optimiert, daß die Transfers kaum ins Gewicht fallen.
Wie schaut es denn bei den verwendeten Benchmarks aus? Meines Wissens ist das Ziel der OpenCL Benchmarks die Vermessung der GPU, nicht des Interfaces.
Die Einführung der Sandy-Bridge-E CPUs stand unter keinem guten PCIe 3.0-Stern, hatte Intel doch große Probleme mit der Evaluierung. Bis heute ist nicht bekannt, ob an den Gerüchten, daß der PCIe 3.0-Rootkomplex der CPU in den E-Typen defekt sei, etwas dran ist. Indizien sprechen eher dafür, denn es gibt Probeleme mit den E5-XEON Prozessoren und PCIe 3.0. Deshalb, so sagt man, hat XEON Phi auch nur PCIe 2.0 und nVidia läst seine neuen Kepler-basierten K20 trotz PCIe 3.0 Hardware nur auf PCIe 2.0/2.1 in Betrieb nehmen.
Wenn ich nun lediglich die PCIe 3.0 und PCIe 2.0/2.1 Messungen nebeneinander sehen würde, könnte man den Eindruck gewinnen, daß selbst bei offiziellem PCIe 3.0 lediglich intern 2.0 genutzt wird. Letztlich könnte man das nur dann sicher ausschließen, wenn man 100% sicher ist, daß auf beiden Seiten die PCIe 3.0 Speizifikation zur Anwendung kommt.
Im Vergleich mit PCIe 1.0 aber zeigt sich dann in den meisten Tests - selbst bei den meisten GPGPU-Benchmarks, daß das neue Interface wenig Beitrag zu leisten vermag - das ist natürlich so nicht haltbar, wenn obiges bzgl. OpenCL-Anwendungen Gesagte zutreffen sollte. Zumindest deutet der OpenCL CAPS Test soetwas an. Dann allerdings ist der Unterschied zwischen PCIe 2.0 und 3.0 doch mit knappen 10% eher sehr gering und würde doch die neue technik ad absurdum führen, wenn dann nicht der weitere Verdacht bestünde, daß die Zielhardware zwar ein nach PCIe 3.0 spezifiziertes Interface ausweist, intern die GPU aber lediglich PCIe 2.0 Bandbreite nutzen kann.
Auf der letztjährigen CES gab es laut einigen Berichten ja bereits X79-Platinen mit PCIe 3.0. Auch wurden PCIe 3.0-Platinen für den LGA2011 gezeigt, die seinerzeit nur mit einem Sandy-Bridge für den Hausgebrauch (LGA1556) bestückt werden konnten. Dort zeigte sich aber bei PCIe-SSD Geräten, daß Dank der viel engeren Toleranzen und der qualitativ besseren Hardware für PCIe 3.0 selbst PCIe 2.0 hardware bis zu 10% Mehrleistung schaffte - einfach elektrisch, ohne daß jetzt wirklich PCIe 2.0 Protokolle gefahren wurden.
Und genau das hinterläßt bei mir bezüglich der OpenCL-GPGPU-Tests, die offenbar die Host-Device-Bandbreite dann doch testen (CAP Test), ein verzerrtes Bild. Wäre nur ein Sandy-Bridge-E Mainboard mit X79 zum Einsatz gekommen, hätte ich böswillig gemutmaßt, daß PCIe 3.0 drauf steht, hinter den Kulissen aber seitens Intel nur PCIe 2.0 genutzt/geschaltet wird. Ich nehme mal an, das ist bei den aktuellen LGA155-Ivy-Bridges nicht der Fall und sie gelten als "repariert". Dann bleibt nur, daß die Graphikkartenhardware gar nicht darauf ausgelegt ist bzw. ausgelegt werden kann, die PCIe-3.0 Hardware wirklich nutzbar zu machen.
Und jetzt ist die Gretchenfrage, was man eigentlich zeigen will. Hier war es, ob Graphikkarten von PCIe 3.0 profitieren - ich würde sagen, es dauert noch das eine oder andere Jahr, bis das der Fall ist.
Mich persönlich würde es brennend interessieren, inwieweit PCIe 3.0 überhaupt nutzbar ist - einerseits mit den aktuellen Prozessoren, die angeblich PCIe 3.0 können sollen und wiederum mit entsprechender Hardware, die davon den größten Nutzen ziehen sollte. Und da fällt mir eigentlich nur ein Vergelich ein, der moderne SAS 2.0 Controller mit PCIe 3.0 heranzieht, die komplett mit den schnellsten SSDs bestückt sind. Es ist bekannt, daß der derzeit schnellste und günstigste SAS-fähige Chip, ein Chip von LSI Logic, mit entsprechenden SSDs den SAS 2.0 Peer-to-Peer "Bus" (eigentlich darf man das ja nicht Bus nennen) sättigen kann. Damit könnte man doch auch einen Test fahren, um zu sehen, ob sich zumindest in Fragen der Latenzen PCIe 2.0 und PCIe 3.0 unterscheiden.
Ich bin jedenfalls etwas verwirrt. Ich meine damit, man schaue sich doch die Preise aktueller Platinen an: 100 Euro und präzise/empfindliche Technik? Workstationmainboards namhafter Hersteller (und damit meine ich NICHT ASUS!) bewegen sich mit qualitativ höchstwertiger Hardware (Supermicro, als Beispiel, oder die produkte, die EVGA an Kunden im Auftrage liefert, von denen der Massenmarkt allerdings selten etwas mitbekommt). Sehr interessant wäre dann die Fragestellung, was denn wirklich ein "Enthusiastenmainboard" der 300 - 400 Euro Klasse im Vergleich zu den sich in ähnlichen Preisregionen bewegenden professionellen Workstationmainboards wert ist. Ich hege trotz aller vollmundiger Werbeversprechungen und "Solid Capacitor"-Schummeltexten meine Zweifel und würde das gerne mal in einem Test verifiziert - oder im Idelafalle - falsifiziert sehen.