Ob die Speicherbandbreite außreichend ist liegt nicht nur daran, wie viel die GPU weghauen kann sondern auch daran welche Berechnungen durchgeführt werden sollen. Bei einem FFT Kernel der klassischerweise eher memory-bound ist bringt es dir gar nicht, wenn deine GPU 20 TFLOPs durchführen kann, dein Speicherinterface aber auf 200 GB/s beschränkt ist. Du wirst mit dieser Karte langsamer sein, als mit einer anderen die nur 10 TFLOPs kann, dafür aber ihren Speicher mit 300 GB/s angebunden hat.
Schau dir zB mal diesen Benchmark an:
Hier wurde ein FFT Kernel sowohl mit einer K20 (Kepler) wie auch mit einer C2070 (Fermi) durchgeführt.
Wie man sieht ist die Kepler Karte grob abgelesen ca. 1,5 mal schneller. Ihre Rechenleistung ist aber 3,4 (SP) bzw. 2,2 (DP) so hoch. Wieso also nur 1,5 facher Leistungszuwachs?
Schauen wir uns das Speicherinterface an, sehen wird dass die eine Karte 208 GB/s und die andere 144 GB/s schafft. Entspricht also einem Zuwachs von etwa 44% also fast genau dem, was die Kepler-karte schneller geworden ist.
Anhand dieses Beispiels kann man eigentlich ganz gut zeigen, dass heutige GPUs sehr wohl durch ihr Speicherinterface begrenzt werden können.
Und bezüglich Dual GPU hast du mich vllt. falsch verstanden. Die Bandbreite des internen Speichers ist da nicht so entscheidend für den Flaschenhals, weil der sowieso doppelt für beide GPUs ausgelegt wurde. Aber irgendwie musst du die Daten auch erst mal auf die GPU bekommen und über PCIe 3 bekommst du maximal 15,3 GB/s rüber, die sich beide GPUs dann teilen müssen. Wenn du jetzt große Datenmengen zu verschieben hast, dann wartest du einfach mal ein paar 100 ms ohne dass überhaupt irgendwas berechnet wurde. Und bei einer Dual GPU im Extremfall eben doppelt so lange.
Jetzt stellt sich die Frage hat man überhaupt so viele Daten. Die Antwort lautet: Ja
Gerade dann wenn viele Berechnungen anstehen lohnt sich der Einsatz einer GPU. Bei wenigen Berechnungen lohnt es sich meist nicht, da die CPU schneller mit den Berechnungen fertig ist als es überhaupt dauert die Daten auf den Grafik-RAM zu schieben. Ergo haben wir gerade dann wenn es günstig ist eine Grafikkarte einzusetzen auch ein erhöhtes Datenaufkommen und hier kann der PCIe durchaus zum limitierenden Faktor werden, gerade wenn zwei GPUs auf einem PCB sitzen.
Bei der USV hab ich einfach den Dieselgenerator dazugezählt ... ja is eigentlich nicht korrekt, aber was solls