DP-Performance von AMD Firestream
Moderne Grafikkarten bieten eine bemerkenswerte Performance, die nicht nur bei Spielen gefragt ist. Dementsprechend ist es nicht verwunderlich, dass sowohl Nvidia als auch AMD Software-Entwicklungskits (SDK) bereitstellen, um die Shader-Prozessoren auch für wissenschaftliche Aufgaben zu nutzen.
Die eigens dafür entwickelte Hardware-Lösung trägt bei Nvidia den Namen Tesla; die Programmierschnittstelle hört auf CUDA. AMD hat das Kind FireStream getauft und programmiert das Ganze mittels Compute Abstraction Layer (CAL). Allgemein lautet die Bezeichnung GPGPU (General Purpose Computation on Graphics Processing Unit).
Um auch für den Einsatz in Supercomputern (High Performance Computing, HPC) interessant zu sein, kommt es auf eine hohe Ausführungsgeschwindigkeit von Floating-Point-Algorithmen an, die mit Double Precision (DP, 64 Bit) arbeiten. AMDs RV670-basierte FireStream 9170 mit 2 GB Speicher ist die erste „Grafikkarte“, die mit Support für doppelte Genauigkeit bei Fließkommaoperationen umworben wird und sich einer großen Beliebtheit erfreut.
AMD gibt an, dass die 9170 eine Leistung von 500 GFLOPS bei Single Precision (SP) bietet. Bisher wurde angenommen, dass sich die Performance unter Einsatz von DP auf die Hälfte reduziert. Dem ist jedoch nicht so, wie Giuseppe Amato, Technical Director bei AMD, im Gespräch auf der CeBIT verriet. Demnach hat die Karte unter DP eine Performance von bis zu 350 GFLOPS. Zum Vergleich: Intels mit 3 GHz getakteter Quad-Core-Prozessor Core 2 Extreme QX9650 besitzt eine Peak-Performance von etwa 48 GFLOPS (Double Precision, Add und Mul).
So schön das alles auch klingt, heutige Grafikkarten haben nur ein sehr eingeschränktes Programmiermodell und eignen sich daher nur zum Ausführen sehr spezieller Algorithmen. Intel dagegen möchte diesem Problem mit dem Many-Core-Projekt Larrabee begegnen, welches auf x86 basieren soll.
Bei der Angabe der Double-Precision-Leistung hat es offenbar ein Missverständnis gegeben. AMD hat uns soeben darüber informiert, dass die Firestream 9170-Beschleunigerkarte eine DP-Performance von 102 GFLOPS bietet. Bei Single Precision sind es dagegen sogar 512 GFLOPS.