Nvidia zeigt Tesla-„Fermi“-Grafikkarten
Nvidia hat heute die ersten Tesla-„Fermi“-Grafikkarten und passende 1U-Racksysteme für GPU-Computing vorgestellt. In den Racks verrichten jeweils vier der Fermi-GPUs ihre Arbeit. Das Ziel der neuen Produkte ist dabei eindeutig: Nvidia möchte einen Teil des Supercomputer-Marktes erobern und setzt dabei auf Kosteneffizienz.
Um den Anforderungen des Marktes gerecht zu werden, hat man einige Änderungen an den GPUs vorgenommen. So wurde der Shared Memory von 16 auf 64 KByte aufgestockt und dem Chip ein L1- und L2-Cache spendiert. Zudem beherrschen alle internen und externen Speicher nun die Fehlerkorrektur ECC. Letztere sind vom Typ GDDR5 und können bis zu einem Terabyte groß sein. Fermi hat darüber hinaus als erste GPU überhaupt eine komplette Unterstützung von C++ erhalten und führt Gleitkommaberechnungen mit einfacher und doppelter Genauigkeit gemäß IEEE 754-2008 aus.
Hielt man mit Informationen bezüglich der Leistung bisher noch im Verborgenen, gibt es nun auch hierzu erste Zahlen von Nvidia: Die Tesla C2050 mit 3 GByte ECC-Speicher und die Tesla C2070 mit 6 GByte bringen es demnach bei doppelter Genauigkeit auf eine Gleitkommaleistung zwischen 520 und 630 GigaFLOPS. Nimmt man das aktuelle Spitzenmodell Tesla C1060 mit 4 GByte Speicher zum Vergleich, steht dem eine Leistung von lediglich 78 GigaFLOPS gegenüber. Deutlich höher fällt natürlich die Leistung der Rackcenter-Systeme Tesla S2050 und Tesla S2070 aus, in denen jeweils vier der GPUs mit drei bzw. sechs GByte Speicher je GPU ihren Dienst verrichten: sie sollen bei doppelter Genauigkeit eine Leistung zwischen 2,1 und 2,5 TeraFLOPS erreichen.
Interessant wird es beim Preisvergleich mit CPU-basierten Supercomputern, denn bei Nvidia sieht man im direkten Vergleich auch einen deutlichen Kostenvorteil für GPU-basierte Supercomputer. Das schwächste System der letzten Top500-Liste soll bei einer Leistung von 17 TeraFLOPS im Linpack-Benchmark eine Million US-Dollar kosten. Dem stellt Nvidia ein Tesla-System mit gleicher Leistung gegenüber, welches lediglich 250.000 US-Dollar kosten soll. Für eine Million sei entsprechend ein Leistungssprung auf 68 TeraFLOPS möglich. Sieht man sich die Leistungsentwicklung der letzten Jahre an, wird auch klar, warum dies so ist: Während im CPU-Bereich bei der Gleitkommaleistung und der Speicherbandbreite nur eine geringe Steigerung zu verbuchen ist, konnten beide Werte im GPU-Bereich enorm gesteigert werden. Falls sich dieser Trend fortsetzt, sind in Zukunft also weitere Kostenvorteile für die GPU-Fraktion zu erwarten.
Die Leistungsunterschiede zwischen CPUs und GPUs hängen jedoch auch vom jeweiligen Anwendungsgebiet ab. So reklamiert Nvidia beispielsweise bei der Berechnung der Wellenausbreitung in seismischen Prozessen, bei Finanzberechnungen und auf dem Gebiet der Molekulardynamik deutliche Leistungsvorteile für seine Tesla-GPUs. Auch einen Vorgeschmack auf die Leistungsaufnahme der kommenden Desktop-Pendants gibt es. Für die C2050 und die C2070 gibt Nvidia eine typische Leistungsaufnahme von 190 Watt und einen Maximalwert von 225 Watt an. Die Rack-Versionen verbrauchen mit 900 (typisch) respektive 1.200 Watt (maximal) entsprechend mehr.