Tesla K80: Dual-Kepler mit bis zu 8,7 TFLOPS für Superrechner

Michael Günsch
42 Kommentare
Tesla K80: Dual-Kepler mit bis zu 8,7 TFLOPS für Superrechner
Bild: Nvidia

Ein Jahr ist vergangen, seitdem Nvidia mit der Tesla K40 das bis heute amtierende Flaggschiff im Bereich der GPU-basierten Beschleunigerkarten für Hochleistungsrechner vorstellt hat. Seit heute nimmt die Tesla K80 mit bis zu 8,7 TeraFLOPS bei einfacher und 2,9 TeraFLOPS bei doppelter Genauigkeit den Spitzenplatz ein.

Die Tesla K80 verfügt wie zuvor angenommen über zwei Grafikchips vom Typ GK210. Sie basieren auf der Kepler- und nicht auf der neuen Maxwell-Architektur. Die Zahl der Shadereinheiten beläuft sich auf 2.496 pro Chip und entspricht damit der beschnittenen GK110-GPU der Tesla K20. Die 384 Bit breite Speicheranbindung unterscheidet sich jedoch von der Tesla K20 (320 Bit) und liegt auf dem Niveau von Tesla K20X und Tesla K40. Jedem Chip stehen 12 Gigabyte GDDR5-Speicher zur Verfügung.

Nvidia Tesla K80 AMD FirePro S9150 AMD FirePro W9100 Nvidia Tesla K40
TFLOPS (SP) 8,74 (Boost) 5,07 5,24 4,29
TFLOPS (DP) 2,91 (Boost) 2,53 2,62 1,43
Max. Power 300 W 235 W 275 W 235 W
GFLOPS (DP)
pro Watt
9,7 (Boost) 10,8 9,5 6,1

Die maximale Rechenleistung beträgt laut Nvidia 8,74 TFLOPS bei einfacher Genauigkeit (SP) und maximalem GPU-Takt. Damit übertrifft die Tesla K80 AMDs FirePro S9150 mit einer Hawaii-GPU, benötigt dafür aber mehr Strom und liegt bei der Effizienz hinter der AMD-Karte. Wie bei den anderen Tesla-Modellen auf Basis von Kepler wird bei doppelter Präzision (DP) ein Drittel der SP-Leistung erzielt. Ob die maximale Leistung in der Praxis erreicht wird, hängt von der Kühlung ab. Wie bei den Desktop-Pendants können die maximalen Boost-Frequenzen nur bei ausreichend niedrigen Temperaturen erreicht werden. Als Grafikkarte für Hochleistungsserver wird die aktive Kühlung anderen Systemkomponenten überlassen – die Tesla K80 besitzt keine Lüfter.

Nvidia Tesla K80 (Bild: Nvidia)
Tesla K80 Tesla K40 Tesla K20X Tesla K20
Architektur Kepler (28 nm)
GPU 2 × GK210 GK110B GK110 GK110
Transistoren k. A. 7,1 Mrd.
Shadereinheiten 2 × 2.496 2.880 2.688 2.496
GPU-Takt 562 MHz 745 MHz 732 MHz 706 MHz
Boost-Takt 875 MHz 810 MHz, 875 MHz
Speicherbus 2 × 384 Bit 384 Bit 320 Bit
Speicher 2 × 12 GB GDDR5 12 GB GDDR5 6 GB GDDR5 5 GB GDDR5
Speichertakt 2.500 MHz 3.000 MHz 2.600 MHz
Rechenleistung (SP, max.) 8,74 TFLOPS 4,29 TFLOPS 3,95 TFLOPS 3,52 TFLOPS
Rechenleistung (DP, max.) 2,91 TFLOPS 1,43 TFLOPS 1,31 TFLOPS 1,17 TFLOPS
TDP 300 W 235 W 235 W 225 W
Kühlung passiv aktiv/passiv passiv aktiv/passiv
Einführungspreis k. A. $5.499? ~$3.799 ~$3.299
Quelle: Nvidia, Anandtech

Als Einsatzgebiet sieht Nvidia HPC-Systeme mit Aufgabenbereichen wie Astrophysik, Genomforschung, Quantenchemie und andere Datenanalysen. Angeboten wird der Dual-GPU-Beschleuniger von diversen Server-Herstellern wie Asus, Cray, Dell, HP und Supermicro. Den Preis pro Karte kommunizierte Nvidia nicht. Potentielle Kunden können die Tesla K80 kostenlos auf Remote-Clustern testen.

Rechenleistung der Tesla K80
Rechenleistung der Tesla K80 (Bild: Nvidia)