Tesla K80: Dual-Kepler mit bis zu 8,7 TFLOPS für Superrechner
Ein Jahr ist vergangen, seitdem Nvidia mit der Tesla K40 das bis heute amtierende Flaggschiff im Bereich der GPU-basierten Beschleunigerkarten für Hochleistungsrechner vorstellt hat. Seit heute nimmt die Tesla K80 mit bis zu 8,7 TeraFLOPS bei einfacher und 2,9 TeraFLOPS bei doppelter Genauigkeit den Spitzenplatz ein.
Die Tesla K80 verfügt wie zuvor angenommen über zwei Grafikchips vom Typ GK210. Sie basieren auf der Kepler- und nicht auf der neuen Maxwell-Architektur. Die Zahl der Shadereinheiten beläuft sich auf 2.496 pro Chip und entspricht damit der beschnittenen GK110-GPU der Tesla K20. Die 384 Bit breite Speicheranbindung unterscheidet sich jedoch von der Tesla K20 (320 Bit) und liegt auf dem Niveau von Tesla K20X und Tesla K40. Jedem Chip stehen 12 Gigabyte GDDR5-Speicher zur Verfügung.
Nvidia Tesla K80 | AMD FirePro S9150 | AMD FirePro W9100 | Nvidia Tesla K40 | |
---|---|---|---|---|
TFLOPS (SP) | 8,74 (Boost) | 5,07 | 5,24 | 4,29 |
TFLOPS (DP) | 2,91 (Boost) | 2,53 | 2,62 | 1,43 |
Max. Power | 300 W | 235 W | 275 W | 235 W |
GFLOPS (DP) pro Watt |
9,7 (Boost) | 10,8 | 9,5 | 6,1 |
Die maximale Rechenleistung beträgt laut Nvidia 8,74 TFLOPS bei einfacher Genauigkeit (SP) und maximalem GPU-Takt. Damit übertrifft die Tesla K80 AMDs FirePro S9150 mit einer Hawaii-GPU, benötigt dafür aber mehr Strom und liegt bei der Effizienz hinter der AMD-Karte. Wie bei den anderen Tesla-Modellen auf Basis von Kepler wird bei doppelter Präzision (DP) ein Drittel der SP-Leistung erzielt. Ob die maximale Leistung in der Praxis erreicht wird, hängt von der Kühlung ab. Wie bei den Desktop-Pendants können die maximalen Boost-Frequenzen nur bei ausreichend niedrigen Temperaturen erreicht werden. Als Grafikkarte für Hochleistungsserver wird die aktive Kühlung anderen Systemkomponenten überlassen – die Tesla K80 besitzt keine Lüfter.
Tesla K80 | Tesla K40 | Tesla K20X | Tesla K20 | |
---|---|---|---|---|
Architektur | Kepler (28 nm) | |||
GPU | 2 × GK210 | GK110B | GK110 | GK110 |
Transistoren | k. A. | 7,1 Mrd. | ||
Shadereinheiten | 2 × 2.496 | 2.880 | 2.688 | 2.496 |
GPU-Takt | 562 MHz | 745 MHz | 732 MHz | 706 MHz |
Boost-Takt | 875 MHz | 810 MHz, 875 MHz | – | – |
Speicherbus | 2 × 384 Bit | 384 Bit | 320 Bit | |
Speicher | 2 × 12 GB GDDR5 | 12 GB GDDR5 | 6 GB GDDR5 | 5 GB GDDR5 |
Speichertakt | 2.500 MHz | 3.000 MHz | 2.600 MHz | |
Rechenleistung (SP, max.) | 8,74 TFLOPS | 4,29 TFLOPS | 3,95 TFLOPS | 3,52 TFLOPS |
Rechenleistung (DP, max.) | 2,91 TFLOPS | 1,43 TFLOPS | 1,31 TFLOPS | 1,17 TFLOPS |
TDP | 300 W | 235 W | 235 W | 225 W |
Kühlung | passiv | aktiv/passiv | passiv | aktiv/passiv |
Einführungspreis | k. A. | $5.499? | ~$3.799 | ~$3.299 |
Quelle: Nvidia, Anandtech |
Als Einsatzgebiet sieht Nvidia HPC-Systeme mit Aufgabenbereichen wie Astrophysik, Genomforschung, Quantenchemie und andere Datenanalysen. Angeboten wird der Dual-GPU-Beschleuniger von diversen Server-Herstellern wie Asus, Cray, Dell, HP und Supermicro. Den Preis pro Karte kommunizierte Nvidia nicht. Potentielle Kunden können die Tesla K80 kostenlos auf Remote-Clustern testen.