Tesla K40: Nvidias neues HPC-Flaggschiff mit Boost

Michael Günsch
26 Kommentare

Passend zur aktuell stattfindenden Supercomputing-Conference (SC13) präsentiert Nvidia heute mit der Tesla K40 eine neue Grafikkarte für HPC-Systeme. Mit 2.880 Rechenkernen, 12 Gigabyte Speicher und einer Single-Precision-Rechenleistung von bis zu 4,29 Teraflops bildet die Tesla K40 Nvidias neue Speerspitze.

Größtenteils haben sich die Informationen aus dem Vorfeld bewahrheitet: Es kommt wie bei der GeForce GTX 780 Ti der Vollausbau der GK110-GPU auf Basis der „Kepler“-Architektur zum Einsatz, bei der alle 15 SMX-Blöcke aktiv sind, womit 2.880 ALUs zur Verfügung stehen. Nvidia nennt den Grafikchip der neuen Tesla-Karte allerdings nicht GK110 sondern „GK110B“.

Nvidia Tesla K40

Als Novum im Tesla-Segment verfügt der Neuling zudem über eine Boost-Funktion, wie man sie von den GeForce-Grafikkarten kennt. Der GPU-Basistakt fällt mit 745 MHz bereits etwas höher als bei der Tesla K20X aus und wird per Boost auf 810 respektive 875 MHz angehoben. Durch den „GPU Boost“ verspricht der Hersteller einen Leistungsgewinn von bis zu 25 Prozent; insgesamt soll die Tesla K40 20 bis 40 Prozent schneller als eine Tesla K20X arbeiten. Zudem wählt Nvidia bei gleichgebliebenem 384-Bit-Speicherinterface einen höheren Speichertakt von 3.000 MHz, womit auch die Speicherbandbreite höher als beim vorherigen Flaggschiff ausfällt: 288 GB/s statt 250 GB/s.

Trotz der höheren Frequenzen und Anzahl der Recheneinheiten bleibt die „Total Board Power“ bei 235 Watt. Eines der ersten Einsatzgebiete der Tesla K40 soll das interaktive Remote-Visualisierungs- und Datenanalysesystem „Maverick“ werden, welches das Texas Advanced Computing Center (TACC) der University of Texas in Austin entwickelt und voraussichtlich im Januar 2014 in Betrieb nehmen wird.

Nvidia Tesla K40
Nvidia Tesla K40
Nvidia
Tesla K20X
Nvidia
Tesla K40
AMD
FirePro S10000
GPU GK110 GK110B 2 x Tahiti
Rechenkerne 2.688 2.880 3.584
Takt (Boost) 732 MHz ( – ) 745 MHz (810 & 875 MHz) 825 MHz ( – )
Leistung
SP/DP
3,95/1,31 TFLOPS 4,29/1,43 TFLOPS 5,91/1,48 TFLOPS
Speicherinterface 384 Bit 384 Bit 384 Bit
Speichertakt 2.600 MHz 3.000 MHz 2.500 MHz
Speicherbandbreite 250 GB/s 288 GB/s 480 GB/s
Speichergröße 6.144 MB 12.288 MB 6.144 MB / 12.288 MB
PCI Express 2.0 3.0 3.0
TDP (max) 235 Watt 235 W 375 Watt

Darüber hinaus nutzt Nvidia die Gunst der Stunde, um eine Kooperation mit IBM im Bereich Supercomputer bekanntzugeben: Künftig sollen Power8-Prozessoren von IBM mit Tesla-Grafiklösungen von Nvidia kombiniert werden und dadurch Unternehmen „effizientere Wege, Big-Data-Informationen und Analysen zu verwerten“ ermöglichen, wie Tom Rosamilia, Senior Vice President der IBM Systems & Technology Group, erklärt. Laut von Nvidia ausgewählten Analysen wächst der Markt für HPC-Systeme mit Grafikbeschleunigern rapide und auch die Zahl der Anwendungen, die durch GPUs beschleunigt werden, nimmt deutlich zu, wie folgende Grafik aufzeigt.

GPUs erlangen immer mehr Bedeutung im HPC-Segment
GPUs erlangen immer mehr Bedeutung im HPC-Segment