Tesla K40: Nvidias neues HPC-Flaggschiff mit Boost

18.11.2013 17:29 Uhr

Passend zur aktuell stattfindenden Supercomputing-Conference (SC13) präsentiert Nvidia heute mit der Tesla K40 eine neue Grafikkarte für HPC-Systeme. Mit 2.880 Rechenkernen, 12 Gigabyte Speicher und einer Single-Precision-Rechenleistung von bis zu 4,29 Teraflops bildet die Tesla K40 Nvidias neue Speerspitze.

Größtenteils haben sich die Informationen aus dem Vorfeld bewahrheitet: Es kommt wie bei der GeForce GTX 780 Ti der Vollausbau der GK110-GPU auf Basis der „Kepler“-Architektur zum Einsatz, bei der alle 15 SMX-Blöcke aktiv sind, womit 2.880 ALUs zur Verfügung stehen. Nvidia nennt den Grafikchip der neuen Tesla-Karte allerdings nicht GK110 sondern „GK110B“.

Nvidia Tesla K40

Als Novum im Tesla-Segment verfügt der Neuling zudem über eine Boost-Funktion, wie man sie von den GeForce-Grafikkarten kennt. Der GPU-Basistakt fällt mit 745 MHz bereits etwas höher als bei der Tesla K20X aus und wird per Boost auf 810 respektive 875 MHz angehoben. Durch den „GPU Boost“ verspricht der Hersteller einen Leistungsgewinn von bis zu 25 Prozent; insgesamt soll die Tesla K40 20 bis 40 Prozent schneller als eine Tesla K20X arbeiten. Zudem wählt Nvidia bei gleichgebliebenem 384-Bit-Speicherinterface einen höheren Speichertakt von 3.000 MHz, womit auch die Speicherbandbreite höher als beim vorherigen Flaggschiff ausfällt: 288 GB/s statt 250 GB/s.

Trotz der höheren Frequenzen und Anzahl der Recheneinheiten bleibt die „Total Board Power“ bei 235 Watt. Eines der ersten Einsatzgebiete der Tesla K40 soll das interaktive Remote-Visualisierungs- und Datenanalysesystem „Maverick“ werden, welches das Texas Advanced Computing Center (TACC) der University of Texas in Austin entwickelt und voraussichtlich im Januar 2014 in Betrieb nehmen wird.

	Nvidia Tesla K20X	Nvidia Tesla K40	AMD FirePro S10000
GPU	GK110	GK110B	2 x Tahiti
Rechenkerne	2.688	2.880	3.584
Takt (Boost)	732 MHz ( – )	745 MHz (810 & 875 MHz)	825 MHz ( – )
Leistung SP/DP	3,95/1,31 TFLOPS	4,29/1,43 TFLOPS	5,91/1,48 TFLOPS
Speicherinterface	384 Bit	384 Bit	384 Bit
Speichertakt	2.600 MHz	3.000 MHz	2.500 MHz
Speicherbandbreite	250 GB/s	288 GB/s	480 GB/s
Speichergröße	6.144 MB	12.288 MB	6.144 MB / 12.288 MB
PCI Express	2.0	3.0	3.0
TDP (max)	235 Watt	235 W	375 Watt

Darüber hinaus nutzt Nvidia die Gunst der Stunde, um eine Kooperation mit IBM im Bereich Supercomputer bekanntzugeben: Künftig sollen Power8-Prozessoren von IBM mit Tesla-Grafiklösungen von Nvidia kombiniert werden und dadurch Unternehmen „effizientere Wege, Big-Data-Informationen und Analysen zu verwerten“ ermöglichen, wie Tom Rosamilia, Senior Vice President der IBM Systems & Technology Group, erklärt. Laut von Nvidia ausgewählten Analysen wächst der Markt für HPC-Systeme mit Grafikbeschleunigern rapide und auch die Zahl der Anwendungen, die durch GPUs beschleunigt werden, nimmt deutlich zu, wie folgende Grafik aufzeigt.