Intels „Knights Corner“ erreicht über 1 TFLOP/s
Auf der zur Zeit in Seattle stattfindenden Supercomputing Konferenz 2011 gibt Intel Einblick in die nächste Generation seiner HPC-Plattformen (High Performance Computing). Darunter fallen nicht nur die neuen Xeon-Prozessoren der E5-Serie, dem Pendant zu „Sandy Bridge-E“, sondern auch die MIC-Architektur (Many Integrated Core).
Diese, hervorgegangen aus dem eingestampften „Larrabee“-Projekt einer Grafikkarte auf Basis von x86-Kernen, ist bislang in Form von „Knights Ferry“ nur als Software-Entwicklungsplattform für Co-Prozessoren verfügbar, nicht aber für den kommerziellen Einsatz. Dies soll sich im kommenden Jahr mit dem Nachfolger „Knights Corner“ ändern. Dieser wird ebenso wie die nächste Prozessor-Generation „Ivy Bridge“ in Intels 22-nm-Prozess mit Tri-Gate-Transistoren gefertigt, über deren Vorteile wir bereits ausführlich berichtet haben, und soll bei hoch parallelisierbaren Rechenlasten seine Stärken ausspielen.
Erste Hinweise zur Leistungsfähigkeit des Prozessors mit mehr als 50 Kernen gab nun eine Live-Demonstration. Darin konnte „Knights Corner“ als erster Prozessor auf einem Chip dauerhaft die Leistungsgrenze von 1 TFLOP/s (Billionen Fließkommaoperationen pro Sekunde) im 64-Bit-Double-Precision-Format durchbrechen (gemessen im DGEMM-Benchmark). Um dies in Relation zu setzen, führt Intel einen Vergleich mit dem ersten Teraflop-Supercomputer an. Der aus 9.680 Pentium-Pro-Prozessoren bestehende Supercomputer war Teil des ASCI-Red-Supercomputers der Sandia Labs und so leistungsfähig wie ein einzelner Knights-Corner-Prozessor. Interessant ist auch ein Blick zur Konkurrenz, genauer gesagt zu Nvidias Tesla C2050. Die Karte auf Basis der „Fermi“-Architektur kommt im gleichen Benchmark „nur“ auf etwas unter 180 GFLOP/s (Seite 13, PDF).
Eingesetzt werden soll „Knights Corner“ beispielsweise, zusammen mit Xeon-Prozessoren, im Supercomputer „Stampede“. Der „National Cyber Infrastructure Super Computer“ soll im Januar 2013 einsatzbereit sein und eine Leistung von 10 PetaFLOP/s erreichen.