Intel Xeon Phi: Beschleuniger Knights Hill in 10 nm ist Geschichte
Es deutete sich seit Monaten an, nun ist es offiziell: Knights Hill als dritte Generation der Xeon-Phi-Familie wird nicht auf den Markt kommen. Dazu sollen sowohl geänderte Rahmenbedingungen als auch die ständige verzögerte 10-nm-Fertigung geführt haben – denn ursprünglich sollte der Beschleuniger schon fertig sein.
Absage vom US Department of Energy
Spätestens die Ankündigung des US Department of Energy für einen neuen Supercomputer nicht mehr Knights Hill sondern eine andere Beschleunigerlösung einzusetzen, brachte den Stein endgültig ins Rollen, dass Knights Hill in 10 nm mit rund 90 Kernen nicht mehr kommen würde. Denn angekündigt wurde das Aurora-Projekt vor vielen Jahren mit vollmundigen Versprechungen – jetzt sehen die Zeit- und Budget-Pläne ganz anders aus und damit auch die Hardwareanforderungen.
Knights Hill ist dem mittlerweile zu einem Exascale-Projekt aufgestiegenen Szenario nicht mehr gewachsen, es muss eine neue Technologie an ihren Platz rücken, um mit China im Rennen um den ersten Exascale-Computer Schritt zu halten. Denn China will bereits 2020 das erste System stellen, die USA frühstens ab 2021, Europa ab 2022.
One step we’re taking is to replace one of the future Intel® Xeon Phi™ processors (code name Knights Hill) with a new platform and new microarchitecture specifically designed for exascale. Combined with our comprehensive HPC solutions portfolio spanning compute, storage, I/O, and software, the updated roadmap is well poised to energize the exascale revolution.
Intel
Knights Mill ist die letzte Generation
Der eigentlich als Zwischenschritt geplante Ableger Knights Mill, einer leicht geänderte Variante von Knights Landing für AI, Deep Learning und Machine Learning, wird damit der Letzte seiner Art sein. Die Basisspezifikationen sowie die 14-nm-Fertigung sind identisch, doch die Vector Processing Unit wurde überarbeitet. Knights Landing bot bisher zwei Ports für Aufgaben sowohl bei einfacher (SP) als auch doppelte Genauigkeit (DP). Bei Knights Mill wird einer der beiden DP-Ports durch SP/VNNI-Einheiten ersetzt, die zudem doppelt vertreten sind. Hinzu kommt eine seit dem Pentium 4 nicht mehr genutzte Funktion namens „Double-pumped Execution“. Mit der doppelten Verdoppelung will Intel in bestimmten Szenarien eine vierfache Leistung gegenüber Knights Landing erzielen. Zum Ende des Jahres 2017 sollten laut ursprünglichen Plänen die ersten Karten verfügbar sein.
Neuer Fokus auf AI
Bei seinen neuen Projekten fokussiert sich Intel auf die ehemalige Altera-Sparte sowie Nervana. Insbesondere Nervana soll mit neuen Möglichkeiten ein Weg in die Zukunft sein, wie Intel und der letzte Einkauf kürzlich in einem umfangreichen Beitrag über FlexPoint, den Rechengrundlagen hinter der neuen Nervana-Technik, dargelegt haben. Ein Schlüssel für den Weg zum Exascale-System soll aber auch die Skalierbarkeit sein, mit der sich neue Hardware vom kleinen System bis zum Supercomputer umsetzen lassen soll. Dort will Intel seine Entwicklungen vermehrt platzieren, um den Zeitplan von drei bis vier Jahren zum ersten Exascale-System einzuhalten.
In einem Interview mit The Next Platform hat sich Intels Chef der Enterprise & HPC Goup, Barry Davis, zu dem Thema zu Wort gemeldet. Demnach sei die Abkehr von Knights Hill vor einiger Zeit bereits getroffen worden – ohne einen genauen Zeitraum zu nennen. Der Nachfolger respektive das angepasste Design für das Rennen um den Exascale-Supercomputer sei zudem keine eigenständige neue Entwicklung.
The architecture we are moving toward for exascale is not something we just dreamed up in the last six months or even year. We’ve been on working on this for a long time. What the two-year pull-in of the timeline to 2021 does is accelerates our roadmap. [..] We are not doing something just for exascale; it was something we planned to do, so this is a lot easier to do than it may seem.
Wie Davis erklärt, würde Intel also bereits laufende Projekte beschleunigen, sodass im Jahre 2021 nicht nur die Hardware verfügbar sei, sondern auch das Ökosystem drumherum. Und Exascale heißt in dem Fall nicht nur ein schneller Prozessor oder eine Beschleunigerkarte, sondern jeder andere Bereich in einem System um Punkte Hardware aber auch Software.
The needs of the next generation architecture for exascale are fairly well-documented. There’s power, cooling, space, interconnect—and that is a tremendous issue, creating a low latency technology that communicate at that scale. There also compute and storage. There’s a lot to address here.
Weitere interessante Details gibt das Interview von TNP preis.
Einschätzung der Aussagen
Ohne komplette Neuentwicklung, aber bereits seit einigen Jahren in der Entwicklung, schiebt sich Sapphire Rapids als neue Intel-Prozessor-Architektur in den Vordergrund. Diese soll nach Ice Lake (Whitley-Plattform) mit der Tinsley-Plattform erscheinen, im Codenamenregister bei Intel ist sie bereits hinterlegt. Auch vom Zeitrahmen könnte dies passen, mit Cascade Lake im Jahr 2018 und Ice Lake 2019, wäre Sapphire Rapids 2020 an der Tagesordnung – genau im Zeitplan, um 2021 als Abwandlung für einen Exascale-Supercomputer zur Verfügung zu stehen. Sofern die Zeitpläne bei Intel nicht wieder an Problemen wie beispielsweise der Fertigungstechnik scheitern.
Auch die c't stimmt in den Gerüchtereigen mit ein. Demnach wird Xeon Phi durch Xeon H (Codename Knights Cove) abgelöst, wobei es sich bei den ersten Modellen noch um angepasste Server-Prozessoren auf Basis der Ice-Lake-Architektur handeln soll. Die erste Lösung soll dabei ein Multi-Chip-Modul (MCM) sein, wobei Intels neue EMIB-Technik genutzt wird – aus zwei Mal 22 Kernen werden so 44 Kerne.
Für die normalen Ice Lake im Server ist zudem auch HBM2 auf dem MCM im Gespräch. Da Intels Barry Davis von einer Anstrengung in allen Hardwarebereichen sprach um die Skalierung zu erreichen, könnte auch dieser Speicher bei Xeon H mit von der Partie sein. EMIB ist eine der großen Anstrengungen von Intel in den letzten Jahren, die nun anfängt Früchte zu tragen. Auch die erste Intel-AMD-Co-Produktion in der Kaby-Lake-Prozessorkerne mit Vega-Grafik und HBM2-Speicher kombiniert sind, setzt auf die neue Technik.