AMD Radeon Instinct: Passiv gekühlte MI25 mit Vega für Deep Learning
Deep Learning ist ein schnell wachsender und lukrativer Markt, der extrem viel Rechenleistung benötigt. Nvidia hat mit dem GP100 eine GPU nur für diesen Markt entwickelt. In Zukunft macht AMD Nvidia auch auf diesem Segment bei Hard- und Software Konkurrenz; auch auf Basis der GPU Vega.
Drei Grafikkarten für Radeon Instinct zum Start
AMD nennt die Produktsparte für Deep Learning respektive Machine Intelligence „Radeon Instinct“. Zum Start werden drei verschiedene Grafikkarten verfügbar sein, die auf die Bezeichnungen „MI6“, „MI8“ und „MI25“ hören werden. Alle drei Grafikkarten werden selbst passiv gekühlt, für den Luftstrom um die Grafikkarte ist die Kühlung des Servers verantwortlich. AMD hat zu der Hardware auch erste technische Details bekannt gegeben.
Erste Eckdaten zu MI6, MI8 und MI25
Das Einstiegsprodukt MI6 bietet 5,7 TFLOPS bei FP32 sowie eine Speicherbandbreite von 224 Gigabyte pro Sekunde. Die Leistungsaufnahme wird mit weniger als 150 Watt angegeben. Anhand der Leistungsdaten kann davon ausgegangen werden, dass die von Radeon RX 480 und Radeon RX 470 bekannte GPU Polaris 10 verwendet wird. Die MI8 bietet dagegen 8,2 Teraflops und eine Bandbreite von 512 Gigabyte pro Sekunde. Die Leistungsaufnahme liegt bei unter 175 Watt. Das und die Tatsache, dass es sich um eine sehr kurze Karte handelt, lässt auf den Einsatz der Fiji-GPU mit HBM auf dem Interposer schließen.
Das Flaggschiff Instinct MI25 setzt auf die neue Vega-GPU
Aus technischer Sicht am interessantesten ist das vorläufige Topmodell, das auf die Bezeichnung MI25 hört: Die Variante setzt auf Vega. Vega ist die Next-Gen-GPU für den High-End-Markt von AMD, die den aktuellen Gerüchten zu Folge über eine neue Architektur verfügen soll. Dafür spricht auch AMDs offizielle Angabe „Vega mit NCU“. Was hinter der Abkürzung steckt, hat AMD zwar noch nicht verraten, als CU bezeichnet der Hersteller allerdings Compute Unit, also die ALUs einer GPU. NCU könnte damit für „New Compute Unit“ oder „Next Compute Unit“ stehen.
Hohe Bandbreiten und weniger als 300 Watt Verbrauch
AMD spricht in Zusammenhang mit der MI25 zudem von einem „High Bandwith Cache and Controller“ und einer Leistungsaufnahme von unter 300 Watt. ComputerBase hat die neuen Informationen zur MI25 und damit der Vega-GPU genauer analysiert und die neuen Informationshäppchen in einer separaten Nachricht zusammen gefasst – mitsamt einer Angabe zur Performance.
Alle Grafikkarten aus der Kategorie Radeon Instinct werden von AMD selbst produziert und daher nicht von Bordpartnern angeboten. Gemein ist allen Produkten neben der passiven Kühlung auch der Multi-GPU-Betrieb. Zudem bieten alle eine Hardware-Virtualisierung für den Mehrbenutzerbetrieb, was unter der Bezeichnung „Multiuser-GPU (PDF)“ läuft.
Radeon Instinct besteht neben Hardware auch aus Software
Radeon Instinct ist laut AMD mehr als nur Hardware. Im Rahmen von Instinct bietet AMD auch die notwendige Software als Open Source an. Zum Einsatz kommt unter anderem ein neues Framework auf der ROCm-Plattform, die früher unter dem Namen „Boltzmann-Initiative“ gelaufen ist und unter anderem einen HCC-Compiler (Heterogeneous Compute Compiler) bietet.
Neu ist eine auf Machine Learning optimierte Bibliothek, die AMD MIOpen getauft hat. Mit MIOpen können mehrere Frameworks wie zum Beispiel Caffe genutzt werden. AMD will mit MIOpen eine sehr hohe Performance bieten und zeigt dafür selbst erstellte Ergebnisse des DeepBench-GEMM-Test, der stark auf die vorhandene ALU-Performance anspricht. Demnach ist die MI8 in dem Test bereits minimal schneller als die GeForce GTX Titan X auf Basis von Pascal. Einen nochmal deutlichen Sprung macht die neue MI25 auf Basis von Vega. MIOpen wird im Laufe des ersten Quartals 2017 zum Download bereit stehen.
Vega-Systeme mit bis zu 3 Petaflops an FP16-Leistung
AMDs Instinct-Produkte werden nicht sofort erhältlich sein, sondern im Laufe des ersten Halbjahrs 2017. AMD habe die Vega-GPUs erst seit wenigen Wochen in den eigenen Laboren, es sei noch sehr viel Optimierungsarbeit notwendig. Dennoch planen einige Anbieter von HPC-System bereits erstere Produkte mit der neuen GPU. So wird Super Micro mit dem SYS 1028GQ-TRT gleich auf drei MI25 setzen. Das K888 G3 bietet mit vier MI25 sogar eine Rechenleistung von 100 TFLOPS FP16-Leistung. Das Falconwitch-System verbaut sogar 16 MI25. Die theoretische FP16-Geschwindigkeit beträgt damit 400 Teraflops. Noch einen Gang höher schaltet das Instinct-System von Iventec. 120 MI25 erreichen drei Petaflops an Leistung.