Intel Xeon E5-2600 v3: 18-Kern-CPU mit 5,69 Mrd. Transistoren auf 662 mm²
Am Vortag des IDF 2014 lässt Intel den Vorhang für die große Neuerung des Jahres 2014 im Server-Segment fallen. Mit den „Haswell-EP“ werden fortan bis zu 18 Kerne und 36 Threads geboten, hinzu kommt DDR4-Unterstützung in allen Bereichen. Dafür hat der CPU-Hersteller beim Layout wieder in die Trickkiste gegriffen.
Prozessor-Dies können nicht unendlich groß werden. Eine ungeschriebene Regel sagt bei Mainstream-Modellen, dass alles über 20 mm Seitenlänge unwirtschaftlich ist – zu fehleranfällig und damit schlecht für die Ausbeute. Bei High-End-Modellen und Preisen jenseits von 4.000 US-Dollar wird diese Regel etwas großzügiger ausgelegt, doch viel weiter geht es auch dort nicht, bis auf 30 mm Kantenlänge will es ein Fertiger nicht treiben. Deshalb muss das Design stetig optimiert werden, am Ende kommen deshalb in der letzten Zeit zunehmend mehr und mehr annähernd quadratische Chips heraus – wie die Desktop-Variante „Haswell-E“ mit 20,2 × 17,6 mm². Denn mit jeweils 25 mm Seitenlänge lässt sich bereits ein Die mit 625 mm² Fläche entwickeln, ohne die Fertigungsgrenzen zu sprengen. Doch Theorie und Praxis gehen nicht immer Hand in Hand.
Vor einem Monat lud Intel nach Hillsboro, Oregon, und zeigte an zwei Tagen, was in den letzten Jahren entwickelt wurde und jetzt als „Grantley“-Plattform mit dem Herzstück der „Haswell-EP“-CPUs marktreif ist. In diese Trickkiste musste der Hersteller nach dem bereits außergewöhnlichen Design bei „Ivy Bridge-EP“ in einer 4+4+4- bzw. „Ivy Bridge-EX“ mit 5+5+5-Kern-Anordnung noch einmal greifen. Heraus kommt bei der Zielvorgabe von 18 Kernen eine nochmalige Überraschung: Der neue Die bietet 4+4+4+6 Kerne auf einem Träger. Die Besonderheit sind die sechs Kerne am Rand des Dies: „Der Platz war einfach da“, hieß es salopp dazu von Intel. Der Blick auf den gesamten Die sowie das Blockschaltbild unterstützt dies. Während Speichercontroller, die QPI-Links und der gesamte Uncore-Bereich wie üblich ihren Platz am Rand in Anspruch nehmen, ist bei dem großen Die alles schon woanders untergekommen, sodass dort Platz für sechs Kerne inklusive jeweils 2,5 MByte L3-Cache ist.
Intern waren dafür erneute Umbauten nötig. Beim Blick auf das Diagramm zeigen sich dabei einige Parallelen zu dem, was AMD bei den größten ihrer Server-CPUs, zuletzt mit „Abu Dhabi“ alias Opteron 6300 Ende 2012, gemacht hat. Dort packte der Hersteller zwei Dies auf ein Multi-Chip-Modul (MCM) und lässt diese per HyperTransport-Link miteinander kommunizieren. Bei Intel wird der Die zwar ein nativer, sieht der Aufbau dem von AMD ähnlich, verhält sich zudem auch teilweise so: Denn die CPU-Kerne inklusive L3-Cache-Slices und Speichercontroller bleiben „auf ihrer Seite“ in ihrem Cluster, wenn nur wenig Last anliegt und vermeiden den Umweg auf die andere Seite. Auch sieht ein Prozessorkern erst einmal nur die Hälfte des insgesamt im Prozessor zur Verfügung stehenden L3-Caches, eben jener, der in seinem Cluster verfügbar ist. Werden mehr Ressourcen benötigt, geht es über die Verbindungsstücke in den anderen Cluster.
Diese „Buffer Switches“ genannten Verbindungen können mit maximal 32 Aktionen gleichzeitig umgehen. Laut Intel werden diese jedoch nie vollständig gebraucht, da die Befehle immer möglichst direkt an den nächsten vorbeikommenden Ring abgegeben werden. Von dem Ringbus, der seit der „Sandy Bridge“-Generation im Einsatz ist, gibt es pro Seite zwei Stück, die entgegengesetzt arbeiten – einer rechts- und einer linksherum. Der als nächstes verfügbare nimmt die Daten auf und verteilt sie an Cache, Kerne & Co..
Doch nicht alle neuen Server-Prozessoren werden auf dem einzigen, mittlerweile trotz 22-nm-Fertigung riesigen Die basieren. Wie in der Vergangenheit ebenfalls üblich legt Intel wieder insgesamt drei Dies auf. Die Topmodelle werden als HCC (High Core Count) klassifiziert, darunter gibt es MCC (Medium Core Count) und LCC, was in dem Fall nicht für das geläufige Low Cost Carrier sondern Low Core Count steht. Im Vergleich zur Vorgängerserie sieht das wie folgt aus:
Modellserie | Kerne | Die-Fläche | Transistoren |
---|---|---|---|
Ivy Bridge-E/EN/EP/EX | 4 – 6 | 256,5 mm² | 1,86 Mrd. |
Ivy Bridge-EN/EP/EX | 8 – 10 | 341 mm² | 2,89 Mrd. |
Ivy Bridge-EP/EX | 10 – 12 | 541 mm² | 4,31 Mrd. |
Haswell-E/EN/EP | 4 – 8 | 354 mm² | 2,60 Mrd. |
Haswell-EN/EP | 10 – 12 | 492 mm² | 3,84 Mrd. |
Haswell-EP | 14 – 18 | 662 mm² | 5,69 Mrd. |
Mit 662 mm² gehört der Die der maximalen Ausbaustufe der „Haswell-EP“ zu den größten in Intels Portfolio. In jüngerer Vergangenheit lagen da nur der „Nehalem-EX“ mit 684 mm² als einer der Vorgänger sowie der „Tukwila“ mit gar 700 mm² Die-Fläche drüber. Anhand des 12-Kern-Dies zeigt sich bei „Haswell-EP“ gegenüber dem Vorgänger, dass sich trotz gleicher 22-nm-Fertigung etwas getan hat: Eine knappe halbe Milliarde Transistoren wurden eingespart, der Die konnte fast 50 mm² schrumpfen.
Die bis zu 50 Prozent mehr Kerne, die ihrerseits noch eine mehr als zehn Prozent gesteigerte IPC gegenüber der Vorgängerarchitektur bieten, der größere Cache und die höhere Bandbreite dank DDR4-2133 haben bereits vor dem Start für 27 neue Rekorde gesorgt, darunter auch im Effizienz-Bereich. Dafür sorgen unter anderem bis zu 19 unterschiedliche Spannungsbereiche in der CPU (pro CPU-Kern jeweils eine + Uncore-Bereich), die gleichen C-States wie bei den Desktop-„Haswell“ und ein nochmals angepasster Turbo-Modus, der mehr auf Effizienz getrimmt wurde. Neue Server-SSDs und 40-Gigabit-Ethernet über NVMe runden das Paket ab.
Um die CPUs herum wurde in erster Linie das Speicherinterface angepasst. Neu ist auch dort die Unterstützung für DDR4-Speicher mit maximal 2.133 MHz bei der Bestückung von einem DIMM pro Channel am Quad-Channel-Speicherinterface. Die Unterstützung sinkt wie üblich bei Mainboards mit vielen RAM-Slots, für zwei DIMMs pro Channel (DPC) ist noch DDR4-1866 möglich, bei drei geht lediglich noch DDR4-1600, was jedoch immer noch ein großer Sprung gegenüber dem Vorgänger ist, der in dieser Konstellation nur noch DDR3-1066 unterstützte. Die Abwärtskompatibilität der „Grantley“-Plattform reicht bis DDR4-1333. Insgesamt unterstützt die Plattform bis zu 24 DIMM-Slots für ein Zwei-Sockel-System.
Am QPI-Interface als Kommunikationsschnittstelle der Prozessoren untereinander in Zwei-Sockel-Systemen hat Intel nicht viel gemacht. Nach wie vor ist QPI 1.1 am Werk, allerdings im Höchstfall jetzt mit bis zu 9,6 GT/s statt 8,0 GT/s. Auch hier gibt es aber Varianten hinab bis zu 6,4 GT/s, einem bereits seit Jahren bekannten Wert.
Neben dem „Wellsburg“-Chipsatz, der als C610 firmiert und quasi identisch zum X99-Chipsatz aus dem Desktop ist, wird Intel die neue Xeon-Serie auch für Kommunikationsdienste optimieren und dafür eine separate Chipsatzserie anbieten. Die Communications Chipset 8920 und 8955 sind speziell auf Ver- und Entschlüsselung optimiert – alternativ kann dies aber auch über eine PCI-Express-Lösung erfolgen, mit dem Intel QuickAssist Server Adapter. Neun Xeon sind bisher speziell für die Kommunikationssparte geeignet, was sich in einer sieben Jahre anhaltenden Verfügbarkeit und zehn Jahren Garantie widerspiegelt.
Zu den 23 Modellen der Serie Xeon E5-2600 v3 zum Start kommen noch fünf für Storage- und Kommunikationssysteme bestimmte Versionen sowie mindestens fünf Varianten Xeon E5-1600 v3 für Ein-Sockel-Systeme, zusätzlich auch noch Spezialmodelle für bestimmte Anwendungsszenarien, die ebenfalls nochmals bis zu 20 Modelle ausmachen. Die Preise gehen dabei wie immer weit auseinander und erstrecken sich von 213 bis 4.115 US-Dollar. Das Spektrum bei den Xeon E5-2600 v3 erstreckt sich von Modellen mit lediglich sechs Kernen und sechs Threads bis hinauf zu 18 Kernen mit 36 Threads und deckt TDPs von 55 bis 160 Watt ab. Bei den Xeon E5-1600 v3 gibt es vier bis acht Kerne in unterschiedlichsten Varianten, zu den Xeon E5-2400 v3, die ebenfalls noch zum Kreis der Neuvorstellungen erwähnt wurden, gab Intel noch keine Details preis – dies werden in einigen Wochen folgen. In den kommenden Monaten erwartet Intel hunderte Systeme von allen namhaften Herstellern, die auf die neue Plattform setzen.
Modell | Kerne / Threads |
Takt / max. Turbo |
L3-Cache | QPI | TDP | Preis |
---|---|---|---|---|---|---|
E5-2699 v3 | 18 / 36 | 2,3 GHz / 3,6 GHz | 45 MB | 9,6 GT/s | 145 W | $4.115 |
E5-2698 v3 | 16 / 32 | 2,3 GHz / 3,6 GHz | 40 MB | 9,6 GT/s | 135 W | $3.226 |
E5-2697 v3 | 14 / 28 | 2,6 GHz / 3,6 GHz | 35 MB | 9,6 GT/s | 145 W | $2.702 |
E5-2695 v3 | 14 / 28 | 2,3 GHz / 3,3 GHz | 35 MB | 9,6 GT/s | 120 W | $2.424 |
E5-2690 v3 | 12 / 24 | 2,6 GHz / 3,5 GHz | 30 MB | 9,6 GT/s | 135 W | $2.090 |
E5-2687W v3 | 10 / 20 | 3,1 GHz / 3,5 GHz | 25 MB | 9,6 GT/s | 160 W | $2.141 |
E5-2685 v3 | 12 / 12 | 2,6 GHz / 3,3 GHz | 30 MB | 9,6 GT/s | 120 W | $2.090 |
E5-2683 v3 | 14 / 28 | 2,0 GHz / 3,0 GHz | 35 MB | 9,6 GT/s | 120 W | $2.090 |
E5-2680 v3 | 12 / 24 | 2,5 GHz / 3,3 GHz | 30 MB | 9,6 GT/s | 120 W | $1.745 |
E5-2670 v3 | 12 / 24 | 2,3 GHz / 3,1 GHz | 30 MB | 9,6 GT/s | 120 W | $1.589 |
E5-2667 v3 | 8 / 16 | 3,2 GHz / 3,6 GHz | 20 MB | 9,6 GT/s | 135 W | $2.057 |
E5-2660 v3 | 10 / 20 | 2,6 GHz / 3,3 GHz | 25 MB | 9,6 GT/s | 105 W | $1.445 |
E5-2650 v3 | 10 / 20 | 2,3 GHz / 3,0 GHz | 25 MB | 9,6 GT/s | 105 W | $1.166 |
E5-2650L v3 | 12 / 24 | 1,8 GHz / 2,5 GHz | 30 MB | 9,6 GT/s | 65 W | $1.329 |
E5-2643 v3 | 6 / 12 | 3,4 GHz / 3,7 GHz | 20 MB | 9,6 GT/s | 135 W | $1.552 |
E5-2640 v3 | 8 / 16 | 2,6 GHz / 3,4 GHz | 20 MB | 8,0 GT/s | 90 W | $939 |
E5-2637 v3 | 4 / 8 | 3,5 GHz / 3,7 GHz | 15 MB | 9,6 GT/s | 135 W | $996 |
E5-2630 v3 | 8 / 16 | 2,4 GHz / 3,2 GHz | 20 MB | 8,0 GT/s | 85 W | $667 |
E5-2630L v3 | 8 / 16 | 1,8 GHz / 2,9 GHz | 20 MB | 8,0 GT/s | 55 W | $612 |
E5-2623 v3 | 4 / 8 | 3,0 GHz / 3,5 GHz | 10 MB | 8,0 GT/s | 105 W | $444 |
E5-2620 v3 | 6 / 12 | 2,4 GHz / 3,2 GHz | 15 MB | 8,0 GT/s | 85 W | $412 |
E5-2609 v3 | 6 / 6 | 1,9 GHz / – | 15 MB | 6,4 GT/s | 85 W | $306 |
E5-2603 v3 | 6 / 6 | 1,6 GHz / – | 15 MB | 6,4 GT/s | 85 W | $213 |
Modell | Kerne / Threads |
Takt / max. Turbo |
L3-Cache | QPI | TDP | Preis |
---|---|---|---|---|---|---|
E5-2658 v3 | 12 / 24 | 2,2 GHz / 2,9 GHz | 30 MB | 9,6 GT/s | 105 W | $1.832 |
E5-2648L v3 | 12 / 24 | 1,8 GHz / 2,5 GHz | 30 MB | 9,6 GT/s | 75 W | $1.544 |
E5-2628L v3 | 10 / 20 | 2,0 GHz / 2,5 GHz | 25 MB | 8,0 GT/s | 75 W | $1.364 |
E5-2618L v3 | 8 / 16 | 2,3 GHz / 3,4 GHz | 20 MB | 8,0 GT/s | 75 W | $779 |
E5-2608L v3 | 6 / 12 | 2,0 GHz / – | 15 MB | 6,4 GT/s | 52 W | k. A. |
Modell | Kerne / Threads |
Takt / max. Turbo |
L3-Cache | TDP | Preis |
---|---|---|---|---|---|
E5-1680 v3 | 8 / 16 | 3,2 GHz / 3,8 GHz | 20 MB | 140 W | $1.723 |
E5-1660 v3 | 8 / 16 | 3,0 GHz / 3,5 GHz | 20 MB | 140 W | $1.080 |
E5-1650 v3 | 6 / 12 | 3,5 GHz / 3,8 GHz | 15 MB | 140 W | $583 |
E5-1630 v3 | 4 / 8 | 3,7 GHz / 3,8 GHz | 10 MB | 140 W | $372 |
E5-1620 v3 | 4 / 8 | 3,5 GHz / 3,6 GHz | 10 MB | 140 W | $294 |