Qualcomm Centriq 2400: Mit 48 Kernen und 60 MB L3-Cache gegen Intels Xeon
Qualcomm hat wenige Monate vor dem geplanten Start weitere Details zum Server-Prozessor Centriq 2400 veröffentlicht. Die 10-nm-CPU mit 48 Kernen soll jenseits der 2,0 GHz takten, beachtliche 60 MByte L3-Cache sowie insgesamt 12 MByte L2-Cache bieten.
Als Server-SoC für die Cloud auf ARM-Basis beworben, setzt Qualcomm auf die Nachfrage nach einer hohen Parallelisierung bei gleichzeitig geringer Leistungsaufnahme. In dieser Disziplinen soll die erste 10-nm-Server-CPU punkten. Laut Qualcomm liegt in internen Tests die Integer-Leistung in einigen Szenarien auf dem Level von Intel Xeon Platinum, jedoch bei deutlich geringerer Leistungsaufnahme.
24 Mal zwei Kerne und ein Ringbus
Wie das möglich wird, zeigt der Blick auf das Design. Qualcomm bündelt je zwei Falkor-ARM-Kerne und 512 KByte L2-Cache zu einem Cluster, der über einen Ringbus-Stop verfügt – darüber erfolgt die Kommunikation mit dem Rest im SoC. Auf den ersten Blick sieht es in Centriq damit aus wie in früheren Intel-Xeon-Prozessoren, aber das täuscht. Vier Segmente liefern eine Bandbreite von jeweils mindestens 64 GByte pro Sekunde, aufsummiert ergibt das Datenraten von mehr als 256 GByte pro Sekunde. Auch der Ringbus bei Qualcomm ist natürlich bi-direktional ausgelegt und sucht sich jeweils den kürzesten Weg zu den benötigten Informationen, seien sie in anderen Kernen, Caches oder über den Speichercontroller zu finden.
60 MByte L3-Cache und Sechs-Kanal-Speicher
Den Caches und dem Speichercontroller kommt eine gewichtige Aufgabe zu. Auch Qualcomm hat erkannt, dass Daten in der Nähe der Kerne vorzuhalten oder diese schnell von weiter weg zu erhalten immens wichtig für eine Cloud-SoC ist. Deshalb teilt der Hersteller den L3-Cache in zwölf Blöcke zu je fünf MByte auf und verteilt diese um die CPU-Kerne. Eine weitere Besonderheit: Er lässt sich als Standard oder Victim Cache nutzen.
Reicht der interne Speicherplatz für die Daten nicht mehr aus, geht es über die sechs Speichercontroller in den RAM. Unterstützt wird dort DDR4-2666 in einer Größe von maximal 128 GByte pro Channel, folglich sind insgesamt bis zu 768 GByte an LRDIMM oder RDIMM in einem System umsetzbar. Eine wichtige Rolle spielt bei Qualcomm auch die Komprimierung der Daten, um Bandbreite zu sparen und Transferspitzen abzufangen. Bei bis zu 50 Prozent Komprimierung verspricht Qualcomm so im Umkehrschluss eine potentielle Verdoppelung der Transferraten.
32 PCIe, acht SATA und mehr
Seinen Status als echtes System-on-a-Chip (SoC) untermauert der Centriq 2400 mit den Anschlüssen. Im 55 mm × 55 mm großen LGA-Package verbergen sich 32 PCIe-Lanes der dritten Generation, acht SATA-Anschlüsse sind für normalen Massenspeicher nutzbar. Natürlich gehört auch ein LAN-Anschluss zum Chip, zwei Mal Gigabit-Ethernet gibt es von Haus aus. Auch Anschlüsse für USB und weitere gehören zum Komplettpaket.
Qualcomm betont erneut, dass noch in diesem Jahr mit der Auslieferung der 10-nm-Chips begonnen werden soll. Als Auftragsfertiger ist TSMC gesetzt, der mit der 10-nm-Fertigung bereits seit einigen Monaten Erfahrung sammelt, wenngleich vornehmlich mit kleineren Chips für Smartphones. Samples der Chips laufen bereits seit Monaten bei Partnern, neben Linux auch mit Unterstützung für Windows Server 2016.