News Cavium ThunderX3: ARM-Serverprozessor mit 96 Kernen und 384 Threads

SVΞN

Redakteur a.D.
Registriert
Juni 2007
Beiträge
22.739
  • Gefällt mir
Reaktionen: aid0nex und konkretor
AMD hat ja nicht zum Spass ihre ARM vorhaben gecancelled. Wenn man den Zen2 nicht über den Sweetspot hinaus taketet, wird sich der Energieeffizienznachteil vermutlich in grenzen halten. Da lohnt es sich nicht hals-über-kopf den ganzen Software-Stack umzuwerfen.

Denke die Überlegungen zur ARM-Architektur kommen hauptsächlich aus diesen Perspektiven:
  • Unabhängigkeit von Amerika (v.a. Huawei)
  • Stromverbrauch bei mobilen Geräten (vgl. Apple)


Nicht zuletzt wird Intels Preispolitik auch ihren Teil dazu beigetragen haben, ich weis jedoch nicht wie sich das jetzt entwickeln wird. Es gibt ja seit eh-und-je Prozessoren für 30-40 Euro (z.B. Celeron), die zeigen wie irsinnig die Margen in den Bereichen sind können.
 
  • Gefällt mir
Reaktionen: aid0nex
Marvell sieht seine ThunderX3-CPUs hinsichtlich Leistung und Effizienz vor AMDs Eypc 7002 (Rome) mit bis zu 64 Kernen und 128 Threads, ...
ein direkter leistungsvergleich ist zwar kaum möglich, da es von der anwendung abhängt, ob und wie viel ARM oder x86 schneller ist, aber schon eine interessante entwicklung :)
ich würde mich freuen, wenn ARM ebenfalls fuß fasst, weil es viele hersteller gibt und konkurrenz bekanntlich das geschäft beleben und mehr wettbewerb zu mehr innovation und schnellerem fortschritt führt.
 
  • Gefällt mir
Reaktionen: Rotzahn
Enigma schrieb:
AMD hat ja nicht zum Spass ihre ARM vorhaben gecancelled. Wenn man den Zen2 nicht über den Sweetspot hinaus taketet, wird sich der Energieeffizienznachteil vermutlich in grenzen halten. Da lohnt es sich nicht hals-über-kopf den ganzen Software-Stack umzuwerfen.

Denke die Überlegungen zur ARM-Architektur kommen hauptsächlich aus diesen Perspektiven:
  • Unabhängigkeit von Amerika (v.a. Huawei)
  • Stromverbrauch bei mobilen Geräten (vgl. Apple)


Nicht zuletzt wird Intels Preispolitik auch ihren Teil dazu beigetragen haben, ich weis jedoch nicht wie sich das jetzt entwickeln wird. Es gibt ja seit eh-und-je Prozessoren für 30-40 Euro (z.B. Celeron), die zeigen wie irsinnig die Margen in den Bereichen sind können.
Nur dass Huawei die Arm-Lizenzen entzogen wurden.
 
Lord_X schrieb:
So wie von Google? 🥳
Wollte damit nur sagen, dass man mit ARM der Willkür einer Trump-Regierung oder des Amerikanischen Digital-Imperialismus nicht entgehen wird.
 
Wenn Huawei ARM nicht mehr "darf" haben aus immer noch die Option Exynos von Samsung ist sehe ich das falsch?

Grundsätzlich gefällt mir aber, das ein weiterer Hersteller SMT4 anwendet, bisher hat man das ja nur bei IBM ist Oracle gesehen, insbesondere SMT8 ist ja kaum vertreten.

Schade, das die Architekten so unterschiedlich sind, das man sie kaum miteinander vergleichen kann, insbesondere die SPARC CPUs finde ich extrem interessant.
 
Jetzt noch einen Benchmark mit irgendwas das man als privatmensch auch nachvollziehen kann oder das mit praktischer relevanz daherkommt.
linpack? prime95 throughput? encoding?
'60% more performance than before' liest sich ja immer nett, nützt aber alleine nur der marketingabteilung und denen die den vorgänger schon benutzt haben

mir fällt grade auch nicht so recht ein workload ein der I/O auf corelevel aufteilen muss. spielt das vllt bei multiuser szenarien mit sicherheitsbedenken wegen datenlecks eine rolle? VM Server hosting?
da müsste man sich aber darauf verlassen können dass der betreiber die trennung richtig konfiguriert ... kp, wenn ich mir ernsthaft sorgen um hardwaresicherheitslücken machen würde wäre jegliches shared hosting doch sowieso außen vor.
 
Respekt, das nenn ich mal ne Hausnummer !
Mich würde allerdings interessieren, ob das SMT4 auch bei INTEL / AMD anwendbar ist ?

MfG Föhn.
 
mykoma schrieb:
Wenn Huawei ARM nicht mehr "darf" haben aus immer noch die Option Exynos von Samsung ist sehe ich das falsch?
Das siehst Du falsch, Samsung hat die Entwicklung eigener Cores eingestellt.
Im Übrigen hat Arm entschieden, daß die grundlegende Technologie der Arm-Cores in GB entwickelt wurde und damit der Ort der Coreentwicklung – bspw. Austin für A76 und A77 – keine Rolle spielt.

BTT:
SV3N schrieb:
Der Chip dürfte ein enger Verwandter der ARM-Plattform Neoverse N1 sein
Neoverse N1 ist nur ein A76-Derivat, von enger Verwandtschaft kann da keine Rede sein.
Es dürfte sich vielmehr um eine Weiterentwicklung des Thunder2-Cores handeln.

Bigeagle schrieb:
Jetzt noch einen Benchmark mit irgendwas das man als privatmensch auch nachvollziehen kann oder das mit praktischer relevanz daherkommt.
Was machst Du denn so zuhause, daß eine CPU mit 384 Threads eine praktische Relevanz für Dich hat? ;)
Es wird wohl noch eine Weile dauern, bis da eine reale Maschine zur Verfügung steht, vielleicht im Herbst?
 
  • Gefällt mir
Reaktionen: mykoma und icemanspirit
Die Frage ist vielmehr: Was bringt die theoretisch tolle Energieeffizienz, wenn die meisten Programme nach wie vor auf x86 hin optimiert sind?
Da wird aus dem theoretischen Vorteil in der Praxis schnell ein Nachteil. Gerade in Serverumgebungen wird Software halt oft einmal geschrieben und dann über viele Jahre nicht, oder nur kaum verändert. Und wer einmal für eine individuelle Software-Lösung viel Geld in die Hand genommen hat, wird kaum nochmals eine ähnliche Summe in die Hand nehmen, damit das Programm auf ARM portiert wird.
Bei kompletten Neuentwicklungen für Insellösungen mag das aber ganz anders aussehen. Oder in den paar Fällen in denen es bereits Alternativen für ARM gibt.
Spannend ist das Thema allemal. Stand jetzt, sehe ich aber ARM im Server und auch im Desktopbereich nicht so aufgestellt, dass es zu großen Verschiebungen der Marktanteile kommen würde.

Wer weiß, was die Zukunft bringt.
 
ZRUF schrieb:
Die Frage ist vielmehr: Was bringt die theoretisch tolle Energieeffizienz, wenn die meisten Programme nach wie vor auf x86 hin optimiert sind?
Da wird aus dem theoretischen Vorteil in der Praxis schnell ein Nachteil. (...)

Wenn Hyperscaler, wie Microsoft, Amazon, Google, Baidu, Alibaba, Facebook etc. dies nutzen, dann reicht das als Markt fuer ARM Server schon aus und wird die angepasste Software nach und nach in den allgemeinen Servermarkt pushen. Amazon hat da mit dem Graviton 2 schon klare Bestrebungen gezeigt..

Auch interessant wird was fuer einen ARM-basierten Prozessor Nuvia entwickelt, die ja explizit auf ARM-IP aufbauend Prozessoren fuer Hyperscaler/Datacenter entwickeln.
 
Da es spezielle Software erforderlich macht die ARM entsprechend nutzen kann, sehe ich abseits vom super computer und hyperscale keinen nutzen im restlichen Bereich. Es braucht für solche CPUs, ist ja bei den IBM dingern auch so, immer spezielle Anwendungen.

Die allgemein breit aufgestellte Lage wie bei x86 sehe ich hier auf absehbare Zeit nicht.

SMT 4 hingegen sehe ich bei AMD durchaus als realistisch an. Vielleicht noch nicht Milan, aber bei Genoa ^^

Und dann bekommt Threadripper mit SMT 2 Dual Sockel Fähigkeiten während die epycs quad Sockel unterstützen :freaky:


Ich denke mal auf ganz weite Sicht werden ARM und x86 Koexistieren und jeder Bereich spielt seine Stärken aus. An die vielfältigen Implementierungen und Funktionen von x86 Kernen kommt ARM derzeit noch nicht rann. Zumindest wäre mir das neu.
 
@PS828 ich glaube wir sind uns in unserem Argument einig - die Nutzer, die ihren Softwarestack vertikal integriert kontrollieren koennen direkt auf ARM wechseln, falls dies fuer sie Vorteile in der Total-Cost-of-Ownership (Hyperscaler) oder Time-to-Solution (HPC) bringt. Fuer andere Akteure ist dies bei Leibe nicht so simpel..
 
  • Gefällt mir
Reaktionen: smalM und PS828
smalM schrieb:
Was machst Du denn so zuhause, daß eine CPU mit 384 Threads eine praktische Relevanz für Dich hat?
spiele, encoding, BOINC stats ... ^^
die frage lautet aus meiner sicht eher, was macht man so außer texte schreiben, musik hören und bildschirmschoner laufen lassen am pc das nicht von mehr hardwarethreads profitieren könnte? Mit so einer Menge würden vielleicht mehr Entwickler auf ordentliche skalierung achten anstatt eine feste anzahl threads zu erstellen und dann die aufgaben statisch zu verteilen. je nachdem wie ihr rechner zur entwicklung eben aufgebaut ist. alles was später mit mehr CPUs/Threads daherkommt idled dann eben entsprechend.
Bestehende Spiele wären dann aber vielleicht nicht mehr so zickig was hintergrundlast angeht.
Ich kann z.b. auf meinem i5 3570k mit einem videoencoding die ganze cpu recht zuverlässig auslasten. der ryzen 5 2600 hier braucht bei niedrigeren auflösungen und medium preset bei x265 schon zwei parallele encodings um einigermaßen voll beschäftigt zu sein. full hd in hoher qualität dagegen schnappt sich jeden cycle den es kriegen kann, wenn ich da ungestört nebenher surfen oder zocken will muss ich dem erstmal wieder ein, zwei kerne wegnehmen. Mehr Kerne sind einfach bequemer für multitasking.

Entweder der Workload lässt sich parallelisieren, oder man kann mehr Workloads gleichzeitig laufen lassen. CPU Kerne, Threads, RAM ... alles macht sich bemerkbar wenn man zu wenig hat und stört abseits von potentiell höherem energieverbrauch nur bei schlechter software.

Darüber hinaus wäre ich auch einfach nur neugierig was so eine große ARM CPU denn im direkten Vergleich zu einer ebenso aktuellen und großen x86 CPU leistet. Während meiner Ausbildung habe ich nebenher mitbekommen wie Energieeffizienz verglichen wurde, also wie viel energie für eine gegebene aufgabe notwendig war. Für verschiedene CPUs und Taktraten, besonders mit Blick auf Turbomechanismen. Dabei schnitten meistens CPUs mit vielen Kernen und mittlerem bis hohem Takt gut ab, nur selten mal was mit aktivem Turbo oder kleinere CPUs. ARM war da eher so schlecht dass selbst ein i7 im Boost deutlich besser war - sofern ich es mitbekommen habe.
Einzig der absolute Verbrauch sah bei ARM deutlich besser aus, vor allem im idle. So ein 4 Sockel System mit 80W im Leerlauf fällt auf den ersten Blick nicht gerade in die Kategorie 'sparsam', aber wenn man die Kiste tatsächlich arbeiten lässt kann sowas schnell effizienter werden als alles was man so auf einen Sockel bekommt. Trotz massig RAM und vermutlich redundantem Netzteil und 2x 10Gbit LAN, möglicherweise Glasfaser zusätzlich.
Aber daher bin ich erstmal skeptisch wenn bei ARM von besserer Energieeffizient im vergleich zu x86 gesprochen wird. Dazu gehört eben nicht nur geringer Verbrauch, sondern auch die Leistungsfähigkeit. Das wird aber irgendwie gerne einfach vorrausgesetzt, vergessen oder es gibt nur tolle balkendiagramme ohne konkrete werte. Das finde ich einfach lästig weil zwar viel zu sehen ist, aber nichts dabei was wirklich hilft das einzuordnen.
 
  • Gefällt mir
Reaktionen: PS828
@Bigeagle
Das Problem eines solchen Prozessors ist, daß er für Workstation-Arbeit nicht ausgelegt ist. SMT4 glänzt da, wo die aktiven Threads oft auf Daten warten müssen und deshalb der nächste Thread übernehmen kann. Du hast dafür im Workstationbereich meist einfach schlicht nicht genug parallel laufende Prozesse mit so einem Anforderungsprofil.
Das ist es übrigens auch, wieso @icemanspirit Hyperscaler als Zielgruppe nennt, die haben echte Vorteile von so einer 384-Tread CPU.

PS828 schrieb:
SMT 4 hingegen sehe ich bei AMD durchaus als realistisch an. Vielleicht noch nicht Milan, aber bei Genoa

Nicht ohne deutliche Änderungen an der Architektur. Die Serverdickschiffe sind um SMT4 oder SMT8 herum designed, bei x86 ist SMT nur eine Art Zubrot, der Threadwechsel ist deshalb viel zu aufwendig.
AMD müßte also die Entwicklung von Epyc- und Ryzen-Cores trennen.
 
Zuletzt bearbeitet von einem Moderator:
@smalM das SMT würde mich bei sowas auch weniger interessieren, viele meiner workloads werden dadurch nicht schneller. deshalb hab ich schon vor 6 jahren nur einen i5 gekauft und auch heute sehe ich in tests auf einem ryzen 2600 dass es nicht viel an performancezuwachs bringt. dafür ruckelt weniger wenn man nebenher surft oder so.
Aber die 96 Kerne! Mit etwas in der Größenordnung würde ich schon gerne rumspielen und gucken ob ich was schreiben kann das bis dahin brauchbar skaliert. Hätte ich Geld wie Katzenhaare an den Klamotten würde ich mit ein 4 Sockel System zum spielen hinstellen ^^

Ansonsten bin ich einfach nur neugierig und da fällt eben auf dass es wenig direkte Vergleichsmöglichkeiten gibt sofern man den Vergleich nicht selbst machen kann. Wenn das ding 5 kW verbraten würde und auf Plutoniumsubstrat geklebt wäre würde ich immer noch fragen ob es vergleichende Benchmarks gibt. Dafür muss ich mir die Hardware nicht realistischerweise anschaffen können oder wollen ;)
Ich würde mir auch Panzer von innen angucken wollen, oder mal eine Avro Vulcan fliegen wollen. Reine neugier.
Okok, den Panzer würde ich auch fahren wollen ^^
Für ein reines NAS könnte mehrfaches SMT auch interessant sein ... warum gibts das da eigentlich nicht in größeren Umfang?
 
@Bigeagle eine Option, wie Du ein solches System preiswert testen koenntest ohne direkt eine Niere zu verkaufen waere dies in der Cloud zu tun, e.g. Amazon Web Service oder in der Azure Cloud. Die werden diese Prozessoren vermutlich relativ startnah in ersten Instanzen anbieten. Mit dem Nutzen von Spot-pricing muesstest Du fuer ziemlich kleines Geld die Hardwareperformance testen koennen.

Falls Du ein NAS simulieren willst muesstest Du bei e.g. Azure halt die Instanzen zusammenschalten...
 
Interessantes Brett, für Datenbanken/Hyperscale sicher nicht unbrauchbar und in dem Bereich wurde fast eh alles auch durch einen ARM-Compiler gejagt.

7hyrael schrieb:
Nur dass Huawei die Arm-Lizenzen entzogen wurden.
Huawei hat keine ARM-Lizenz mehr? Wann und wieso ist das denn passiert?
An den US-Sanktionen kann es eigentlich nicht liegen, da hat eine japanische Firma mit Sitz in GB ja nichts mit zu tun.
 
Zurück
Oben