Bericht Arm-Kerne 2023: Cortex-X4, A720 und A520 bilden reine 64‑Bit-Plattform

nlr

Redakteur
Teammitglied
Registriert
Sep. 2005
Beiträge
10.352
Arm trennt sich endlich von allen 32-Bit-Altlasten, steigert abermals Leistung und Effizienz und bietet mehr Flexibilität bei der Zusammenstellung. Cortex-X4, Cortex-A720 und Cortex-A520 sind die neuen CPU-Kerne, die dieses und nächstes Jahr in neuen Prozessoren vor allem für Smartphones mit Android zum Einsatz kommen werden.

Zum Bericht: Arm-Kerne 2023: Cortex-X4, A720 und A520 bilden reine 64‑Bit-Plattform
 
  • Gefällt mir
Reaktionen: flo.murr, aid0nex, Conqi und 13 andere
Wie benennt ARM eigentlich seine A Architekturen? Ohne sich eingelesen zuhaben ist das reiner Wildwuchs: A mit irgendeiner Zahl
 
Eher enttäuschend! Bei allen tatsächlichen und vermutlichen Verbesserungen bei den großen Kernen (X4 und A720) ist es doch schade und auch verwunderlich daß ARM nach wie vor ihre kleinen Kerne als in-order Designs ausführt. Dazu hat der Artikel leider nicht viel gesagt, schade. Aus meiner Sicht nach wie vor die große Schwachstelle aller bigLITTLE SoCs die direkte ARM IP einsetzen, inklusive jenes, das in meinem Android werkelt. Die bei Apples Bionic SoCs als "efficiency cores" geführten kleineren Kerne sind ja schon seit mehreren Generationen out-of-order Designs, und das ist wohl auch einer der Gründe warum diese Kerne gut die doppelte IPC haben wie die kleinen in-order Stock ARM Kerne; bei übrigens fast gleicher Leistungsaufnahme. Dazu kommt, daß mit mehr Leistung der kleinen Kerne es auch seltener notwendig ist, die großen (und mehr Strom verbrauchenden) Kerne zu benutzen, was Batterie spart.
Wenn einer von Euch (CB) hier Mal die Gelegenheit hat, fragt ARM doch bitte, warum sie bei den kleinen Kernen immer noch auf in-order setzen.
Ich habe nämlich mittlerweile den Eindruck, daß ARM es unbedingt vermeiden will, hier Apple vors SoC Bein zu pinkeln. Gibt's da ein stillschweigendes Übereinkommen zwischen den beiden?
 
  • Gefällt mir
Reaktionen: SSGFrost, flo.murr, aid0nex und 2 andere
Für mich zum Verständnis, die A7xx kerne welche hier als Mid-Core bezeichnet werden sind aber schon die technische Nachfolge zu den A78 Kernen welche damals als Big galten? Also wenn ich einen A720 mit einem A78 vergleiche, habe ich deutlich steigerung im Bereich Leistung und Effizienz?


Generell bin ich mal gespannt auf den X4. Vor allem wie der im Vergleich zu den Apple Cores abschneidet
 
  • Gefällt mir
Reaktionen: flo.murr
Handy Segment ist das eine , aber gerade performante ein Platinen Rechner als Raspberry und co sehe ich viele potential
 
  • Gefällt mir
Reaktionen: Mumbira
Hab ich das richtig im Kopf,dass x86 dazu im Vergleich immer noch im 16Bit Modus bootet?
 
  • Gefällt mir
Reaktionen: flo.murr, aid0nex, IgorGlock und 6 andere
c9hris schrieb:
Alleine denke ich wir im Büro noch an 32bit Software einsetzten.
32 bit apps sollen in ring 3 noch weiter funktionieren:
1685344855305.png

sie werden schon erkannt haben, dass ein komplett fehlender 32bit support wohl nicht so gut ankommt.

Miuwa schrieb:
Wollen sie das wirklich, oder ist das nur ein whitepaper um mal zu untersuchen, was, wie möglich wäre?
es ist ein whitepaper und nichts, was wohl auch nur irgendwie in näherer zukunft kommt. aber man muss ja nicht bis in alle ewigkeit altlasten mitschleppen und wenn man sieht, wie lange solche dinge brauchen, sollten sie sich lieber heute als morgen einen kopf drum machen :)
 
eastcoast_pete schrieb:
Eher enttäuschend! Bei allen tatsächlichen und vermutlichen Verbesserungen bei den großen Kernen (X4 und A720) ist es doch schade und auch verwunderlich daß ARM nach wie vor ihre kleinen Kerne als in-order Designs ausführt. Dazu hat der Artikel leider nicht viel gesagt, schade. Aus meiner Sicht nach wie vor die große Schwachstelle aller bigLITTLE SoCs die direkte ARM IP einsetzen, inklusive jenes, das in meinem Android werkelt. Die bei Apples Bionic SoCs als "efficiency cores" geführten kleineren Kerne sind ja schon seit mehreren Generationen out-of-order Designs, und das ist wohl auch einer der Gründe warum diese Kerne gut die doppelte IPC haben wie die kleinen in-order Stock ARM Kerne; bei übrigens fast gleicher Leistungsaufnahme. Dazu kommt, daß mit mehr Leistung der kleinen Kerne es auch seltener notwendig ist, die großen (und mehr Strom verbrauchenden) Kerne zu benutzen, was Batterie spart.
Wenn einer von Euch (CB) hier Mal die Gelegenheit hat, fragt ARM doch bitte, warum sie bei den kleinen Kernen immer noch auf in-order setzen.
Ich habe nämlich mittlerweile den Eindruck, daß ARM es unbedingt vermeiden will, hier Apple vors SoC Bein zu pinkeln. Gibt's da ein stillschweigendes Übereinkommen zwischen den beiden?
Apple hat den Vorteil immer genau zu wissen bei welcher Fertigung und in welchem Produkt ein Kern landet, was ARM nicht vorraussehen kann.

Zweitens sind Apple’s Kerne eher vergleichbar mit den X und A7 Kernen bei ARM. Ein A5 Äquivalent hat Apple garnicht.
Selbst die Effizienz-Kerne bei Apple haben einen vielfach größeren Platzbedarf als ein A5 Kern bei ARM.
Ergänzung ()

0x8100 schrieb:
32 bit apps sollen in ring 3 noch weiter funktionieren:
Anhang anzeigen 1362027
sie werden schon erkannt haben, dass ein komplett fehlender 32bit support wohl nicht so gut ankommt.


es ist ein whitepaper und nichts, was wohl auch nur irgendwie in näherer zukunft kommt. aber man muss ja nicht bis in alle ewigkeit altlasten mitschleppen und wenn man sieht, wie lange solche dinge brauchen, sollten sie sich lieber heute als morgen einen kopf drum machen :)
Aber laut der Tabelle nicht unter einem 64-Bit Betriebssystem

Edit: Sorry falsch verstanden. Geht wohl nur um 32-Bit System Apps, die dann nicht mehr funktionieren.
 
  • Gefällt mir
Reaktionen: flo.murr und Miuwa
cha0shacker schrieb:
Aber laut der Tabelle nicht unter einem 64-Bit Betriebssystem.
mit x86-s gibt es nur noch 64bit betriebssysteme. allerdings darf es keinen 32bit kernel-code mehr geben (ring 0), nur noch anwendungen in ring 3 dürfen 32bit sein. ring 1 und 2 werden komplett entfernt, werden aber auch heute schon nicht mehr gebraucht/verwendet.
 
  • Gefällt mir
Reaktionen: konkretor und cha0shacker
c9hris schrieb:
Stelle mir das am PC halt doch etwas komplexer vor.Alleine denke ich wir im Büro noch an 32bit Software einsetzten.
Ziemlich ärgerlich, dass MS bei seinen Entwicklungstools als auch eigenen Produkten noch sehr lange auf 32-Bit Default gesetzt hat. Und die anfängliche x86-only Emulation bei Windows on ARM hat auch nicht geholfen. Wir könnten da schon viel weiter sein wenn MS etwas mutiger (gewesen) wäre.
Bin mir aber ziemlich sicher, dass man bis zum Einzug von x64-only Prozessoren die 32-Bit legacy Programme Effizient genug im Emulator laufen lassen kann, damit das kein Problem wäre.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: c9hris
Da ist wohl was dran. Kann man imho aber Microsoft nicht vorwerfen. Die dürfen sich ja überhaupt nichts trauen ohne zerfleischt zu werden. Nur noch mit TPM auf Win 11? "Grillt Sie!" , GUI Refactoring? "Röstet Sie", Neue Druckertreiber obwohl sich jeder über den alten Scheiß aufregt? "Hackt sie ihn Stücke!!!"

Irgendwie ist die Welt komisch. Alle anderen können machen was sie wollen. Apple kann Jahre lang USB ignorieren, Samsung die Leute mit Bloatware zuballern...

Das ist zumindest meine Wahrnehmung.

Fände es aber auch gut den 32bit Kram rauszuwerfen. Der alte Kram bleibt ja emulierbar.
 
  • Gefällt mir
Reaktionen: SSGFrost, Tzk, IgorGlock und eine weitere Person
eastcoast_pete schrieb:
Die bei Apples Bionic SoCs als "efficiency cores" geführten kleineren Kerne sind ja schon seit mehreren Generationen out-of-order Designs, und das ist wohl auch einer der Gründe warum diese Kerne gut die doppelte IPC haben wie die kleinen in-order Stock ARM Kerne; bei übrigens fast gleicher Leistungsaufnahme.
Die Apple Efficiency Kerne haben auf dem selben node rund die doppelte Leistungsaufnahme wie die A515 Kerne. Die sind wirklich primär für OS und Idle Aufgaben gedacht.

Das Gegenstück zu den ARM A720 Kernen wären Apples E-Cores.
 
  • Gefällt mir
Reaktionen: DFFVB, WisOne, Haldi und eine weitere Person
0x8100 schrieb:
es ist ein whitepaper und nichts, was wohl auch nur irgendwie in näherer zukunft kommt. aber man muss ja nicht bis in alle ewigkeit altlasten mitschleppen und wenn man sieht, wie lange solche dinge brauchen, sollten sie sich lieber heute als morgen einen kopf drum machen :)
Für den Fall, dass mein Kommentar da unklar war: Mir kann der Umstieg zu 64 Bit I'm Windows Ökosystem garnicht schnell genug vonstatten gehen. Nur ist so ein high level Whitepaper da halt wenig wert.

Das kann dir ein Intel- oder OS-Ingenieur wahrscheinlich in ein paar Tagen zusammenschreiben. Was es braucht ist ein strategisches Commitment, der wichtigsten Player (ich würde Mal sagen Intel und Microsoft), dass es das ist wo man mit dem Ökosystem hin will.
 
Die Frage ist halt welche Vorteile es mit sich bringen würde und ich glaube, dass genau dort der Grund liegt, warum es bisher nicht gemacht wurde.
 
An dieser Stelle muss man allerdings einwerfen, das schon die früheren Core-Erweiterungen der DSU nicht zu entsprechenden Produkten geführt haben.
Dynamiq war schon immer Schund.
Als das angekündigt wurde war Big.LITTLE gross im kommen. Die haben gross geworben das jedes Cluster eigene Spannung haben könnte... vorher waren alle little und alle Big cores auf gleicher Spannung am Laufen. Egal ob nur 2 der 4 Cores wirklich ausgelastet waren und das benötigten.
Und was kam dann? Die haben nur zwei Dynamiq Cluster verbaut... eins für die Big und eins für die Little Cores. Hat also genau 0 vorteil gebracht gegenüber der alten Lösung. Woaw.
Von da her bin ich froh haben wir mit den X Cores endlich eine separate boost Zone.

Frei nach dem Motto „Everything is bigger in Texas“, wo der Kern von Arm am Standort in Austin entwickelt wurde,
Scheint so als hätte ARM einen grossteils der Chipentwicklung nach Austin verlagert. Die A510 kommen zwar noch von Cambridge wies scheint, aber sind wohl wesentlich weniger Ressourcen dort. Oder basteln die neben den Cores noch mehr an anderen Funktionen rum?


Unterm Strich verbraucht der neue Little-Kern laut Arm 22 Prozent weniger bei gleicher Leistung oder bietet eine 8 Prozent höhere Leistung bei annähernd identischem Verbrauch.
Wir wissen ja alle wie das enden wird....
Yay 8% mehr Performance!



Aber ja...
Alles in allem bin ich positiv gestimmt. Das hört sich doch recht gut an. Endlich 32bit Ballast abgeworfen. Mehr auf effizient geachtet (wobei sie das jedes mal sagen und er dann mehr verbraucht ^^) der Snapdragon 8 Gen 3 könnte wieder ein Erfolg werden.


P.S Echt gut geschrieben die news. Danke.
 
eastcoast_pete schrieb:
Eher enttäuschend! Bei allen tatsächlichen und vermutlichen Verbesserungen bei den großen Kernen (X4 und A720) ist es doch schade und auch verwunderlich daß ARM nach wie vor ihre kleinen Kerne als in-order Designs ausführt.
OoO erzwingt ein deutlich größeres Budget bei Transistoren und schlussendlich Energie.
Siehe auch die Analyse von Chips and Cheese zu ARMs A53: https://chipsandcheese.com/2023/05/28/arms-cortex-a53-tiny-but-important/
Solang es nur darum geht simpelste Aufgaben zu lösen, wären größere Designs schlicht Verschwendung. Ein bisschen Protokoll für Netzwerkprotokolle, für Anwendungen Datenhäppchen via Push/Pull besorgen, Sound abspielen reicht die A5x und A5xx Familie ja locker.


eastcoast_pete schrieb:
Die bei Apples Bionic SoCs als "efficiency cores" geführten kleineren Kerne sind ja schon seit mehreren Generationen out-of-order Designs, und das ist wohl auch einer der Gründe warum diese Kerne gut die doppelte IPC haben wie die kleinen in-order Stock ARM Kerne; bei übrigens fast gleicher Leistungsaufnahme. Dazu kommt, daß mit mehr Leistung der kleinen Kerne es auch seltener notwendig ist, die großen (und mehr Strom verbrauchenden) Kerne zu benutzen, was Batterie spart.
In jedem Apple SoC (und jedem anderem SoC auch) sitzen meist noch ein gutes weiteres Dutzend ARM-Cores as Controller und Co-Prozessoren. Die sieht das Betriebssystem nicht, diese Controller können aber recht viel. Ich wäre mir da gar nicht so sicher, dass bei Apple keine noch kleineren inOrder Designs verbaut sind.
Wenn man dem Asahi Linux Projekt folgt, bekommt man immer wieder mit, wie die Entwickler neue Controller[1] "finden" und was die Firmware bei Apple alles im Hintergrund erledigen kann.
[1] Ohne genauere Analyse, was für Cores das sind. Das würde dem Ziel Linux auf Apple Si zu verbessern schlicht nicht helfen.

eastcoast_pete schrieb:
Wenn einer von Euch (CB) hier Mal die Gelegenheit hat, fragt ARM doch bitte, warum sie bei den kleinen Kernen immer noch auf in-order setzen.
Für moderne, mobile Geräte ist das eine gute Lösung. Moderne Geräte haben quasi ständig irgend eine aktive Verbindung, irgendwelche Sensoren die zu verwalten sind. Entweder packt man da zig Controller mit eigener Firmware in den SoC, oder man lässt den Spaß vom Betriebssystem/dessen Userspace bearbeiten und da reichen 1..4 kleine Kerne und sind effizienter als alle OoO Designs.

7H0M45 schrieb:
Generell bin ich mal gespannt auf den X4. Vor allem wie der im Vergleich zu den Apple Cores abschneidet
Wenn die X4 am Markt sind, wird der M3 bei Apple auch spruchreif sein. Ich würde davon ausgehen, dass Apple da weiterhin besser dasteht. Die meisten Lizenznehmer von ARM eskalieren die Möglichkeiten der IP-Blöcke nicht. Wo Apple einfach mal 192kB L1i Cache vorsieht, sind die realen Coretex X3 meist auf 64kB beschränkt, obwohl das Design mehr könnte. Beim ReorderBuffer ist es ähnlich, da eskaliert Apple, das X3 Design bleib da konservativer.
Leider fanden die Diskussionen und Analysen fast nur auf Twitter statt und das wieder auffinden ist entsprechend schwer (bis unmöglich, weil die Leute ihre Accounts gelöscht haben..). Aber Apple hat wirklich viel daran gesetzt ihre 8 Pipelines möglichst immer zu füllen. Da kann das X4 Design breiter sein, es deutet aber nichts daraufhin, dass auf eine optimale Füllung derart optimiert wurde und noch weniger deutet darauf hin, dass die kleinste Konfig des X4 (die halte ich für am wahrscheinlichsten, dass sie real implementiert wird), eine Chance hat die Pipelines wirklich gut zu füllen.

0x8100 schrieb:
32 bit apps sollen in ring 3 noch weiter funktionieren:
Anhang anzeigen 1362027
sie werden schon erkannt haben, dass ein komplett fehlender 32bit support wohl nicht so gut ankommt.
Bei Ring3 kann man aber auch ne Emulationsschicht drunter werfen. Entsprechend könnte Intel da wirklich großzügig alle 16bit und 32bit Befehle rauswerfen.
 
Ich will einen BREITEN Arm Chip fürs Notebook mit 8 Performance und 4-8 kleinen Cores, KI Beschleuniger, ordentlich Cache, breit angebundenen >=64GB LPDDR5 Ram, RDNA3 Grafik auf >=ps5 Niveau + En- und Decoder für alle relevanten Videoformate und für alle Teile des SoC bitte ordentliche Treiber im offiziellen Linux Kernel.
Sagt wer dem Weihnachtsmann Bescheid?
 
Zurück
Oben