News Geekbench: Apple M4 hat die mit Abstand höchste Single-Core-Leistung

Ich hätte so gerne MacOS auf dem iPad! Dann wäre es für mich ein perfektes Produkt :heul:
 
  • Gefällt mir
Reaktionen: Seven2758, Pamoli, StefanSch87 und 2 andere
DomDelux schrieb:
Fakt ist aber, ein schneller Kern ist immer, IMMER schneller und Effizienter als mehrere die die gleiche Aufgabe erledigen.
Nein, das stimmt so nicht.

Sofern eine Aufgabe paralellisierbar ist, sind mehrere kleine und einfache Kerne besser als wenige große mit hoher IPC und/oder hohem Takt.
Die hohe IPC komplexer Kerne wird durch ein überproportional großes Transitorbudget erkauft, was einfach mehr Energie braucht. Wenn man dann noch den Takt erhöht, wird der Kern zwar schnell, braucht aber auch entsprechend viel Energie.

Wie Du aber richtig sagst, lässt sie nicht jede Aufgabe beliebig parallelisieren, bzw. es gibt einen Kommunikationsoverhead der den Speedup bergrenzt (sie Amdahl Law).

Deswegen baut man ja mittlerweile CPUs mit einem Mix aus P und E Kernen.

Intel hat z.B. mittlerweile auch Xeon nur mit E-Kernen, denn bei manchen Anwendungen wie Webservern hat man sehr viele Threads die aber unabhängig sind.


C4rp3di3m schrieb:
Es gibt kaum Treiber, du kannst in ein ARM System nicht einfach so was Erweitern oder Anstecken, wie es beim X86 System mit Bios der Fall ist.
Für 99% der Dinge die man an einen Computer anschließt, haben Windows und Linux von Haus aus mittlerweile eigene Treiber dabei. Abgesehen davon sind Treiber heute meistens in C geschrieben und lassen sich einfach für eine neue Architektur übersetzen. Falls also Windows @ ARM genügend Verbreitung erlangen sollte, wird es auch genügend Treiber geben.

Ob es dazu kommt, ist eine andere Frage, aber das hat weniger mit Technik zu tun, als mit anderen Aspekten.

Piktogramm schrieb:
AVX, AVX2 und AVX512 sind tendenziell sehr effizient. Die Vektoren bzw. bedingt Matritzen mit skalaren Operationen zu berechnen würde ein Vielfaches an Zeit benötigen,
Ja Du hast recht. Habe mich falsch ausgedrückt. Intel hat große Probleme, die AVX Befehle im Powerbudget seiner Mobil-CPUs unterzubringen. Klar, ohne AVX geht manches nicht, die Hintegrundeffekte in Teams setzen z.B. AVX voraus. Aber auf meinem iPad und MacBook gehen die Effekte mit wesentlich weniger Energieverbrauch.

Hatsune_Miku schrieb:
Ich kann diese benches eh nicht für voll nehmen, auch bin ich mir zu 100% sicher das die Apple CPUs mit windows und Linux hoffnungslos verhungern werden.
Aha...
Also ich habe auf meinem MacBook Air sowohl Windows als auch Debian Linux, beides für ARM64 als VMs laufen. Das Debian Linux ist mit nativen ARM Binaries schneller als mein Ryzen 5 3600 und würde auch noch mit neueren Ryzens mitkommen.

Bei Windows fehlen mir native ARM Anwendungen zum Vergleich, aber selbst die Emulation erreicht fast 50% des Ryzens.

Apple hat bewiesen das ARM CPUs als vollwertige Desktop CPUs, selbst für anspruchsvolle Anwendungen wie Rendering, Simulationen, usw. geeignet sind. Auch Windows @ ARM scheitert bisher an fehlenden Produkten und Marktakzeptanz, nicht an technischen Problemen.

Übrigens kosten beide Systeme als VMs auf meinem Macbook natürlich etwas Akkulaufzeit (immerhin ist jeweils ein weiteres OS + Overhead des Hypervisors zu bewältigen), aber es läuft immer noch länger als jedes Intel Notebook was ich bisher hatte. Daran sieht man, das Windows keineswegs massiv ineffizienter als macOS ist.
 
  • Gefällt mir
Reaktionen: Zhan, Project 2501, ComputerJunge und 2 andere
Irgendwie verliert Apple immer weiter. Heute braucht man Multicore. Nicht SC.
 
Verstehe das nicht so ganz, mein M2 im 11 wird extrem heiß unter DaVinci, damit röste ich den Akku und die Laufzeit wird noch mieser als sie eh schon ist....
 
TomH22 schrieb:
[...]. Aber auf meinem iPad und MacBook gehen die Effekte mit wesentlich weniger Energieverbrauch.
Dazu müsste man echtmal Teams auf den Zahn fühlen, was es unter Windows und MacOS tut. Es sind ja verschiedene Möglichkeiten denkbar. Vom Nutzen unterschiedlicher Bibliotheken, dem Auslagern auf GPU/NPU [1] oder nur etwas andere Parameter bei der Kantenerkennung zum Freistellen und schon verschiebt sich da ja enorm was.
Ganz davon abgesehen sind die Apple SoCs gut und nehmen zu ihrer Zeit immer die technisch beste Fertigung mit.

[1] Das ist ja bei Microsoft auch gern mal so, dass da eine Abteilung mit DirectX und DirectCompute an sich gutes Zeug abliefert, aber die nächste Abteilung ignoriert es dann wieder..
 
  • Gefällt mir
Reaktionen: Project 2501 und TomH22
SirPopelAlot schrieb:
Ich hätte so gerne MacOS auf dem iPad! Dann wäre es für mich ein perfektes Produkt :heul:
Nur würden dann denke ich immer weniger Leute ein MacBook Pro kaufen, fühle mit mir - so ein MacOS Lite wäre super.

Hatte selbst 2 iPad Pros… und das OS ist einfach nicht das wahre für mich (außer man ist evtl. Grafik Designer, Tätowierer etc.)
 
derbe schrieb:
Heute braucht man Multicore. Nicht SC.
Nein. Multicore ist nur ein Weg zum Ziel hohe Performance bei gegebenem Powerbudget, auch bekannt als: Hohe Effizienz.

Generell gilt, dass wenn jemand die Wahl hätte zwischen einem Dualcore, der in einer perfekt parallelisierbaren Softwarewelt (die nicht unsere Welt ist) im perfekten Allroundbenchmark (den es nicht gibt) 1000 Punkte Singlecore und 2000 Punkte Multicore liefern würde und einem Quadcore mit 500 Punkten Singlecore und 2000 Punkten Multicore immer letzterer gewählt werden würde. Von diesem klaren Startpunkt ausgehend würde sogar noch recht lange in der Praxis der Griff zum Dualcore (obwohl es ein Dualcore ist und das klingt natürlich stark nach 00er-Jahre!) erfolgen; auch wenn der Quadcore 600 und 2400, 650 und 2600 und so weiter hätte. Natürlich, bei 1000 Singlecore und 4000 Multicore ist Ende, das ist klar. ;)

Ganz generell mal, wieso trotzdem quasi in jedem Kontext auf mindestens einen Dualcore gesetzt wird:
https://de.wikipedia.org/wiki/Amdahlsches_Gesetz
https://upload.wikimedia.org/wikipedia/commons/e/ea/AmdahlsLaw.svg
Selbst wenn das Programm nur 50% parallelisierbar ist, was ein echt miserabler Wert ist, und der maximal mögliche Speedup somit 2 beträgt, landet man durch den zweiten Kern schon bei einem 1,333. Das ist schon eine dolle Leistung.
 
  • Gefällt mir
Reaktionen: incurable
Gute Leistung, keine Frage. Allerdings kaum (~3%) IPC-Steigerung, die Mehrleistung kommt aus Takt und Kernanzahl. Mit AMD und Intel sind die Geekbench Ergebnisse nicht vergleichbar, da z.B. mein Intel Core i5-13600K ca. 30-35 Watt verbraucht (CB R23 Volllast ca. 180 Watt).

Es ist eigentlich kein schlechter Benchmark, soll aber eben den "normalen Gebrauch" testen. Cinebench ist ja nicht wirklich so wie die Leute ihre CPUs normalerweise nutzen sondern testet wie sich die CPU unter maximaler Auslastung verhält.
 
Für was genau benötigt man diese Leistung an einem Tablet mit abgespecktem Prozessor und noch abgespeckterem OS? Kann mich einer mal aufklären? Tanke euch!
 
derbe schrieb:
Irgendwie verliert Apple immer weiter. Heute braucht man Multicore. Nicht SC.
Für was denn? Games nutzen in der Regel maximal 8 Kerne, Office etc. nur einen. Das bisschen an Programmen was parallel läuft wird gefühlt auf einem Kern abgeruppt. Das Teil hat für das gebrauchte mehr als genug Kerne. Wo also brauchst du die Multicore Leistung in einen M4? Dafür wird es zusätzlich M4 Pro etc. geben.
 
  • Gefällt mir
Reaktionen: KlaasKersting und LuckyMagnum
iljasik schrieb:
Für was genau benötigt man diese Leistung an einem Tablet mit abgespecktem Prozessor und noch abgespeckterem OS? Kann mich einer mal aufklären? Tanke euch!
Ach so wahnsinnig abgespeckt ist das heutzutage auch nicht mehr. Dank USB-C und Dateiexplorer, sowie Apps die mit richtien Programmen mithalten können. Es wurden bereits ganze Alben und auch ganze Filme an iPads produziert. Wir haben neulich auch für ein Projekt am iPad schneiden müssen. Wenn man es mit Effekten nicht zu arg übertreiben will, sondern wirklich SCHNEIDET, mit ein paar Übergängen und etwas Text, ging das genauso flott wie am PC.
 
  • Gefällt mir
Reaktionen: Project 2501, StefanSch87 und TomH22
bensen schrieb:
Siehe oben. Das sind völlig andere CPUs mit anderem Design-Ziel.
Naja, aber der Punkt ist ja, dass der M4 Gleichzeitig effizient und schnell ist. Klar gibt's auch Intel chips, die weniger Leistung brauchen, aber die können dann halt auch bei Multicore nicht mehr mit dem Apple mithalten und sind wahrscheinlich trotzdem noch weniger effizient.

Cool Master schrieb:
Na ja es ist nicht unbedingt Chipfläche die man per se gewinnt sondern wie man Sachen anordnet. Bei x86 muss(!) das nach dem Muster A, B, C, D, .... passieren, da es sonst kein x86 ist. Da man bei ARM oder anderen neuen Architekturen nicht daran gebunden ist kann man ein völlig anderes Muster nehmen wie A, Z, F, H, ... wenn dies besser ist.
Was konkret sollen diese Buchstaben in deinem Beispiel sein?
 
derbe schrieb:
Irgendwie verliert Apple immer weiter. Heute braucht man Multicore. Nicht SC.
Leider Quatsch.
Ich würde mir auch wünschen, dass mehr Programme alle verfügbaren Threads nutzen könnten, doch das entspricht einfach nicht der Realität.
 
  • Gefällt mir
Reaktionen: Project 2501, Kalsarikännit und incurable
BAR86 schrieb:
Tatsächlich ziemlich stark im Geekbench. Genau hingeschaut liegt man 20% vorm M4 bei 10% mehr Takt, die IPC ist also so um 7-8% gestiegen. Kein Hexenwerk
Der Takt ist um 0,1 Ghz runter om Vergleich zum M3, gleiche Fertigung und trotzdem knapp 20% mehr im SingleCore, das ist nicht wenig binnen eines Jahres.
 
  • Gefällt mir
Reaktionen: incurable
Ich bin mir relativ sicher, dass Intel bzw. AMD auch ähnlich effiziente Designs mit x86-Architektur entwerfen könnten:

1) Execution Pipelines wieder etwas verkürzen
2) Befehlssatz auf x64-Only beschränken (siehe dazu Intel X86-S Whitepaper)
3) Taktfrequenz Single-Core Turbo maximal 4,0-4,5 GHz statt > 5 GHz
4) Durch 3. ein anderes Transistor-Design, Packdichte und anderes Routing
5) On-Chip LPDDR-X Speicher mit hoher Bandbreite, keine DIMM-Slots
6) keine 24x PCIe 5 Lanes und gefühlt 100x S-ATA/USB-Ports und anderes Gedöns

Macht man aber nicht, da sowohl die P-Cores von Intel, als auch die Zen-Cores von AMD eben ein extrem breites Spektrum abdecken müssen. Von der Nutzung eines Browsers auf einem Ultrabook bis hin zum SAP-HANA-Betrieb auf einer Server-Plattform ist bei den beiden Architekturen eben alles dabei. Die M-Serie von Apple oder die SnapDragons findet man eben selten in irgendwelchen Datenbank-Servern.

Am reinen Befehlssatz liegt es nicht wirklich, schon seit dem Pentium Pro arbeiten die CPUs intern als RISC und haben im FrontEnd nur noch einen Decoder. Das frisst natürlich extra Strom, dürfte mittlerweile nach 25 Jahren Optimierung aber nicht mehr das große Problem darstellen.

Das Problem der x86-Designs ist eben, dass sie eine viel breitere Anwendungspalette abdecken (müssen), weswegen man irgendwo im Chip-Design Kompromisse machen muss, damit praktisch jede rotzig programmierte Software oder Treiber lauffähig ist.

Wie effizient x86 sein kann, sieht man an unter anderem an den Werten für die AMD EPYC 8004 "Siena" auf Zen 4c-Basis. Da hat man eben einige Anpassungen vorgenommen und den Takt auf maximal knapp über 3,0 GHz beschränkt. (z.B. o.g. Punkte 3 und 4). Da kommen 64 Kerne in einem TDP-Budget von 175 Watt unter, was gerade mal noch inklusive dem ganzen UnCore-Bereich (Speichercontroller, PCIe-Lanes) etwa 2,5 Watt pro x86-Kern bedeutet. Rechnet man noch die 96 PCIe Gen5 Lanes raus, die bei Bedarf alleine vermutlich fast die Hälfte der TDP fressen würden, dürften mit allen Anpassungen und der aktuellen 3-nm-Fertigung sicher x86-Designs mit 1-1,5 Watt für den reinen Kern möglich sein.
 
  • Gefällt mir
Reaktionen: phanter, Project 2501, Flutefox und eine weitere Person
Hmmm.......

haha.jpg
 
  • Gefällt mir
Reaktionen: Benjamin_Blume
iljasik schrieb:
Für was genau benötigt man diese Leistung an einem Tablet mit abgespecktem Prozessor und noch abgespeckterem OS? Kann mich einer mal aufklären? Tanke euch!
Diese Leistung kommt "gratis". Wenn die Leistung stärker steigt als der Verbrauch, also die Effizienz durch die Leistung steigt, dann wird dein Tablet weniger warm und der Akku bleibt länger voll.

Wenn man keine App hat, die einen den Leistungsgewinn spüren lässt, sorgt das immerhin dafür, dass die CPU jetzt nicht mehr in 99,9% der Zeit schläft sondern in 99,99% der Zeit.
 
  • Gefällt mir
Reaktionen: Project 2501 und incurable
Cool Master schrieb:
Nur im Air drosselt die CPU etwas weil 100% passiv.
Und selbst das lässt sich ja mit einem Thermal Mod umgehen, wobei ich bei mir noch keinen Unterschied gemerkt habe – vermutlich lief das Gerät noch nie unter Volllast …

Gruß Jens
 
  • Gefällt mir
Reaktionen: Cool Master
Geekbench und dann ARM Prozessor. Absolut wertlos für das "reale" Leben. Intel und AMD müssen für eine Galaxie kompatibel sein, Apple nur für ihren eigenen Planeten.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Project 2501, Flutefox, coasterblog und 3 andere
Zurück
Oben