Elverado
Lieutenant
- Registriert
- Jan. 2018
- Beiträge
- 676
Ehrlich gesagt fehlen mir in der ganzen Diskussion um x86 vs ARM bzw. Apple vs Intel/AMD ein paar Punkte:
1. Effizienz und Fertigungsprozess
Beim Effizienzvergleich könnte es helfen, eine Parallele zu Cezanne (zur besseren Einordnung) zu ziehen.
Der 5980HS (35W sustained) (im Geekbench Diagramm) liegt ca. 50% hinter dem M1 Max (30 W sustained).
Der 5980HS verfügt über 8c16t, der M1 Max über 10c10t.
Ganz entscheidend ist hier aber der Fertigungsunterschied. 5nm ist ein neuer Full-Node. Das macht keine 50% aus, liegt aber sicher bei 15-20%
(Der Vergleich der Transistoren&Größe ist absolut irreführend und nichtssagend, da im M1 (Pro/Max) CPU & iGPU Anteile vermischt enthalten sind. Das lässt sich so nicht auf andere Produkte übertragen. Ein GA100 besitzt z.B. dedizierte Raytracing accelerators, der M1 nicht, ein Threadripper deutlich mehr Kerne/Power, dafür aber keine iGPU usw., usw.)
2. Der Benchmark und Speicherausbau
Der Geekbench ist extrem Speicher-lastig. Der M1 Chip verwendet aber schon seit jeher riesige Caches (L1 & L2), wobei zudem der Durchsatz des RAMs deutlich höher ist:
Beim M1: verlöteter LPDDRX-DDR4 Speicher mit 4266 Mhz bei 128 bit -> 68,25 GB/s
(entspricht DualChannel 4266 Mhz DDR4 RAM. Normale Notebookchips (x86) werden aber max.
nur mit 3200 Mhz spezifiziert (s. Jedec), was 50 GB/s entspricht)
Bei M1 Pro & Max: LPDDR5 -Speicher, wo der Speicherdurchsatz nochmals steigt!
//Nachtrag: M1 Pro: 200GB/s, M1 Max 400 GB/s, durch LPDDR5 6400 bei 256/512 bit. Dieser Unterschied ist immens und dürfte den Großteil des Vorsprungs im Geekbench ausmachen!
3. Andere Benchmarks - der Cinebench
Vergleichen wir das Ganze in einem Speicher-neutralerem Benchmark (um die Unterschiede zwischen den Architekturen aufzuzeigen) ergibt sich ein etwas anderes Bild:
So erreicht der M1 8c8t bei Cinebench R23 Multicore s. Notebookcheck 1% Mehrleistung zu einem 4700U (ebenfalls 8c8t). Nun muss man hier allerdings noch die Leistungsaufnahme berücksichtigen, die bei dem M1 bei 28W sustained, beim getesteten 4700 U bei 37,5 W sustained liegt. Allerdings gibt es auch Werte von einem Tuxedo Aura (4700U) mit 20 W sustained. Der Vorsprung des M1 wächst dann auf 6% (der M1 darf dann aber 8 Watt mehr ziehen).
Ein weiteres Beispiel wäre 7zip, wo der M1 11% vorne liegt.
Man kann also grob sagen, dass im Architekturvergleich (ARM vs x86) die Effizienz im Falle von M1 vs Zen2 ähnlich groß ist, mit leichtem Vorsprung für den M1.
Und das gilt dann auch für M1 Pro und Max, da die Grundarchitektur nicht geändert wurde.
(siehe Single-Core Werte).
4. "Schönrechnerei?"
Wieso ergibt es Sinn, den Speicher 'herauszurechnen' (bzw. Benchmarks zu nehmen die nicht ganz so extrem auf Speicher& Caches anspringen), wenn man Architekturen vergleichen möchte?
Nun, gehen wir einen Schritt zurück und schauen uns Broadwell an: 128 MB edRAM. Dieser war zwar primär für die iGPU gedacht, konnte aber (und wurde auch) von der CPU genutzt.
Im Geekbench erreichen wir damit mehr als 4000 Punkte Link. Damit würden wir 4c/8t Prozessoren aktueller Generationen überholen (ein i3 10100 - ebenfalls 4c8t erreicht knapp weniger Punkte, bei 300 Mhz mehr Takt!)
Jeder Hersteller kann recht 'einfach' größere Caches verbauen. Das Problem: es ist teuer.
Was hier für den DIY-Markt problematisch ist, gilt aber nicht für Apple-Produkte. Dort wird (fast) jeder Preis gezahlt und dementsprechend sind für Apple die höheren Herstellungskosten absolut kein Thema (bzw. lassen sich an anderen Punkten des geschlossenen Ökosystems wieder hereinholen).
Es handelt sich hier also nicht um ein Alleinstellungsmerkmal (x86/ARM)!
Wenn ich einen ARM-Prozessor um xy% mit größeren/schnelleren Caches beschleunigen kann, so kann ich damit auch grob ähnliche Steigerungen bei x86 erreichen.
Ja, je nach Anwendungsszenario (Speicherlastigkeit) ist der M1 (Pro/Max) deutlich schneller (bei gleicher TDP) als aktuelle Prozessoren. Aber das gilt eben nur in speziellen Szenarien und keinesfalls allumfassend/allgemein!
5. Fazit
Der M1 (Pro/Max) ist kein schlechter Prozessor und ARM keine schlechte Architektur. Aber es ist eher schwer nachzuvollziehen, inwiefern jetzt x86 bzw. AMD & Intel "zerstört"/"düpiert" werden. Die Leistung in nicht-speicherlastigen Szenarien liegt auf Zen2-Niveau. Es ist beeindruckend dass das mit dem 1. Wurf gelungen ist. Allerdings ist das auch wieder nicht ganz korrekt, da man ja sehr wohl schon mit den iPhones Erfahrungen hatte (Die Axx Prozessoren) und Apple zudem ein Unternehmen mit ungleich größeren finanziellen Ressourcen ist (4 mal soviel Umsatz wie Intel). Zudem betreffen die Entwicklungen von Apple den DIY-Markt nur sekundär aufgrund des geschlossenen Ökosystems.
Das Ganze hier stellt meine persönliche Sicht auf die Dinge dar, aber ich denke, dass diese Sichtweise nicht komplett unbegründet ist.
1. Effizienz und Fertigungsprozess
Beim Effizienzvergleich könnte es helfen, eine Parallele zu Cezanne (zur besseren Einordnung) zu ziehen.
Der 5980HS (35W sustained) (im Geekbench Diagramm) liegt ca. 50% hinter dem M1 Max (30 W sustained).
Der 5980HS verfügt über 8c16t, der M1 Max über 10c10t.
Ganz entscheidend ist hier aber der Fertigungsunterschied. 5nm ist ein neuer Full-Node. Das macht keine 50% aus, liegt aber sicher bei 15-20%
(Der Vergleich der Transistoren&Größe ist absolut irreführend und nichtssagend, da im M1 (Pro/Max) CPU & iGPU Anteile vermischt enthalten sind. Das lässt sich so nicht auf andere Produkte übertragen. Ein GA100 besitzt z.B. dedizierte Raytracing accelerators, der M1 nicht, ein Threadripper deutlich mehr Kerne/Power, dafür aber keine iGPU usw., usw.)
2. Der Benchmark und Speicherausbau
Der Geekbench ist extrem Speicher-lastig. Der M1 Chip verwendet aber schon seit jeher riesige Caches (L1 & L2), wobei zudem der Durchsatz des RAMs deutlich höher ist:
Beim M1: verlöteter LPDDRX-DDR4 Speicher mit 4266 Mhz bei 128 bit -> 68,25 GB/s
(entspricht DualChannel 4266 Mhz DDR4 RAM. Normale Notebookchips (x86) werden aber max.
nur mit 3200 Mhz spezifiziert (s. Jedec), was 50 GB/s entspricht)
Bei M1 Pro & Max: LPDDR5 -Speicher, wo der Speicherdurchsatz nochmals steigt!
//Nachtrag: M1 Pro: 200GB/s, M1 Max 400 GB/s, durch LPDDR5 6400 bei 256/512 bit. Dieser Unterschied ist immens und dürfte den Großteil des Vorsprungs im Geekbench ausmachen!
3. Andere Benchmarks - der Cinebench
Vergleichen wir das Ganze in einem Speicher-neutralerem Benchmark (um die Unterschiede zwischen den Architekturen aufzuzeigen) ergibt sich ein etwas anderes Bild:
So erreicht der M1 8c8t bei Cinebench R23 Multicore s. Notebookcheck 1% Mehrleistung zu einem 4700U (ebenfalls 8c8t). Nun muss man hier allerdings noch die Leistungsaufnahme berücksichtigen, die bei dem M1 bei 28W sustained, beim getesteten 4700 U bei 37,5 W sustained liegt. Allerdings gibt es auch Werte von einem Tuxedo Aura (4700U) mit 20 W sustained. Der Vorsprung des M1 wächst dann auf 6% (der M1 darf dann aber 8 Watt mehr ziehen).
Ein weiteres Beispiel wäre 7zip, wo der M1 11% vorne liegt.
Man kann also grob sagen, dass im Architekturvergleich (ARM vs x86) die Effizienz im Falle von M1 vs Zen2 ähnlich groß ist, mit leichtem Vorsprung für den M1.
Und das gilt dann auch für M1 Pro und Max, da die Grundarchitektur nicht geändert wurde.
(siehe Single-Core Werte).
4. "Schönrechnerei?"
Wieso ergibt es Sinn, den Speicher 'herauszurechnen' (bzw. Benchmarks zu nehmen die nicht ganz so extrem auf Speicher& Caches anspringen), wenn man Architekturen vergleichen möchte?
Nun, gehen wir einen Schritt zurück und schauen uns Broadwell an: 128 MB edRAM. Dieser war zwar primär für die iGPU gedacht, konnte aber (und wurde auch) von der CPU genutzt.
Im Geekbench erreichen wir damit mehr als 4000 Punkte Link. Damit würden wir 4c/8t Prozessoren aktueller Generationen überholen (ein i3 10100 - ebenfalls 4c8t erreicht knapp weniger Punkte, bei 300 Mhz mehr Takt!)
Jeder Hersteller kann recht 'einfach' größere Caches verbauen. Das Problem: es ist teuer.
Was hier für den DIY-Markt problematisch ist, gilt aber nicht für Apple-Produkte. Dort wird (fast) jeder Preis gezahlt und dementsprechend sind für Apple die höheren Herstellungskosten absolut kein Thema (bzw. lassen sich an anderen Punkten des geschlossenen Ökosystems wieder hereinholen).
Es handelt sich hier also nicht um ein Alleinstellungsmerkmal (x86/ARM)!
Wenn ich einen ARM-Prozessor um xy% mit größeren/schnelleren Caches beschleunigen kann, so kann ich damit auch grob ähnliche Steigerungen bei x86 erreichen.
Ja, je nach Anwendungsszenario (Speicherlastigkeit) ist der M1 (Pro/Max) deutlich schneller (bei gleicher TDP) als aktuelle Prozessoren. Aber das gilt eben nur in speziellen Szenarien und keinesfalls allumfassend/allgemein!
5. Fazit
Der M1 (Pro/Max) ist kein schlechter Prozessor und ARM keine schlechte Architektur. Aber es ist eher schwer nachzuvollziehen, inwiefern jetzt x86 bzw. AMD & Intel "zerstört"/"düpiert" werden. Die Leistung in nicht-speicherlastigen Szenarien liegt auf Zen2-Niveau. Es ist beeindruckend dass das mit dem 1. Wurf gelungen ist. Allerdings ist das auch wieder nicht ganz korrekt, da man ja sehr wohl schon mit den iPhones Erfahrungen hatte (Die Axx Prozessoren) und Apple zudem ein Unternehmen mit ungleich größeren finanziellen Ressourcen ist (4 mal soviel Umsatz wie Intel). Zudem betreffen die Entwicklungen von Apple den DIY-Markt nur sekundär aufgrund des geschlossenen Ökosystems.
Das Ganze hier stellt meine persönliche Sicht auf die Dinge dar, aber ich denke, dass diese Sichtweise nicht komplett unbegründet ist.
Zuletzt bearbeitet: