Fleischmann schrieb:
(und das meist mit korrekt sachlichen Argumenten)
Also, wenn ich mir die meisten Argumente der Diskussionsteilnehmer durchlese, die in den Themen die Leistung des M1 relativieren wollen, dann sind diese Argumente selten korrekt und auch nur auf den ersten Blick sachlich, weil oft nur Stichworte - Fertigungsvorteil, APU - oder teils verfälschte Zusammenhänge - schnellerer RAM - oder gar falsche Behauptungen aufgestellt werden - mehr Cache. Ein weiterer Teil der Argumente stürzt sich dann auf die Folien von Apple und missdeutet diese absichtlich falsch, um dann einen kleinen Skandal zu produzieren.
Nimmt man sich dann die wirklichen Fakten über verschiedene Seiten hinweg und stellt ein paar Rechnungen an und setzt diese dann in Relation zueinander, kann man viele der angeblich korrekt sachlichen Argumente schnell entkräften und merkt, dass diese Argumente eben nicht korrekt sind und auch nicht sachlich sind.
1. Argument: Der M1 ist ja nur so schnell, weil er mehr Cache hat als SunnyCove und Zen3.
Im ersten Augenblick ist das Argument sachlich, ist aber nicht gänzlich korrekt.
Kern | L1 | L2 | L3 | Gesamt pro Kern | Relativ |
---|
Firestorm | 320 KiB | 3072 KiB | - | 3392 KiB | 100 % |
Zen 3 | 64 KiB | 512 KiB | 4096 KiB | 4672 KiB | 138 % |
Golden Cove | 80 KiB | 1280 KiB | 3072 KiB | 4432 KiB | 131 % |
Der M1 hat größere L1 und L2-Caches, dafür fällt der L3-Cache weg. Zen 3 und GoldenCove besitzen jedoch mehr Cache. Das Argument ist also in der Form nicht korrekt und hält einem Faktencheck nicht stand!
2. Argument: Der M1 hat schnelleren RAM?
Im ersten Augenblick ist das Argument sachlich, aber auch das ist nicht gänzlich korrekt, sondern es kommt darauf an, was man gegeneinander stellt und was man dann rechnet.
SoC | Speicherinterface | Speicher | Bandbreite | Bandbreite pro Kern |
---|
M1 | 128 Bit | LPDDR4X-4266 | 68 GiByte/s | 8,5 GiByte/s |
M1 Pro | 256 Bit | LPDDR5-6400 | 205 GiByte/s | 20,5 GiByte/s |
M1 Max | 512 Bit | LPDDR5-6400 | 410 GiByte/s | 41 GiByte/s |
M1 Ultra | 1024 Bit | LPDDR5-6400 | 810 GiByte/s | 41 GiByte/s |
Ryzen 5950X | 128 Bit | DDR4-3200 | 47 GiByte/s | 2,93 GiByte/s |
Ryzen 6950H | 128 Bit | LPDDR5-6400 | 102,5 GiByte/s | 12,8 GiByte/s |
Core i7 12900K | 128 Bit | DDR5-4800 | 75 GiByte/s | 4,68 GiByte/s |
Core i7 12900HK | 128 Bit | LPDDR-5200 | 81,25 GiByte/s | 5,8 GiByte/s |
Der M1 ist mit 8,5 GiByte/s theoretisch sehr gut angebunden, aber wird von den neuen Ryzen 6950H pro Kern geschlagen, an die Bandbreite der Max von 41 GiByte/s kommt zwar keiner wirklich ran, aber ist die Speicherbandbreite wirklich von Bedeutung für den Kern?
SoC | Cinebench R23 Punkte | Leistung Relativ | Bandbreite Relative |
---|
M1 | 1514 | 100 % | 100 % |
M1 Pro | 1527 | 100 % (100,8 %) | 241 % |
M1 Max | 1534 | 101 % | 482 % |
Sehen wir uns das Ergebnis an, dann fällt auf, dass die einzelnen Firestorm-Kerne trotzt drastisch gestiegener Bandbreite alle am Ende im Cinebench R23 quasi das gleiche leisten und die deutlich gesteigerte Bandbreite überhaupt keinen Einfluss auf den einzelnen Kern haben. Ändert sich das beim Multicore?
SoC | Cinebench R23 | Kerne | Firestorm | Leistung Relativ | Bandbreite Relativ | Kerne Relativ | Firestorm Relativ |
---|
M1 | 7800 | 8 | 4 | 100 % | 100 % | 100 % | 100 % |
M1 Pro | 12339 | 10 | 8 | 158 % | 241 % | 125 % | 200 % |
M1 Max | 12370 | 10 | 8 | 158 % | 482 % | 125 % | 200 % |
Sieht für das Argument "Bandbreite" auch nicht viel besser aus, der M1 Max kann sich trotz nominell doppelter Bandbreite nicht absetzen und zwischen M1 und den anderen beiden SoCs stehen 25 % mehr Kerne auf der Uhr und ganze 100 % mehr an FireStorm-Kernen. Die Leistung zwischen M1 und M1 Max geht primär auf die Kerne zurück, nicht auf die gesteigerte Bandbreite.
Dass Bandbreite für die Kerne nicht so wichtig ist, kann man auch sehen, wenn man sich mal den Zen oder GoldenCove nimmt:
Prozessor | Cinebench R23 | Takt | Leistung Relativ | Bandbreite Relativ |
---|
Ryzen 5950X | 1684 | 4,9 GHz | 100 % | 100 % |
Ryzen 6900 | 1583 | 4,9 GHz | 94 % | 436 % |
Core i9 12900K | 2032 | 5,3 GHz | 100 % | 100 % |
Core i9 12900HK | 1837 | 5,0 GHz | 90 % | 123 % |
Hier zeigt sich eher, dass der Takt entscheidender ist, als die Bandbreite, ähnlich wie beim M1.
Aber wir wollen ja die Multi-Core-Ergebnisse nicht unterschlagen:
Prozessor | Cinebench R23 | Kerne | Leistung Relativ | Kerne Relativ | Bandbreite Relativ |
---|
Ryzen 5800X | 14812 | 8 | 100 % | 100 % | 100 % |
Ryzen 5950X | 28782 | 16 | 194 % | 200 % | 50 % |
Der 5800X kann pro Kern die doppelte Bandbreite abgreifen wie im 5950 X, es zeigt sich aber, doch 100 % mehr Kerne werden in ca. 100 % mehr Leistung umgesetzt.
Sieht nicht gut aus für das Argument des schnelleren RAMs, denn scheinbar werden weder die Zen-Kerne noch die GoldenCove-Kerne durch den "langsameren" RAM und durch die geringere Speicherbandbreite ausgebremst.
3. Argument: M1 kann kein SMT, ein Intel/AMD-Kern leisten eigentlich viel mehr als ein M1-Kern und Teile der Leistung der Intel/AMD-Kerne liegt beim 1T-Test brach!
Erscheint im ersten Moment wieder sachlich, denn es stimmt. Zen und SunnyCove beherrschen SMT und können damit zwei Threads pro Kern ausführen. Das bedeutet aber nicht, wie hier gerne angedeutet wird, dass die Kerne eigentlich mehr leisten könnten, als in einem 1T-Test ermittelt wird. SMT kann sich positiv auf nT-Szenarien auswirken, kann aber in einem 1T-Test sogar negativ sein, weil Ressourcen ggf. durch den anderen Thread blockiert werden.
Gehen wir erst mal auf die einfache Rechnung und nehmen die Nackten zahlen:
Prozessor | Punkte (normiert) | Punkte Kern | Relativ | Punkte Thread | Relativ |
---|
M1 Pro (3,2 GHz) | 3856 | 386 | 100 % | 386 | 100 % |
Ryzen 5800X (4,8 GHz) (8-Kerne) | 3413 | 426 | 110 % | 213 | 55 % |
Core i5 12600 (4,0 GHz) (6-Kerne) | 2779 | 463 | 120 % | 232 | 60 % |
Es ist also richtig, dass Zen und SunnyCove mit SMT - gegenüber dem 1T-Test - aufholen und bei der Leistung pro Kern sogar überholen. Man muss an der Stelle aber so fair sein und sagen, dass diese Tabelle zuungunsten des M1 Pro verfälscht wird.
Da wir aber die Punkte und Konfiguration kennen, können wir uns zumindest etwas annähern: 7800 Punkte bei 4 Firestorm + 4 Icestorm sowie 12340 beim Pro mit 8 Firestorm + 2 Icestorm. Kann man zwei lineare Gleichungen erstellen - die aber immer noch etwas verfälschen: 7800 = 4y + 4x; 12340 = 8y + 2x. Kommen wir dann für die Firestorm-Kerne auf 1407 Punkte bei 3,2 GHz oder 439 bei 1 GHz - ich liebe lineare Gleichungssysteme - und schon verändert sich das Bild erneut und Zen 3 steht plötzlich pro Kern etwas schlechter da, der Vorsprung des Golden Cove verringert sich auf 5 % und pro Thread deklassiert der Firestorm beide Konkurrenten und ist knapp doppelt so schnell.
Prozessor | Punkte Kern | Relativ | Punkte Thread | Relativ |
---|
M1 Pro | 439 | 100 % | 439 | 100 % |
Zen 3 | 426 | 97 % | 213 | 49 % |
Golden Cove | 463 | 105 % | 232 | 52 % |
Der Hinweis auf SMT ist durchaus richtig und Zen sowie GoldenCove können mit SMT bei der durchaus Kernleistng aufholen, gleichzeitig zeig es aber auch, dass Apple so etwas wie SMT beim Firestorm-Kern scheinbar nicht benötigt, um die Leistung des Kernes abzurufen, während Intel und AMD SMT sehr wohl benötigen.
Ob SMT und damit der Hinweis dass sich bei AMD und Intel die Kerne langweilen, sich wirklich als Argument gegen den M1 eignen, wenn man sich die Zahlen dann genau ansieht?
4. Apple hat mit N5 einen Fertigungsvorteil, wenn Zen 3 und GoldenCove in N5 gefertigt werden würde, wären die Prozessoren genauso effizient / effizienter!
Wir vergleichen primär erst mal Produkte mit Produkten. Es ist - aktuell - eigentlich irrelevant, ob ein Zen 3 in N5 effizienter wäre oder ein GoldenGove in N5, diese Prozessoren gibt es zum jetzigen Zeitpunkt nicht! Ich füge kurz ein anderes Zitat ein, weil es mich an der Stelle etwas ärgert, ich darauf aber auch gleich mit eingehen kann:
bensen schrieb:
Falscher Vergleich. Der AMD ist deutlich schneller und verbraucht dafür überproportional viel, da er weit weg vom Sweetspot taktet.
Ich nehme die Zahlen, die ich in Tests von Golem.de finde und damit als halbwegs verifiziert betrachten kann, darauf aufbauend gehe ich bereits ein Wagnis ein, da dann bereits mit zwar plausiblen, dennoch hypothetischen Faktoren rechne, um Vergleiche anzustellen. Alleine die Tatsache, dass ich ein Produkt auf einen fiktiven N5-Prozess ziehe, ist bereits eine Schönrechnung des Produktes und soll nur die Tendenz zeigen.
Ich nehme nun die Zahlen von Golem.de bei ähnlichen Verbräuchen - 30 - 35 Watt - und nutze diese als Ausgangsbasis und ich bin an der Stelle auch so fair und verwende die aktuellen AlderLake-Prozessoren für Notebooks und ebenso die neuen Ryzen 6x00 als Ausgangsbasis mit Zen3+ und nicht den Vorgänger 5x00 oder die SunyCove-Generation.
SoC | R23 Punkte | TDP | Verbrauch | Punkte/W | Relativ |
---|
M1 Pro | 12389 | 35 W | 35 W | 354 | 100 % |
Ryzen 6900 HS | 9142 | 30 W | 30 W | 305 | 86 % |
Core i7 12700 HK | 8521 | 30 W | 30 W | 284 | 80 % |
Der gesamte M1 darf sich theoretisch bis zu 90 Watt krallen mit seiner GPU, was man so findet, liegt bei reiner CPU-Last die TDP bei 30 - 35 W. Eine Quelle sprach - Golem - bei Cinebench R23 von ca. 27 Watt aus der Steckdose für das gesamte System, deswegen auch die 31 Watt.
Wie bereits in dem Thema geschrieben und in einem anderen: Ein Fullnode verringert bei gleicher Leistung den Energiehunger um 20 - 30 %, also Faktor 0,7 - 0,8:
SoC | R23 Punkte | Verbrauch (0,8) | Verbrauch (0,7) | Punkte/W (0,8) | Punkte/W (0,7) | Relativ |
---|
M1 Pro | 12389 | 35 W | 35 W | 354 | 354 | 100 % |
Ryzen 6900 HS | 9142 | 24 W | 21 W | 381 | 435 | 108 - 122 % |
Core i7 12700 HK | 8521 | 24 W | 21 W | 355 | 405 | 100 - 114 % |
Apple ist N5 gegen N7 aktuell dem Zen3+ ca. 16 % bei der Effizienz überlegen und dem GoldenCove um ca. 24 %, Intel hat den Abstand durch die neue Architektur verringert und AMD hat es durch neue Stromsparmechanismen geschafft den Abstand auf 16 zu schrumpfen, man muss also AMD als auch Intel hier durchaus Respekt zollen.
Würde man nun einen Ryzen 6900 HS in einem N5 Prozess fertigen, wäre er ca. 8 - 22 % effizienter als der M1 Pro, durchaus eine beachtliche Leistung. Für Intel läuft es auf 0 - 14 % hinaus. Man muss aber an der Stelle anmerken, dass der M1 Pro nicht am effizientesten ist, das ist nämlich der M1 mit seinen 15 W und den wollen wir nicht vergessen - oh ich bin so gemein.
SoC | R23 Punkte | Verbrauch (0,8) | Verbrauch (0,7) | Punkte/W (0,8) | Punkte/W (0,7) | Relativ |
---|
M1 | 7850 | 15 W | 15 W | 523 | 523 | 100 % |
Ryzen 6900 HS | 9142 | 24 W | 35 W | 381 | 435 | 72 - 83 % |
Core i7 12700 HK | 8521 | 24 W | 21 W | 355 | 405 | 67 - 77 % |
Warum erwähne ich den M1 noch? Na, weil M1 und Ryzen 6900 HS sowie 12700 HK sich bei der Leistung deutlich näher sind, als dem M1 Pro:
SoC | / M1 | / M1 Pro |
---|
Ryzen 6900 HS | 116 % (16 Prozentpunkte) | 73 % (27 Prozentpunkte) |
Core i7 12700 HK | 108 % (8 Prozentpunkte) | 68 % (32 Pronzektpunkte) |
Man kann den Hinweis auf die Effizienz also über zwei Wege gehen, wir nehmen aktuell 3 Produkte in einer ähnlichen TDP-Klasse, hier 30 - 35 Watt, und nehmen den oft angeben Faktor von 20 - 30 % weniger Energie bei gleicher Leistung und wir sehen, dass ein GoldenCove und ein Zen3+ effizienter werden können. Alternativ kann man den Vergleich auch anders aufziehen und geht in die ähnliche Leistungsklasse und man sieht, dass der M1 durchaus selbst mit hypothetischen Produkten ein gutes Stück weg ist.
Auch hier gilt also wieder: Das Argument ist zwar im ersten Moment durchaus sachlich, aber es lässt dennoch einiges an Interpretationsspielraum und ohne Kontext ist es nicht viel Wert.
5. Apple lügt, was ihre Folien und Vergleiche angeht. Eigentlich sind die Abstände viel geringer oder gar umgekerht.
Diesen Punkt schenke ich mir an der Stelle, denn damit wäre dieser Beitrag fast als Hausarbeit oder Artikel zu gebrauchen.
Nur soviel sei gesagt: Man muss sehr genau auf den Kontext achten, den Apple in den Folien wählt und was sie dann genau vergleicht. Ich sag an der Stelle nur "Leistung pro Watt" und darauf aufbauend dann so aussagen wie, dass ein Prozessor um 90 % schneller ist als die Produkte der Konkurrenz. Da ist dann die Frage: Worauf bezieht Apple die Aussage.
Apple ist sehr geschickt darin Statistiken zu erstellen und dann darauf passende Diagramme und Aussagen zu kreieren. Ebenso lässt Apple gerne - und das ist wichtig - all zu genaue Zahlen weg, sondern arbeite mit dem statistischem Mittel, was auch sehr hilfreich ist.
Man sollte an der Stelle nicht versuchen Apple wirklich direkt zu greifen, dass geht eher nach hinten los, weil Apple nicht wirklich etwas unwahres behauptet. Da gibt es geschicktere Wege, die bedeuten nur Arbeit, ungefähr die Arbeit, die ich mir gerade hier gemacht habe.
Fleischmann schrieb:
Das ist glaube ich der Kernpunkt, der viele hier dazu motiviert, den M1 mit Fakte zu entzaubern und die Situation und Faktenlage unaufgeregt und ohne Apple-Marketeing-Hype richtigzustellen.
Nein, genau das machen die meisten Apple-Kritiker hier eben nicht. In der Regel werden ein paar Stichworten als auch ein paar Zahlen - deine Fakten - in den Raum geworfen und die Leute denken dann, dass sie damit eine wirklich belastbare Argumentation abgeleifert haben, was dann in der Regel nicht so ist.
Ich habe in einigen Themen bereits die Fakten als auch die angeblich "sachlichen Argumente" relativ schnell mit simplen hypotehtischen Annahmen - z.B. das Einsparpotential bei eine Fullnode-Step - sowie einfacher Schulhofmathematik - Prozentrechnen und Dreisatz - zum Teil entsprechend entkräften oder auch als Gegenargument verwenden können, in dem ich mir eben nicht nur Stumpf Fakten aufzähle und Stichworte liefer, sondern mir die Mühe mach die Fakten und Stichworte wirklich zu Thesen zu verarbeiten um daraufaufbauend auch eine Aussage zu treffen.
Ich bin jetzt mal die 5 Standardstichworte, die hier immer wieder fallen durchgegangen und ich habe entsprechend über mehre Seiten die Zahlen zusammen gesucht und auch aufbereitet - also das was man mit Fakten machen sollte, wenn man sie als Argument nutzen will.
Die Firestorm-Kerne für sich gesehen, sind - wenn man mal alle Faktoren betrachtet - durchaus eine Wucht, an denen Intel als auch AMD immer noch zu knabbern haben. Apple ist natürlich für Intel und AMD einholbar und Intel ging jetzt den ersten Schritt mit GoldenCove zu einem "ultrabreiten" Design. Bei AMD wird man abwarten müssen, ob Zen 4 schon dahin den Weg vorbereitet oder ob das erst mit Zen 5 kommt.
Zen3+ zeigt aber aktuell auch sehr gut, welches Potential in modernen CPU-Designs abseits der Architektur selbst noch steckt um die Effizienz zu erhöhen und man muss da vor AMD den Hut ziehen und AMD ist auf den richtigen Weg. Man kann gespannt sein, was da kommt und in welche Richtung AMD geht.
Also nein, die wenigsten der Kritiker hier stellt das Apple-Marketing-Hype richtig und die wenigsten können auch den M1 wirklich entzaubern, dafür geben sie sich nicht genug Mühe. Es reicht nicht nur Stichworte und ein paar Fakten zu liefern, wenn man etwas entzaubern will, dann muss man da wesentlich mehr Arbeit hinein stecken!
bensen schrieb:
0.7 sind zu viel. Rechne doch einfach mit der Anzahl Transistoren.
Es geht mir weder um Transistoren noch sonst was. Ich wollte damit einfach nur aufzeigen, dass man an das Thema sehr wohl heran gehen kann mit entsprechenden Hypothesen um auch etwas mehr Substanz in der Argumentation zu liefern, als einfach nur Stumpf mit Stichworten und halbgaren Thesen um sich zu werfen, die als Grundlage für eine Diskussion eigentlioch ungeeignet sind.
bensen schrieb:
Wurde bedeuten, der Interconnect kostet nichts.
Auch erneut: Das sind einfach hypothetische Zahlen und gerade Cinebench ist einer der Benchmarks, die relativ gut skalieren, auch wenn ein Interconnect dazwischen liegt, weil die einzelnen Threads nicht wirklich mit einander kommunizieren müssen.
KurzGedacht schrieb:
Du vergisst dass der I/O die in 12nm gefertigt wird und nicht in 7nm.
Nein, das habe ich nicht vergessen. Nur dass AMD als auch andere Hersteller immer wieder geschrieben haben, dass es einige Schaltgruppen gibt, die so überhaupt nicht mit den üblichen Nodes skalieren.
Aber auch extra für dich: Das sind rein hypothetische Rechnungen, die einach nur ein Indiz liefern sollen und die man dann einfach mal dahin rotzt, damit man überhaupt mal was greifbares hat, als einfach nur irgendeine plattes Stichwort oder halbgare Aussage, die hier teilweise als "Argumente" angesehen werden.
-- Edit --
Im übrigen: Das Suchen nach Informationen, das aufbereiten, zusammen Fassen, Rechnen und Co hat gut 4 Stunden gedauert! So viel Zeit muss man sich dafür nicht nehmen, aber man sollte sich schon wirklich etwas Mühe geben, wenn man etwas entzaubern will!