News AMD Phoenix2 mit Zen 4 & 4c: Die erste big.LITTLE-APU erblickt heimlich das Licht der Welt

Bei der ursprünglichen Aussage ging es um 20 Jahre bis zum Athlon 64 zurück.
 
Nagilum99 schrieb:
Entwicklungsaufwand, extra produktionslinien... du unterschätzt was das kostet.
Das Ding ist, die Masse der Verkäufe ist nicht HighEnd - ich würde sogar eher behaupten, das unnötig große Design zu implementieren ist merklich teurer wenn man das eben für sogut wie alle Verkäufe dann teil deaktivieren muss. Man sollte nicht vergessen, dass anderes als bei Intel, AMD eben kein kleineres APU Design im Portfolio hat. Intel hat ein 2P + E-Cores. Ein 6P + E-Cores und ein 8P + E-Cores Ansatz. Bei AMD gibt es 8C APU mit größerer GPU oder MCM mit 1-2 CCDs + winzig GPU.

Bis jetzt hat man versucht die kleineren Modelle mit alter Technik zu verarzten. Das führt zu komischen Konstellationen wie ner Zen2/3 APU mit Vega Grafik, verkauft als 7000er irgendwas Modell. Mit entsprechenden Nachteilen durch die alte Kamelle. Das muss früher oder später mMn eh einem anderen Ansatz folgen. Der jetzige ist da durchaus gut, finde ich.
Nagilum99 schrieb:
Zum Rest: Nein, ich kann keine solche Kurven bei meinem Notebook beobachten, der hält die Leistung auch recht gut auf Dauer. Schon mal die Firmware aktualisiert?
Müsste per Windows Update eh automatisch kommen. Muss ich mal prüfen.
Nagilum99 schrieb:
Ich hatte überlegt das G10 mit einem 7840HS zu konfigurieren, aber ich denke aus Effizienzgründen wird es wieder ein U werden. Die Mehrleistung ist doch überschaubar.
Die H/HS sind schon nicht schlecht und machen bei entsprechender Kühlung schon ne ganze Ecke mehr her. Nur ob das im Flachen Elitebook aufgeht?
Der Mehrpreis ist halt recht groß - beim 6000er waren das bei mir über 700€. 1300 lag der U und 2000+ der H oder HS oder was das war.
 
w0mbat schrieb:
Die "big"-Kerne haben eine hohe Leistung und verbrauchen auch viel Strom, die "LITTLE"-Kerne sind deutlich langsamer und dabei aber auch sparsamer.
[..] aber rein faktisch liegst du falsch. Was ja auch kein Beinbruch ist, aber du solltest halt nicht mit "So ein Quatsch!" anfangen...
Im restlichen Teil meines Kommentars bin ich darauf eingegangen, warum das doch Big und Little sind. Sowohl buchstäblich auf dem Die, als auch auf dem Papier. Der Unterschied liegt darin, was groß und klein ist. "Das ist Quatsch" meinte ich zum vorherigen Kommentar, der meinte, es käme nur auf IPC an und CB hätte hier im Titel was verdreht/falsch erklärt. Das bleibt weiterhin Quatsch. (Selbst du hast bessere Argumente gebracht, die aber die Quatsch-Aussage nicht verteidigen.)

Btw. verbrauchen die großen Cores mehr Energie aufgrund von mehr Takt für mehr Leistung, die Kleinen weniger aufgrund limitierten Taktes (5Ghz vs. 3.5Ghz), wo aufgrund der Dense-Struktur eh nicht mehr ginge, dafür aber mehr Cores draufpassen. Es erfüllt genau deine Kriterien.

Ergänzung ()

PUNK2018 schrieb:
Setz dich doch bitte mit big.LITTLE auseinander:
Genau das habe ich doch mit meinem Kommentar. Und auch du hast das in deiner jetzigen Antwort. Davor schriebst du nur, dass es mit IPC zu tun hat und CB hier was hart im Titel verdreht. Das ist und bleibt Quatsch. Nachträglich alles anders schreiben kann jeder, ändert aber nicht die Kausalität und auch nicht das, dass ich mich bereits mit Argumenten ausgedrückt habe, die du wiederum nicht großartig berücksichtigt hast - bis zu deiner Antwort auf meine Kritik.

Es ist ein Big/Little Konzept. Aber es ist keine 1 zu 1 Kopie von Intel. AMD geht ihren Weg mit anderen Merkmalen, aber sehr wohl mit kleinen und großen Cores - d.h. Cores mit unterschiedlichen Merkmalen, wie du dann ja auch selbst beschrieben hast:

PUNK2018 schrieb:
AMD Zen und Zenc
: gleiche Features, weniger Takt, weniger Spannung, LEICHT geänderte/angeordnete Architektur
Weniger Takt und weniger Spannung ... ob das wohl zu geringeren Stromverbrauch führt? Und "leicht" geänderte Architektur, damit von diesen kleineren Prozessoren mehr auf einen Die passt. Kommt dir das bei big.LITTLE nicht irgendwie bekannt vor?

Unabhängig davon, wie wir das alles interpretieren, ging es mir nur darum zu kritisieren, dass es sehr wohl ein Big/Little Prinzip ist und CB hier kein Mist im Titel schreibt. Mehr nicht. Keiner sagt, dass es identisch ist. Warum auch. Insofern sind wir doch jetzt einer Meinung. Also, alles gut jetzt?
 
Zuletzt bearbeitet:
Deinorius schrieb:
Für deinen Einsatzzweck würde sich, ehrlich gesagt, sogar ein Smartphone SoC rentieren.
Das letzte was ich dafür nutzen würde wäre ein Mac Mini oder Macbook mit ARM.
Android würde ich dafür auch nicht nutzen wollen, am Ende verlier ich noch alle Daten auf den Festplatten.
Soll schon was vernünftiges sein. Die aktuellen Laptop APUs sind dann doch deutlich genügsamer als ein Ryzen 5700G aber können trotzdem noch ordentlich Dampf machen (verhältnismäßig).
Danke trotzdem
 
Verständlich, aber genauso würde ich dann auch sagen, dass sich ein günstiges/älteres NAS anbietet, wenn das OS die nötigen Features liefert. 4x Intel Bay Trail oder was auch immer danach kam. Hauptsache QuickSync ist dabei. Für deine Bedürfnisse brauchst du nichts bestimmtes. Vielleicht geht auch ein gebrauchter Laptop mit ausreichend Anschlüssen, dann hast du mit dem Akku gleich ein USV.
 
Eine Sache dabei fällt mir auf und ggf. habe ich Gedanken dazu hier im Forum überlesen.

Da die Zen 4 und Zen 4c Corse Featuregleich sind und für das OS nur unterschiedlich maximal getakten werden können, sollte AMD hier Optimierungen einsparen können, die aufgrund von fehlenden Features auf Intel E Cores gegenüber P Cores ggf. nötig sind.

Genauer könnte ein Software relativ easy Threads zuweisen, da die Unterscheidung der Software einzig auf rohe Leistung beruht. Beide Zen Core-Typen können das gleiche, der eine ist mit einzelnen Threads einfach nur schneller fertig.

D.h. das OS kann intensive Apps einerseits auf die 5Ghz Cores schieben und Apps im Hintergrund oder nicht so wichtige Dienste auf den 3.5Ghz Cores lassen. Eine einzelne App, die alle Cores nützen wollen würde, könnte bzgl. ihrerer Threads auch so handeln.

Intel macht das ja auch, aber dort müsste immer klar sein, was ggf. aufgrund des unterschiedlichen Feature-Sets vor- oder nachteilig wäre. Denn manches würden bspw. die E-Cores nicht so effizient (hinsichtlich Stromverbrauch oder CPU-Time) bearbeiten, wenn genau für eine Berechnung etwas Hardware auf dem P-Core existiert, dass diese spezifische Berechnung wegen Hardwareunterstützung besser durchführt.

Insofern wäre der AMD-Ansatz allgemeiner und leichter zu optimieren. Gerade fürs Hosting bzw. Server-CPUs ist das interessant, wo es gerade dort ein Mischverhältnis von intensiven Threads und massigen wenig intensiven Threads gibt. Aber ich schweife damit ab.
 
Nagilum99 schrieb:
Die meisten Nutzer können einen 7950X (oder TR) gar nicht auslasten und Intel stopft nun immer mehr von den E-Kernen in die CPUs. IMHO völlig nutzlos und verzweifeltes "wir müssen in den theoretischen Benchmarks oben stehen". Dass AMD jetzt auch auf die Schiene geht...
Hast du dir Tests zu Bergamo angeschaut? Falls nicht, kann ich es nur empfehlen. Sie zeigen deutlich, dass Zen 4C eine Kracher-Architektur ist. Mit Intels Gracemont-Architektur hat das nichts zu tun...

Und ja, ich halte es für sinnvoll, eine CPU zu bauen, die einige wenige Kerne hat, die vergleichsweise viel Takt haben und zugleich sehr viele Kerne, die weniger Takt bieten, aber ansonsten auf Augenhöhe agieren. Denn alle Kerne auf hohen Takt kannst du ohnehin nicht betreiben.
 
  • Gefällt mir
Reaktionen: Nagilum99
Kokuswolf schrieb:
aufgrund von fehlenden Features auf Intel E Cores gegenüber P Cores ggf. nötig sind.
E- und P-Kerne können die gleiche Software beackern, sie sind nur unterschiedlich schnell darin. Das Optimierungsproblem ist 1:1 identisch.
 
  • Gefällt mir
Reaktionen: bensen
Deinorius schrieb:
Verständlich, aber genauso würde ich dann auch sagen, dass sich ein günstiges/älteres NAS anbietet, wenn das OS die nötigen Features liefert. 4x Intel Bay Trail oder was auch immer danach kam. Hauptsache QuickSync ist dabei. Für deine Bedürfnisse brauchst du nichts bestimmtes. Vielleicht geht auch ein gebrauchter Laptop mit ausreichend Anschlüssen, dann hast du mit dem Akku gleich ein USV.
jo ne, bin gerade mit meinem Media Server online, der läuft auch noch mit nem alten intel i7 3770k aber frisst mir zu viel Strom für den genannten Zweck. Bei mir läuft sowas 24/7 , hol ich mir lieber was aktuelles.
Beobachte den APU Markt die nächsten 2-3 Monate und schau dann weiter.
 
Zuletzt bearbeitet:
modena.ch schrieb:
Das kommt jetzt drauf an wie man sie konfigurieren kann. Die AMDs C Cores sparen zwar nicht extrem viel Fläche,
Zen 4 ist erheblich kompakter als es die Intel P Kerne sind. Hier fällt es schwerer nochmals Fläche zu sparen. Außerdem hat AMD die Menge an L2-Cache beibehalten, während Intel sie bei den E-Kernen verkleinert hat.

AFAIR hat AMD gesagt dass das verdoppeln den L2-Caches von Zen 3 auf Zen 4 so 1 bis 2 % gebracht hat. Deshalb frage ich mich ob es wirklich sinnvoll ist 40 % der Fläche in den L2-Cache zu investieren.

Der Kern ohne L2-Cache ist bei Zen 4 C nur halb so groß als der von Zen 4.

Deinorius schrieb:
Muss sich ja erst noch zeigen.
Ich bin hier noch ein wenig unentschlossen. Ich habe jetzt auch keine Daten mit welchen Taktfrequenzen Notebooks gewöhnlich laufen
Deinorius schrieb:
Typische Benchmarks haben in der Hinsicht den Nachteil, dass Zen4 die Arbeit schneller erledigen könnte und allein dadurch vielleicht effizienter insgesamt ist.
Deshalb wird die Effizienz bestimmt in dem die Power und die verbrauchte Zeit misst, die für eine definierte Aufgabe benötigt wird. Aus beidem kann man die benötigte Energie bestimmen. Es gibt ein paar tolle Test von Ian Cutress wo man ganz klar sieht dass der Apple SoC deutlich mehr Power zieht als die anderen SoCs, aber eben sehr viel schneller fertig ist. Somit liegt beim Apple SoC die für diese Aufgabe benötigte Energie deutlich niedriger als bei der Konkurrenz.
Deinorius schrieb:
Aber bei Spiele geht das ja nicht. Man müsste ein Spiel nehmen, das eine sehr hohe CPU-Anforderung hat und die GPU Bedingungen auf das absolute Minimum setzen (720p FSR Performance!). Welches läuft besser bzw. effizienter? Selbst wenn es gleich laufen würde, wäre das ein Pluspunkt für Zen4c, weil man diese APUs günstiger verkaufen kann (sofern der GPU Anteil ausreichen stark ist).
Ich sehe APUs nur dann als interessant fürs Spielen, wenn man das Powerbudget begrenzt.
So richtig günstig sind die 5 Notebooks mit 7540U nicht. Es sind 4 HP Elitebooks und ein ThinkPad T14s. Alle ohne dezitierte Grafikkarte. Businessnotebooks.

CDLABSRadonP... schrieb:
Hast du dir Tests zu Bergamo angeschaut? Falls nicht, kann ich es nur empfehlen. Sie zeigen deutlich, dass Zen 4C eine Kracher-Architektur ist. Mit Intels Gracemont-Architektur hat das nichts zu tun...
Es ist unbestritten, dass es Anwendungsfälle für Server mit vielen Threads gibt.

Das Gegenstück zu Bergamo von Intel (Sierra Forrest) kommt nächstes Jahr. Dann kann man vergleiche anstellen.

Es ist ebenso unbestritten dass es Anwendungsfälle auf Effizienz optimierte Server gibt, die keine besonders hohe Single Thread Leistung benötigen.

CDLABSRadonP... schrieb:
Und ja, ich halte es für sinnvoll, eine CPU zu bauen, die einige wenige Kerne hat, die vergleichsweise viel Takt haben und zugleich sehr viele Kerne, die weniger Takt bieten, aber ansonsten auf Augenhöhe agieren. Denn alle Kerne auf hohen Takt kannst du ohnehin nicht betreiben.
Die Frage ist jedoch was wo es außerhalb des Mobilbereichs sinnvolle Anwendungen für Hybrid-CPUs gibt.
Phoenix 2 auf 15 W beschränkt könnte Funktionieren. Bei Strix Point mit 4P 8E sollte sogare mit höhererem Powerlimit funktionieren, aber habe ich in der 35 bis 45 W Klasse massive Bedenken

Die Strategie von Intel seit Alder Lake funktioniert nur deshalb, weil AMD die Anzahl der Kerne bei Ryzen nicht einfach erhöhen kann. Und das liegt nicht in der ersten Linie an der Größe der Kerne, sondern daran dass sie als CCX aus 8 Kernen und gemeinsam genutzten L3-organisiert sind.

Wenn AMD ein CCD mit 12 Kernen in einem CCX auflegen könnte, hätte die Diskussion einen ganz anderen Unterton.

incurable schrieb:
E- und P-Kerne können die gleiche Software beackern, sie sind nur unterschiedlich schnell darin. Das Optimierungsproblem ist 1:1 identisch.
Aber nur weil Intel bei den P-Kernen AVX-512 deaktiviert.
 
  • Gefällt mir
Reaktionen: Deinorius und Nagilum99
incurable schrieb:
E- und P-Kerne können die gleiche Software beackern, sie sind nur unterschiedlich schnell darin. Das Optimierungsproblem ist 1:1 identisch.
Ich habe auch nicht gesagt, dass sie das nicht können. Ich sprach von Hardware-Features, die die P-Cores haben, die E aber nicht... weshalb der P-Core besser geeignet wäre. Ich sprach nicht davon, dass einer etwas kann, was der andere gar nicht kann.

(Ich rede von Instructions Sets wie AVX, AES-NI, bla bla. Aber auch generelles wie Integer-Leistung unabhängig vom Takt.)
 
Zuletzt bearbeitet:
Kokuswolf schrieb:
(Ich rede von Instructions Sets wie AVX. Aber auch generelles wie Integer-Leistung unabhängig vom Takt.)
Beide können das gleiche.

Für das Optimierungsproblem ist es völlig unerheblich, wie das intern umgesetzt wird. Die könnten auch F-Kerne verbauen, die intern mit Fingern rechnen.
 
  • Gefällt mir
Reaktionen: bensen
Beide können das gleiche.

Es ist mühseelig immer wieder auf meine Intention aufmerksam zu machen. Die einen argumentieren hier, dass P und E ja so unterschiedlich sind und du, dass sie identisch sind. Das ist nicht der Fall und mir geht es darum wie effizient ein Core etwas macht, nicht ob er in der Lage ist, die Software auszuführen. Wenn Optimierung das vernachlässigt, dann ist es bestenfalls nur eine oberflächliche Optimerung, die Details weglässt.

Denn die P/E-Cores sind eben nicht auf gleicher Basis wie bei Zen 4 und Zen 4c, die sich unterm Strich bzgl. Spannung/Takt (und daraus abgeleitet den Stromverbrauch) unterscheiden. (Schon bei den ersten Threadrippern war das ein Thema, da man berücksichtigen muss, wo welche Cores wie verbunden sind. Der Teufel liegt im Detail.)

Gewisse Rechnungsarten etc. kann ein Core-Type (bspw. Gracemont vs. Golden Cove) anders. Und solche Unterschiede sind nicht irrelevant, wenn man bspw. die kleineren Cores nutzt, die aber wegen fehlender Hardwareunterstützung die Aufgabe zwar genauso hinbekommen, aber eben deutlich ineffizienter hinsichtlich Stromverbrauch und CPU-Times.

Wenn du eine Software hast, die bspw. viel mehr Integerberechnungen macht, dann macht das einen Unterschied. Das wird man in einzelnen Software-Tests sehen. Eben so wie schon immer CPU-Architekturen bestimmte Dinge besser oder schlechter konnten - genormt auf gleiche Mhz-Zahl. Verstehst du wovon ich rede?
Ergänzung ()

Hier hat Golden Cove bspw. etwas bekommen, was Gracemont nicht dazu bekommen hat:
1694537187989.png


D.h. "AI Workload, Network/5G" Berechnungen ggf. von vorne herein mehr Sinn auf diesen Kernen, ganz gleich ob dieser Big oder Little ist.
 
Zuletzt bearbeitet:
Kokuswolf schrieb:
Die einen argumentieren hier, dass P und E ja so unterschiedlich sind und du, dass sie identisch sind.
Du hörst mir nicht zu.

Für die Optimierung ist es völlig unerheblich, wie die Mikroarchtitektur einzelner Kerne aufgebaut ist. Das eine hat mit dem anderen nichts zu tun.
 
  • Gefällt mir
Reaktionen: bensen
fdsonne schrieb:
Das mag sein - aber dafür sind es ja in der Anzahl immernoch mehr von diesen E-Cores bei Intel? Selbst wenn man das 1:1 vergleicht, was aufgrund der anderen Architektur vor allem beim MCM Konstrukt schwierig ist.

Die E-Cores sollen wahrscheinlich gar nicht so sehr unter niedriger Teillast Energie sparen, sondern eher unter hoher Last mehr MT Leistung generieren ohne dass die Leistungsaufnahme zu stark leidet.

Intels Ansatz scheint mir ein Anderer zu sein, die E Kerne sind gar nicht mal sooo sparsam, die sind einfach für die Fläche bei MT recht effizient.

Da geht AMD wohl einen andren Weg und zielt mit ihren C Cores vor allem auf mobile Geräte, wo der geringe Verbrauch von Vorteil wäre. Im Desktop und Workstation sollen sie ja gar nicht eingesetzt werden.

Nun Intel will ja eine Server CPU mit 144 E Cores bringen, da wäre dann IPC auch nicht arg unwichtig.
Da dürfte Bergamo mit 128 Zen 4C Cores evtl interessanter sein.
 
incurable schrieb:
Du hörst mir nicht zu.
Doch das habe ich. Und wir brauchen nicht weiterreden, da dies auf dich zutrifft. Optimierung hat sehr wohl was damit zu tun, wie gut ein Prozessor was macht. Sonst optimiert man hier nichts, denn ein Verteilungs-Konzept reicht dann für alle Konstellationen - unoptimiert, weil egal ist, was ein Kern wie gut kann. Das Gespräch führt daher nirgendwo hin.
 
Kokuswolf schrieb:
noptimiert, weil egal ist, was ein Kern wie gut kann. Das Gespräch führt daher nirgendwo hin.
Stimmt. Ein Mindestmaß an Verständnis des geschriebenen Wortes ist die Voraussetzung für die effektive Kommunikation in einem Forum wie diesem.

Aber arbeite Dich ruhig weiter an irgendwelchen selbstkreierten Fantasien ab.
 
  • Gefällt mir
Reaktionen: bensen
fdsonne schrieb:
Müsste per Windows Update eh automatisch kommen. Muss ich mal prüfen.
Ja, da kommt immer wieder was, mir scheinen die Updates von der Support Seite aber größer bzw. mehr Komponenten 'zu behandeln'.

Die H/HS sind schon nicht schlecht und machen bei entsprechender Kühlung schon ne ganze Ecke mehr her. Nur ob das im Flachen Elitebook aufgeht?
Der Mehrpreis ist halt recht groß - beim 6000er waren das bei mir über 700€. 1300 lag der U und 2000+ der H oder HS oder was das war.
Zumindest beim G9 meine ich, dass dort Platz für einen 2. Lüfter ist, der vermutlich nur bei den HS oder bei einer Basiseinheit mit GPU verbaut wird.

Im Konfigurator lag der Aufpreis für U -> HS bei ?150? €.
Der 7940U war mit rund 300 € extra definitiv das Geld nicht wert.
 
ETI1120 schrieb:
AFAIR hat AMD gesagt dass das verdoppeln den L2-Caches von Zen 3 auf Zen 4 so 1 bis 2 % gebracht hat. Deshalb frage ich mich ob es wirklich sinnvoll ist 40 % der Fläche in den L2-Cache zu investieren.
Performance ist nicht alles. Man reduziert auch die Last auf den Interconnect und weniger Traffic bedeutet auch weniger Energie.
Bei AMD vielleicht noch nicht ganz so wichtig, aber bei Intel hängen schon verdammt viele Teilnehmer am Ringbus.
 
bensen schrieb:
Performance ist nicht alles. Man reduziert auch die Last auf den Interconnect und weniger Traffic bedeutet auch weniger Energie.
Auch wenn man die Daten aus dem L2 anstatt aus dem L3 oder gar dem Hauptspeicher holen muss spart Energie. Aber 40 % der Fläche für den Cache, bei einem Kern der garr nicht auf Spitzenleistung ausgelegt ist finde ich heftig.
bensen schrieb:
Bei AMD vielleicht noch nicht ganz so wichtig, aber bei Intel hängen schon verdammt viele Teilnehmer am Ringbus.
Die Latenzmessungen von Anandtech belegen ja, dass die Angabe von AMD das CCX hätte einen doppelte Ringbus nicht die ganze Wahrheit ist. AMD muss den verfügbaren 3. xGMI-Link der Kerne für weitere Verbindungen verwenden.

Außerdem teilen sich alle Kerne eines CCX den L3-Cache, also müssen Daten die im L3-Cache des CCX sind, nicht bewegt werden.

Und weil das CCX mit 8 Kernen so effizient ist, lasse ich mich Mal überraschen was AMD bei Phoenix implementiert.
 
  • Gefällt mir
Reaktionen: bensen
Zurück
Oben