Test AMD Strix Point im Test: Zen 5 mit RDNA 3.5 und Ryzen AI im Asus Zenbook S16

@ArrakisSand man kann die beiden cpus so einfach nicht vergleichen in verschiedenen Laptops. es gibt so viele verschiedene möglichkeiten warum der unterschied nur so gering ausfällt. Natürlich spielt hier die tdp, RAM, Resultierende takt frequenz, treiber, Bios einstellungen, Windows scheduler usw alles mit rein. Du kannst hier nur die Beiden laptops als gesamt produkt sehen und bewerten. wenn man sich einen anderen test anschaut macht schon die tdp bis zu 10% unterschied aus. Und auch die verwendeten spiele machen viel am Ergebnis aus. Hier hast du nur eine Auswahl von 2 spielen. Wenn man die spiele aus dem gpu test nehmen würde mit vernünftigen einstellungen (niedrig) könnte das ergebnis komplett anders ausfallen.
 
@Northstar2710
Ok danke für die Antwort dann reichen die verfügbaren Daten noch nicht
um sich ein detailliertes Bild von StrixPoint machen zu können.
Existieren denn schon weitere Tests mit eventuell anderen Laptops oder Mini PC's?
 
es gibt auf notebookcheck noch einen test zur igpu und zwar im vergleich mit dem Asus proart welches auch strix point hat aber mit einer rtx4070 . ich wurde aber dann die igpu genommen und das notebook darf bis 65 tdp für die cpu nutzen https://www.notebookcheck.net/AMD-Z...le-M3-and-Qualcomm-Adreno-X1-85.868475.0.html

und hier der test zum proArt laptop
https://www.notebookcheck.net/Asus-...o-AMD-Zen-5-and-RTX-4070-laptop.868429.0.html


in diesem Thread https://www.computerbase.de/forum/t...int-notebooks-starten-in-deutschland.2204530/

hat Martin das Asus Zephyrus mit strix point. vielleicht kann er dir ja ein paar fragen beantworten.
 
  • Gefällt mir
Reaktionen: Eorzorian
Philste schrieb:
Die Tabelle zeigt eigentlich genau das Gegenteil, nämlich dass ZEN5 mehr Strom als ZEN4 braucht. Die korrekt Beschreibung wäre: Watt für Watt ist Strix Point ein Killer. Wäre die Arch an sich effizienter, wäre der Vorsprung bei kleiner TDP genauso hoch oder größer. Bei Strix ist es aber genau andersrum: Im TDP Bereich der U Serie ist man 20% vorne, bei 65W 35%. Das zeigt ganz klar, dass ZEN5 mehr Strom als ZEN4 braucht. Strix hat nur eben satte 50% mehr Threads um das auszugleichen. Aber übernächste Woche werden wir zu 80% sehen, dass ein 9950X bei unter 100W langsamer als ein 7950X ist.
Du hast einen groben Denkfehler: In deiner Argumentation beziehst du dich wesentlich auf die Threadanzahl. Diese ist aber in real life nicht relevant. Es zählt nur eines: Wieviel Watt steck ich rein, und wieviel Leistung erhalte ich dafür.
 
Gullveig schrieb:
Es zählt nur eines: Wieviel Watt steck ich rein, und wieviel Leistung erhalte ich dafür.
Und da gilt: mehr Threads = mehr Performance pro Watt.

Daher muss man diesen Umstand schon mit betrachten und schauen, was dann erwartbar ist, wenn man zusätzlich noch eine neue Architektur nutzt, die effizienter sein soll als die alte.

Und da sind +25% Effizienz halt nicht viel, das ist ca das was man bei gleicher Architektur und 50% mehr Threads, also einem Hawk Point mit 12 Kernen, erwarten würde
 
@tipmyredhat
Was ist unklar?
Bei gleichem Powerbudget bekommst du mit mehr Kernen/Threads mehr Performance hin

7950X@65W > 7900X@65W > 7700X@65W > 7600X@65W

Der 7950X ist bei 65W z.B. 64% schneller und damit effizienter als der 7600X

Selbst bei 45W sind’s noch +21%, da kommen wir dann langsam in einen Bereich wo die Grundlast des IO Die viel vom Powerbudget auffrisst und das Mehr an Kernen weniger stark zulegen kann.
Der fällt bei den mobilen Chips aber ja weg, da geht’s nur um die Kerne.


Genauso bei GPUs, mehr Kerne bei gleicher TDP = mehr Performance
4090@250W > 4080@250W > 4070@250W
 
Zuletzt bearbeitet:
Taxxor schrieb:
Was ist unklar?
Bei gleichem Powerbudget bekommst du mit mehr Kernen/Threads mehr Performance hin
Es überrascht mich immer wieder, wieviele hier in so einem Tech-Forum diese simple Korrelation nicht verstehen. Kann es schon kaum erwarten, wie auf Lunar Lake rumgehauen wird, wenn Strix mit 24 Threads bei 17W schneller ist als Lunar Lake mit 8 Threads.
 
  • Gefällt mir
Reaktionen: Deinorius
Taxxor schrieb:
@tipmyredhat
Was ist unklar?
Bei gleichem Powerbudget bekommst du mit mehr Kernen/Threads mehr Performance hin

7950X@65W > 7900X@65W > 7700X@65W > 7600X@65W

Der 7950X ist bei 65W z.B. 64% schneller und damit effizienter als der 7600X

Selbst bei 45W sind’s noch +21%, da kommen wir dann langsam in einen Bereich wo die Grundlast des IO Die viel vom Powerbudget auffrisst und das Mehr an Kernen weniger stark zulegen kann.
Die fällt bei den mobilen Chips aber ja weg, da geht’s nur um die Kerne.


Genauso bei GPUs, mehr Kerne bei gleicher TDP = mehr Performance
4090@250W > 4080@250W > 4070@250W
Aber auch nur wenn du nirgends einen Flaschenhals drin hast und es ist anzumerken das die 4070 wiederum
effizienter pro Fläche als die 4090 ist.
Ach ja, Threads schließt bei den CPU's auch z.B. HT oder SMT mitein und könnte theoretisch auch 4 oder mehr Threads Gleichzeit abarbeiten.
Bist du dir daher sicher, dass zum Beispiel ein Perfomance Kern mit SMT4 (= 4 Threads) effizienter ist als z.B. 3 e Kerne (3 Threads)?
Etwas kann da mit deiner These nicht ganz Stimmen.

Oder ein besseres Beispiel.
Was ist effizienter, ein 4 Kerner mit HT (8 Threads) bei 65W, oder ein 6 Kerner ohne HT (6 Threads) bei 65W.
 
Zuletzt bearbeitet:
ArrakisSand schrieb:
es ist anzumerken das die 4070 wiederum
effizienter pro Fläche als die 4090 ist.
Was hat das jetzt mit Flächeneffizienz zu tun? Eine 4090 ist bei selber TDP (sagen wir mal 80W) schneller als eine 4070.
ArrakisSand schrieb:
Bist du dir da allerdings sicher, dass zum Beispiel ein Perfomance Kern mit SMT4 (= 4 Threads) effizienter ist als z.B. 3 e Kerne (3 Threads)?
Es gibt aber keinen Perfomance Kern mit SMT4, was soll man also jetzt darauf antworten? Es geht darum, dass ein imaginärer 12 Kern Phoenix wahrscheinlich effizienter wäre, als es Strix Point ist. Die Vermutung liegt nahe, da ein 7900X bei selber TDP (88W) ca. 32% schneller als ein 7700X ist.
 
Zuletzt bearbeitet:
ArrakisSand schrieb:
Bist du dir daher sicher, dass zum Beispiel ein Perfomance Kern mit SMT4 (= 4 Threads) effizienter ist als z.B. 3 e Kerne (3 Threads)?
Etwas kann da mit deiner These nicht ganz Stimmen.
Es geht doch um AMD, da gibts weder Kerne mit 4 Threads noch Kerne ohne SMT.

Und es ist keine These, die Daten zu den AMD CPUs kannst du dir alle hier auf CB anschauen
 
@Taxxor Das habe ich nicht explizit auf AMD bezogen, sondern das war eine generelle Aussage.
Es geht darum das SMT 4 wenn es Sinn ergebe, was es offensichtlich aber im Desktop nicht tut,
wohl ohne weiteres machbar wäre. Andere CPU Architekturen verwenden es bereits (IBM Power)
Ach ja SMT kann man übrigens auch abschalten.
Und Effizienter ist man nur, wenn die Software auch auf so viele Kerne ausgelegt ist.

Hier zum Bespiel der Gegenbeweis zu deiner These (Beide CPUs sind mit 65W spezifiziert)
1722888738855.png
 
Zuletzt bearbeitet:
ArrakisSand schrieb:
Hier zum Bespiel der Gegenbeweis zu deiner These (Beide CPUs sind mit 65W spezifiziert)
Anhang anzeigen 1508456
Und da vergleichst du Kerne mit SMT gegen Kerne ohne SMT, somit hat eine CPU mehr Kerne, aber die andere mehr Threads.
Also exta für dich präzisiere ich die Aussage noch weiter: Natürlich geht es darum, mehr vergleichbare Kerne zu haben.
Also 4C/4T vs 6C/6T oder 4C/8T vs 6C/12T

Bei deinem Beispiel also 4C/8T vs 6C/12T, dazu passt 3300X vs 3600, sogar leichter Taktvorteil von +100MHz beim 3300X
1722960434894.png


Der 3600 verbraucht dabei auch ~10% mehr, was sich insgesamt in einer ~25% besseren Effizienz niederschlägt.


Dass wir bei Strix Point Zen5c Kerne mit Zen5 Kernen gemischt haben, hat auf die MC Performance auch keinen wirklichen Einfluss, weil der größte Unterschied zwischen den beiden die Taktraten sind, ansosnten haben beide die gleichen Fähigkeiten und die gleiche IPC.
Und bei 12 Kernen und 33W TDP liegt die Taktrate der Zen5 Kerne sowieso nicht über der Maximaltaktrate der Zen5c Kerne, daher ist der potenzielle Taktunterschied hier auch egal, weil er in MC Szenarien nicht existiert.
 
Zuletzt bearbeitet:
USB 4.2 mit 120gp gibts wohl noch nicht in der gen oder?
 
Taxxor schrieb:
weil der größte Unterschied zwischen den beiden die Taktraten sind, ansosnten haben beide die gleichen Fähigkeiten und die gleiche IPC.
du vergisst noch die L3 cache grösse, die 4 grossen kerne haben 16MB die 8 Kleinen nur 8MB.
Ergänzung ()

@Sunjy Kamikaze Nein. Und ich glaube noch nichtmal das es in der nächsten Gen kommt. Weder bei intel noch AMD
 
Northstar2710 schrieb:
du vergisst noch die L3 cache grösse, die 4 grossen kerne haben 16MB die 8 Kleinen nur 8MB.
Was für die hier thematisierten Anwendungs benchmarks aber auch wenig bis keinen Einfluss hat
 
ETI1120 schrieb:
Wieso dreht dann Bergamo mit der veraltete Technologie was die gemessene Speicher-Bandbreite anbelangt, Kreise um Sapphire Rapids? Obwohl Sapphire Rappids, eine so tolle Packaging Technologie einsetzt?
Was ja auch daran liegt, dass das Mesh im weiten nicht so gut "skaliert" wie immer getan wird. Sieht man sich für Zen 4 die Latenzen an, dann sind die relativ geleichmäßig. Im "Kern" bei x < 10 ns, im CCX x < 20 ns. Und zwischen den CCX sind es dann x < 80 ns.

Bei den "normalen" Prozessoren hat Intel m Kern auch x < 10 ns, alles andere springt dann aber auf 30 ns Sekunden hoch und geht auf bis zu x < 50 ns.

Auch wenn AMD hier mit 30 ns Sekunden agiert, die zwischen den CCX liegt, sind diese 30 ns Sekunden "planbar", da AMD quasi relativ konstante Latenzen hat. Und da kommen wir zum nächsten Punkt: Saphire Rapids kommt durch sein Mesh "innerhalb" der CPU auch gerade mal auf x < 70 ns und das schon zwischen den Kernen. Die Latenz zwischen einem CCX bei Zen 4 ist da mit x < 80 ns nicht wirklich viel schlechter.

An der Stelle kann man sagen: Egal ob jetzt Intels Mesh mit "Mutlichip" oder AMDs Ansatz mit den CCX und dem Infinity Fabric: Beide ermöglichen relativ konstante Latenzen zwischen den Kernen, beide sind dabei aber auch nicht besonders schnell.

AMDs Ansatz hat halt den Vorteil, dass "8"-Kerne immer besondes schnell zu sammen Arbeiten.
ArrakisSand schrieb:
Was ist effizienter, ein 4 Kerner mit HT (8 Threads) bei 65W, oder ein 6 Kerner ohne HT (6 Threads) bei 65W.
Kommt am Ende auf den Workload an.
 
  • Gefällt mir
Reaktionen: Deinorius und ETI1120
DevPandi schrieb:
Die Latenz zwischen einem CCX bei Zen 4 ist da mit x < 80 ns nicht wirklich viel schlechter.
Deswegen ist es ja so interessant, dass man bei Strix Point auf 180ns rauf ist, obwohl beide CCX in einem Die sind.
 
Also, das ist jetzt nur eine Vermutung, aber es könnte an der Stelle auch am IF-Takt liegen. "Uncore" gibt es bei Zen 4 ja ab DDR5 6200/6400 auch den Switch von 1:1 auf 1:2 und statt den 3000 - 3200 MHz, liegen nur noch 1600 MHz an. Hier wären es 1875 MHz. Damit steigt die Latenz von Core-to-Core schon an.

Egal, nachher gibt es mehr Tests.
 
Philste schrieb:
Es überrascht mich immer wieder, wieviele hier in so einem Tech-Forum diese simple Korrelation nicht verstehen. Kann es schon kaum erwarten, wie auf Lunar Lake rumgehauen wird, wenn Strix mit 24 Threads bei 17W schneller ist als Lunar Lake mit 8 Threads.
Wenn du schon so arrogant pöbeln möchtest, darfst du vorher gerne den Unterschied zwischen TDP und der tatsächlichen Leistungsaufnahme lernen, denn das können je nach Hardware 2 grund-unterschiedliche Dinge sein.

Das bedeutet nicht, dass die Annahme mehr Threads = mehr Effizienz per se falsch ist, aber die Argumentation ist völlig hirntot. Entweder man hat Zahlen parat mit gemessenem Energieverbrauch, oder es wird geschwiegen.
 
Zurück
Oben