Macht SMT heutzutage 60 % eines Kernes aus oder sind es nur 50% weil zu Intel zeiten waren es nur 25 % eines logischen Kernes gewesen.

latiose88

Commodore
Registriert
März 2020
Beiträge
4.182
Hi wie sieht es aus,sind aktuelle SMT bei AMD bei 60 % eines logischen Kernes und wie sieht es bei Intel so aus?
Also früher zu Inel i7 3770k war es ja so das ein HT Kern der eines zu 25 % vom logischen Kern entspricht.Wie gut ist es heute so.Wie sieht es bei Intel so aus und ist es bei AMD echt so das ein SMT Kern 60% des eines Logischen Psyikalisch vorhanden Kernes entspricht.
Klar nun sind die kleinen Kerne bei Intel ja auch noch dazu gekommen.Funktioniert nur leider nicht immer Optimal.Wird wohl da 50 % es Logischen Kernes entsprechen oder hat sich da nun was dran geändert gehabt?

Danke schon mal für eure Info.
Achja ich gehe mal davon aus das ein 24 Kerner mit SMT am Ende mehr Leistung als 32 Kerne ohne SMT hat.Also nehmen wir mal an ,es wird alles voll Ausgelastet versteht sich oder es ist so gut Optimiert das mehr Threads keine Leistung mehr verlieren,dann sieht es ja auch anderst aus.
 
Wo kommen die vielen (falschen) annahmen her?
Wie gut eine Software überhaupt skaliert. Mit echten Kernen. Mit threads überhaupt. - > mit logischen (ht, smt) kann man nicht pauschal fest angeben.

Bitte einfach echte Quellen für die Informationsgewinnung nutzen. Keine Halbwahrheiten aus irgendwelchen Foren.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Asghan, Nuke8472, ReignInBlo0d und 3 andere
meinte ja psyhikalisch vorhanden ohne SMT oder ht gegen SMT und so.Ich fragte ja auch nach was wirklich so ist.Wie viel eine SMT Einheit im Stande ist.Klar kann es mit den Psyikalischen Kernen nicht mithalten.So weit ist man ja noch nicht das SMT oder HT gleich viel bringt.Nehmen wir mal an ,die Software kann alles voll auslasten also die Optimalste Sitation.Wie sieht es da so dann aus?
 
Wenn du dgemm o.Ä. machst, dann bringt dir der logische Kern gar nix, daher maskieren Software, die das nutzt, die Kerne so, dass nur ein Thread genutzt wird (affinity mask). Damit minimiert man Cache Trashing.

Wenn du Software hast, die sehr heterogene Aufgaben macht, die nicht L1-Cache-sensitiv ist und unterschiedliche Execution Units nutzt, dann skaliert SMT sehr gut.

Wenn du dann z.B. GPUs anschaust, dann machen die oft 10-fach SMT (z.B. GCN). Weil man damit In-Order bleiben und trotzdem die (Speicher-)Latenz gut kaschieren kann.

Ergo: SMT bringt zwischen 0 % (hochoptimierte Software) und 900 % (GPUs).
 
  • Gefällt mir
Reaktionen: Nuke8472, Bonanca, aroxx und 3 andere
@latiose88
Du hast doch eine aktuelle CPU.
Ein Run Cinebench mit SMT ein Run Cinebench ohne SMT und Du weißt ganz genau was SMT bringt.
Ganz ohne das Forum.
 
  • Gefällt mir
Reaktionen: Asghan und Matthias80
Dir fehlt basiswissen.

Fang mal gaaaanz klein an.

Intels erste CPU war der Pentium 4 der ht bekam. Single core! Warum?
Es würde überlegt wie bekommt man den einen Kern besser ausgelastet. Weil man feststellte, daß zum damaligen Zeitpunkt es nicht viel Software gab, die die maximale Leistung rausholen konnte.
Da sich die logischen kerne die Ressourcen der physisch teilen... Kann halt nicht 200% Leistung dann rauskommen. Aber man hat es so geschafft den physischen Kern besser auszulasten. Jetzt kannst du weiterdenken...

Auch wie gesagt raus aus der nische. IBM hat z.B. cpu's die z. B. Pro Phy kern 4 logische haben.
 
  • Gefällt mir
Reaktionen: thuering und PeriQue1337
@Hancock

Ok kann man das ganze so gut Optmieren,das das abschalten von SMT/HT oder dazu schalten keinen Unterschied mehr ausmacht. Die Älteren AMD CPUS machte es einen Unterschied aus ob an oder aus.Sogar die vorherigen Threadripper gen ohne Pro sah man es deutlich.So das man durch abschalten von SMT an Leistung dazu bekommen hat.Und durch gezielt festen Kernen bei 2 Anwendung gleichzeitig sogar noch mehr.Das ging dann sogar so weit das ein Threadripper 3960x mit einem 3970x mithalten konnte.

Bei der 5000 Gen Threadripper spielt es keine Rolle mehr ob SMT an oder aus ist.Es kommt am ende die selbe Leistung dabei raus.Sogar fest zu geordnet machte keinen Unterschied mehr.Dabei war das noch nicht mal ein 32 Kerner gewesen.Heißt das ab jetzt spielt das also kein Rolle mehr für die Rohleistung und auch ein Unterschied zwischen 24 und 32 Kerner gibt es nicht mehr.

Achja dabei verwendete der wo das für mich gemacht hatte zum testen die selbe Software die ich sonst auch verwendet habe.Heißt ich scheine wohl doch vom L1 Cache abhängig zu sein.Wäre ich das laut deiner Info nicht,dann wäre ja SMT erfolgreich.
Nur das halt L1 Cache Abhängigkeit keine so große ist wie man es früher so kennt.L3 Cache scheint jedenfalls nicht der zu sein der erhofft war.

Klar ist L1,L2 und L3 Cache miteinander verbunden.Nur scheint wohl der L1 der wichtigste zu sein.Kann man da mit dieser Erkenntnis Rückschlüsse machen?
 
@Matthias80

Also wenn wir jetzt schon anfangen, den Grund beim Pentium4 zu nennen, dann müssen wir ihn auch erklären: Pentium 3 und Athlon 64 hatten eine irgendwas um die 10-15 stufige Pipeline. Die Pipeline des Pentium 4 Northwood hat 20 Stufen. Weil die Verarbeitungskette so deutlich schwieriger zu planen ist, konnten die meisten Compiler keinen Code bauen, der diese lange Pipeline richtig auslastet. Zwei Threads gleichzeitig in eine Pipeline zu schicken, hat die Pipeline eines Kerns viel besser auslasten können. Pentium 4 wäre ohne HT nicht konkurrenzfähig gewesen trotz der dank der langen Pipeline erreichten 4 GHz.

https://www.anandtech.com/show/661/3

P.S.
Und der große charakterliche Unterschied der Intel Core-Architektur zum Pentium 4 ist, dass sie wieder eine kürzere Pipeline hat.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Bonanca, aroxx, AB´solut SiD und eine weitere Person
Ob SMT/HT einen Sinn ergibt oder nicht liegt ausschließlich daran wie deine Programme die CPU auslasten. Das "wie" heißt: Welche Operationen und in welcher Menge. SMT spaltet dir deine CPU in virtuelle Kerne auf. Das ist auch in der Architektur so begründet. Aber das ergibt nur für bestimmte Lasten einen Sinn. Wenn du ein Progamm hast dass deine physikalischen Kerne bereits sehr gut auslastest, hast du mit SMT/HT keinen Gewinn. Zum Teil sogar verlust. Wenn du aber viele Programme hast die nur Teillasten bewirken, und dann z.T. unterschiedliche Befehle zugleich ausführen, dann kann es einen kleinen Bonus bringen.
 
SMT oder ein logischer Kern hat nie irgendeine % zahl von irgendwas ausgemacht... Hyper-Threading war und ist eine Möglichkeit einen physischen Kern besser auszulasten indem ihm, einfach gesagt, 2 Aufgaben parallel zugewiesen werden.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Tobi...:D, aroxx, AndyMutz und 2 andere
MountWalker schrieb:
Die Pipeline des Pentium 4 Northwood hat 20 Stufen.
Die beim Prescott auf 31 ausgeweitet wurde und bei dessen Nachfolger wohl gegen 40 Stufen gegangen wäre
 
  • Gefällt mir
Reaktionen: MountWalker
latiose88 schrieb:
Ok kann man das ganze so gut Optmieren,das das abschalten von SMT/HT oder dazu schalten keinen Unterschied mehr ausmacht.
Du missverstehst mich. Bestimmte Programme ziehen keinen Vorteil, andere Programme einen großen Vorteil. Das hat aber nur begrenzt was mit Optimierung zu tun, sondern viel mehr mit der Problemstellung, die die Programme lösen. (Klar: Schlechte Programme sind immer langsam)

Willst du Matrizen multiplizieren, bringt HT nichts.
Willst du was machen, was parallelisierbar auf Taskebene, aber nicht auf Instruction Ebene ist, dann bringt HT was.

Um HT zu verstehen, braucht es Verständnis, wie ein moderner Prozessor aufgebaut ist, vor allem was das Scheduling und Stalling angeht. Da gibt es viel (englische) Literatur. Z.B. Agnes Fog hat da zu den modernen Architekturen viel.
 
  • Gefällt mir
Reaktionen: Gorasuhl und HisN
latiose88 schrieb:
Achja ich gehe mal davon aus das ein 24 Kerner mit SMT am Ende mehr Leistung als 32 Kerne ohne SMT hat
Dann ist deine Annahme nicht richtig und variiert stark in Abhängigkeit von eingesetzter Software, die von dir beaufschlagten 25% mehr Leistung sind dabei schon recht optimistisch..
1675296799765.png

https://www.anandtech.com/show/1626...-multithreading-on-zen-3-and-amd-ryzen-5000/2
 
  • Gefällt mir
Reaktionen: fairhext, latiose88 und Celinna
HisN schrieb:
Ein Run Cinebench mit SMT ein Run Cinebench ohne SMT und Du weißt ganz genau was SMT bringt.
Ganz ohne das Forum
Dann weiß er es für genau ein Programm.

Würde dir etwas Lektüre empfehlen. Bei uns stand Patterson und Hennessy oder auch Tanenbaum auf dem Lehrplan. Ich habe den Eindruck, dass du vieles hier und da mal aufgeschnappt/gelesen hast ohne es im Grundsatz nachvollziehen zu können. So auch diese Aussage:
latiose88 schrieb:
Achja ich gehe mal davon aus das ein 24 Kerner mit SMT am Ende mehr Leistung als 32 Kerne ohne SMT hat.
Kann man so halt nicht pauschal sagen. Wie du zu der Aussage kommst, mag der Umstand sein, dass die CPU mit mehr logischen Kernen im Mittel über verschiedene Aufgaben besser abschneidet, dass sagt aber nichts über die letztendliche Leistungsfähigkeit aus. CPUs kann man grundsätzlich unterschiedlich aufbauen und mit dieser Thematik beschäftigen sich unter anderem auch die Autoren, die ich dir genannt hab.
 
Es ist wirklich komplex auf die jeweilige CPU und Anwendung bezogen.

Ich habe z.B. aufgeschnappt (weiß nicht mehr welche CPU es exakt war; auf jeden Fall einer der ältesten), dass SMT den Sizilium-Verbrauch nur um ca. 5% erhöht.

Als Faustregel (auch hier keine Ahnung ob noch aktuell) wird ein virtueller Kern etwa 25% eines vollwertigen Kerns gerechnet.
 
Nun scheinbar ist das der shedulder der sich von vorherigen zum nachfolgenden threadripper verändert hat. Konnte ich zovor noch abschlalten um mehr leistung zu bekommen weil was gebremst hatte, ist dies beim Nachfolger nicht mehr der Fall. Was fällt dann unter fester Zuordnung manuell der Kerne für die jeweilige software? Weil das gab zuvor auch nen Schub. Dies ist nun auch nicht mehr der Fall. Naja Die steigungen das merke ich ja sehr wird immer weniger. Da hilft es halt nix die selbe software samt settings zu verwenden. Jedenfalls scheint nun smt keine Wirkung mehr zu haben. Da ich halt nur 1 software verwende bringt mir so nen software wie cinchebench usw leider nix. Bin also bei software sehr eingeschränkt. Und es wird der Punkt kommen wo die Software keine Steigerung mehr geben wird.

Habe auch herausgefunden das eine einstellung im Programm dafür sorgt das avx nutzbar ist oder nicht. Ist diese nicht ein dann zeigt es 0 mehrleistung und ist diese ein kostet die Leistung und kann dank avx einen Teil abfangen. Smt kann dies jedoch nicht und darum zeigt es keine Wirkung. Was genau bei l1 Chache landet und was nicht weiß mann ja nicht genau. Fakt ist in dieser Hinsicht ist smt wohl fehl am platz.
Die mehrleistung beim ram ist ja auch schon begrenzt. Es heist zwar das dies auch smt bzw ht mit beeinflussen kann aber in welchen Maße kann ich nur raten.

Spannend wird es sein wohin die Reise noch hingehen wird. Fakt ist bei den kleinen scheint es wohl noch was zu bringen. Bei den großen eher wohl weniger. Und ich bin gespannt wie es mit den 16 Kerner so sein wird, ob da es auch so ergehen wird wie bei den Kern Monstern. Bleibt echt spannend.

Das wird immer mehr nach unten weiter gegeben das mit smt und ht als Wirkung da bin ich mir sicher.
 
latiose88 schrieb:
sind aktuelle SMT bei AMD bei 60 % eines logischen Kernes und wie sieht es bei Intel so aus?
Ich denke mal,dass dieser Abschnitt hier die von dir gesuchte Information liefert. Sonderlich viel hat sich daran seitdem nicht geändert. Ganz so rosig wie im Cinebench ist es bei Betrachtung von mehr Anwendungen nicht.

Die grobe Regel, dass man bei SMT in Anwendungen im Schnitt für vier reale Kerne einen dazu rechnet (also +25%), passt immer noch ganz gut. Der Zugewinn ist bei AMD etwas besser als bei Intel, eher gegen +30%. Und ja, SMT kann manchmal sogar kontraproduktiv sein, also Leistung kosten. Und manchmal skaliert es fast zu +100%. Das ist komplett von der konkreten Anwendung abhängig.
 
Ja manchmal kostet es in der vorherigen gen Leistung und die nächste kostet es nix und steigert auch nix. Ob man dann smt ein oder aus lässt ist dann auch egal. Was sagt man dazu wenn sowas Eintritt. Und dann müsste es dann auch die CPU schlecht ausgelastet sein wenn es nix ausmacht oder?
 
Um andere noch mal auf einen aktuellen Stand zu bringen, Latiose vergisst leider immer seinen mehr oder weniger einzigen Use-Case zu erwähnen:
Er konvertiert seit Jahren und auch die nächsten Jahrzehnte lang TV Aufnahmen mit dem Tool Avidemux (glaube ich?).
Zudem hat er auch schon bei jedem CPU Release der vergangenen Jahre andere User dazu überredet für ihn sein Tool zu testen. Auch für TR hat er immer wieder scheinbar User gefunden, die dann wohl auch wild Kerne aktiviert und deaktiviert haben. Deshalb fragt er wohl jetzt mal wieder genauer nach, stehen ja auch neue CPUs zur Verfügung.

@latiose88 es wäre einfach mittlerweile echt angebracht, wenn du immer den Kontext nochmal kurz beschreibst. Dein Use-Case ist schon eher speziell, andere Tools kannst und willst du ja auch bisher nicht nutzen, oder laut deinen Aussagen hast du die getestet aber dein Tool war für dich warum auch immer besser.

Ansonsten, höre einfach mal hier bei den Experten nochmal genau zu, und evtl. liest du auch mal mehr auf Fachseiten nochmal paar Dinge nach, oder die Leute hier geben dir paar nützlich Quellen. Wenn dich CPUs so sehr beschäftigen, was ja als Hobby auch ok ist , dann sollte man auch mal mit paar Grundlagen anfangen. Es gibt einfach so viele Fachtermini, geht halt nicht anders. Das hilft bei der Kommunikation, sonst redet man immer aneinander vorbei.

Viel Erfolg weiterhin bei deinem TV Archiv. Achja, was genau nimmst du eigentlich ständig auf und wie groß ist mittlerweile dein Archiv?
 
Naja du hast da völlig recht. Ist zwar nicht advidmux sondern xmedia recode. Was ja die selbe Art der Auslastung ist.
Und ja ich fragte weil sich dank der neuen cpu das Verhalten geändert hatte. Nun ja scheinbar können sich auch die selbe Software bei neuer generation an CPU auch verändern. Was bei ryzen der selben Generation so gewesen war scheint bei den Threadripper der selben Generation wohl sich doch anderst zu verhalten. SMT bzw ht ist nicht gleich Smt. Das habe ich gemerkt gehabt. Ob das der hersteller optimieren kann, weiß ich auch nicht.

Und ja ich habe schon ne Ordentliche Ansammlung an Filme und Serien angehäuft. Meist nehmen ich bei so TV Sender wie Prosieben Maxx auf. Für mich ist das einer der größten Anime Sender den man sich vorstellen kann. Da sind so die üblichen Sachen dabei wie One piece, Black Clover usw. Nur um ein Bruchteil zu erwähnen.

Nun weiß ich ja das man pro Kern 30 % rechnen kann. Aber das scheint bei meiner Anwendung wohl eh keine Rolle zu spielen da es dies wohl nicht nutzen kann. Und wenn dann eh nur bis maximal 32 threads. Wobei von 32 kernen 75 % dann 8 Kerne abziehen kann. Also macht dann 24 threads. Aber nur halt ohne smt.

Damit ist klar ein threadripper der mit 32 kernen ist somit schon mal nicht mehr relevant. War es zu threairpper 3970x ja noch der Fall gewesen ist es mit threadripper 5000 nun nicht mehr der Fall.

Das erklärt auch warum zuordnen von festen kernen ebenso kein Effekt hatte.
Was ja beim threadripper 3960 noch der Fall war. Der war dann mit festen Kerne der Software dann gleich schnell wie der 3970x gewesen.

Aber gut smt spielte also schon da keine Rolle mehr. Nun habe ich ja Gewissheit.

PS: Die letzte Frage von dir nun die ist so bei rund 100 tb die Sammlung. Nichts für normale User. Ich werde wohl eh in Zukunft mehr mit sortieren als mit umwandeln zu kämpfen haben. Ich selbst gebe jedenfalls nicht mehr viel Geld für cpu aus. Der rzyen 9 5950x war jedenfalls teuer genug gewesen. Angesichts davon das labgfristig 24 Kerner standard werden und auch der geringe nehrleistung brauche ich mir echt keine Sorgen zu machen.

Der threadripper 5965wx das der gegen einen ryzen 9 7950x nur knapp verliert erkläre ich mir nur darum das der threadripper eher sehr schlecht ausgelastet wird. Sonst wären ja diese besser bei der Leistung. Smt ist jedenfalls für die schlechte auslastung nicht mehr verantwortlich. Der nächte threadripper wird jedenfall wohl kein 32 kerner mehr getestet werden müssen.

Da die Ergebnisse ja wohl eindeutig sind. Für was wo man weiß wie es sein wird, braucht man sich echt keine Gedanken mehr zu machen.

Ich sage dennoch danke für die ganzen Antworten von euch. Und hoffe das es keine missverstandnisse es gab.
 
Zurück
Oben