News AMD Ryzen 9 7950X („Raphael“): Gerüchteküche spricht von bis zu 5,7 GHz

Oder noch besser nur weil es 144 nhz ist,heist das noch lange nicht das man auch wirklich 144 fps braucht.Die 144 hz wirken nämlich auch ,auch wenn man nur 60 fps hat.So ist das ja nicht das es wirkungslos ist.So kann man dann ebenfalls sparen.Aber ändert nix dran das die CPU immer gleich viel Strom frisst.Daran wird man nichts ändern können.
Bin echt gespannt wie die neue CPU so abgehen wird.
 
latiose88 schrieb:
Das mit den register ist interessant. Wusste nicht das des für die Anwendung unsichtbar ist.
Man unterscheidet heute zwischen zwei Arte von Registern, einmal die Architekturregister, also die Register die in der ISA fest gelegt werden, bei x86 sind das die Register RAX, RBX, RCX, RDX, RBP, RSI, RDI und RSP sowie die FPR0 bis FRP7 (später dann MMX0 bis MMX7 oder als XMM0 bis XMM7). In den späten 1970er waren Transitoren "teuer" und entsprechend hat man an Registern in den ISAs damals auch gesparrt, weil man wo die Schaltungen wo anders brauchte.

Mit x64 hat dann AMD - weil das damals auch bereits zu Problemen führte, da man mehr Load- und Store-Einheiten brauchte - die Register R8 bis R15 und XMM8 bis XMM15 eingeführt. Die SSE-Register werden heute auch als AVX-Register genutzt, heißen dann halt wieder anders, aber lassen wir das mal weg.

Die Software sieht nur dieses 16 + 16 Register - und noch ein paar Spezialregister, mehr nicht. Da heutige Prozessoren superskalar arbeiten und Befehle auf - bei AlderLake bis zu 6 - kommt es vor, dass zwar Befehle "theoretisch" Nebenläufig sind, aber durch Namesgleichheit der Register nicht Nebenläufig arbeiten können. Um in diesem Fall doch eine Nebenläufigkeit zu ermöglichen, gibt es das Register-Renaming bei OoO-Prozessor, damit man mehre Befehle nebeneinander ausführen kann, ohne dass sie sich bei den Registern in die quere kommen.

Da Befehle dann auch spekulativ ausgeführt werden aber auch ein Prefetching der Daten statt findet um sie in die Register zu laden, brauchst du eine gewisse Anzahl an zusätzlichen Hardwareregistern, also die Register, die die CPU wirklich hat, in denen sich die "Optimierungen" austoben können. Ebenso brauchst du für SMT viele Register mindestens einmal "doppelt", da du ja zwei Task hast, die da ablaufen und sich diese nicht in die queere kommen dürfen.

Zen hatte 168 Register, Zen 2 hatte 180 Register und Zen 3 hat nun 192 Register und das hängt bei Zen 2 und 3 damit zusammen, dass man den Sort-Order-Buffer vergrößert hat - also man mehr Befehle umsortieren konnte - ebenso, dass man die Load/Store-Queue vergrößert hat, dass man die Lookaside-Buffer und Co vergrößert hat und damit auch mehr Daten "vorladen" konnte, die dann irgendwo Platz finden müssen, damit die Daten bereit liegen, wenn sie gebraucht werden.
latiose88 schrieb:
Und heißt es je mehr register desto besser für die CPU oder kann sich durch das auch nicht mehr ab einen gewissen Punkt mehr abarbeiten. Wie sieht es aus in der Hinsicht.
Nicht automatisch, weil sowohl der "Kern" aber auch das Programm etwas mit den Registern anfangen können müssen.

Ein Zen 5 oder OceanCove (Nachfolger von GoldenCove) würden nicht automatisch schneller werden, nur weil man weitere Hardwareregister hinzufügt, sondern die Register würden ab einem gewissen Zeitpunkt brach liegen, wenn man nicht andere Parameter anpackt. Genauso würde die CPU nicht automatisch schneller oder effizienter werden, nur weil man noch mehr Daten vorladen kann in die Register, da ja immer wieder auch ein "ungeplanter" Sprung vorkommen kann und dann die geladenen Daten umsonst geladen wurden.

Die Größe Registerfiles einer CPU wird in der Regel anhand der ALUs, Load- und Store-Einheiten, des Größe des Reorder-Buffers, der tiefe der Branche-Prediction und eben der Architekturregister ausbalanciert. Man braucht bei den "Registern" einfach nur genug und mehr "hilft" nicht unbedingt.
latiose88 schrieb:
Zen 3 hat da ja mehr, ja nicht jede Zen 3 rennt automatisch Zen 2 davon.
Anders Beispiel wäre SunnyCove zu GoldenCove: Beide haben 280 Register, dennoch legte GoldenCove ca. 20 % IPC zu. SunnyCove hat damals den "Register-Overkill" gezündet, aber erst GoldenCove kann jetzt mit den weiteren Umbauarbeiten damit wirklich umgehen und daraus nutzen ziehen.

Die Architekturregister wirken sich dirkt auf die Software aus und legen dann fest, wann ein Compiler mit Load/Store-Anweisungen agieren muss, die Hardwareregister sind für die Optimierunge auf der Hardwareebene wichtig, damit sie sich austoben können.
 
  • Gefällt mir
Reaktionen: Mastercheef, peterX und Colindo
ok das heißt die software muss rein therotisch ebenso mit optimiert werden um die ganzen Register die Leistung zu erhöhen.Würde es aber bei ner alten Software bleiben dann muss die CPU mehr umsortieren und hat damit mehr Arbeit dies Optimal zu Nutzen.

Und das erklärt auch warum Register bei mir auch keine klaren Wunder vollbracht haben.Dachte durch Zen 3 das die Steigerung so groß ist das Ryzen die Threadripper schlagen könnten in den unterschiedlichen Software.
Ich wusste nicht wie komplez das ganze ist.
Meine Umwandlungsoftware verwendet noch 32 Bit und kein 64 bit.Wird also interessant werden wie sich das ganze auf die Zukünftigen CPU auswirken wird.

Und auch klar wenn die Register nicht zu dem Erfolg führt,dann wird es wohl die Art der Threads sein die Entscheiden. Man hat ja trotz abschalten von SMT bei einem THreadripper 3970x 32 Threads. Ich dachte warum ein 5950x hat doch ebenso 32 Threads also müssten beide ja gleich schnell sein.Bis ich dann die Unterschiede im Form von der Leistung gesehen hatte.
Jedoch hat ja ein 5950x meher Register,verliert jedoch gegen ein Zen 2 Threadripper der ja weniger Register hat.Also kann es an was anderes liegen. Am ende des suchens ,war mir klar die SMT EInheiten können ja nicht so gut sein also leisten weniger als logische Threads.Das wird die Lösung sein.

Frage mich nur wie der Ryzen 9 7950x da drauf legen will.Wenn es nicht die Register sind die Entscheiden,was dann.

Ich verwendet Windows 10,ein 32 Bit von 2016 Videoumwandlungs Programm namens Xmedia Recode.Das ich gemerkt habe bei 1 einzelnen Instanz schlecht Abschneiden.Ich verwende 2 gleiche Instanzen von dieser Software. Die Leistung wurde dadurch verbessert.

Ich frage mich wie gut wohl Register und so sortieren müssen um so einen hohen Aufwand zu betreiben. Die Daten scheinen jedenfalls klein zu sein,weil passen bei allen ab 5800x in den Cache rein. Nur der 5700X mit halbierten L3 Cache zeigt noch unterschiede.
Das es wenig Ram verbrauch hat,liegt wohl ebenso dank 32 bit daran das wenig Ram verwendet wird.Das ist ebenso klar.
Wenn aber die Hersteller wie AMD oder Intel da nicht mehr so viel rausquetschen können,wie soll dann der User so viel rausholen können. Und anscheinend wirkt sich das 32 bit auch bei der leistungunterschied beim CPU Takt ebenso aus.

Naja wenn alles nichts hilft muss man eben mehr Takt den Nachteil von SMT ausgleichen.Damit kann man auch die Logischen Kerne schlagen.Nur kostet das wiederum viel Strom.Alles hat also seinen Preis.
Und je mehr Fähigkeiten man in ner CPU rein steckt desto neuer muss die Software sein um diese auch zu nutzen zu können.

Wenn ich sowas lese wie AMX und so,das beherscht meine alte Software nicht.Sie müsste also von diesem Jahr sein um diese auch nutzen zu können.Ich frage mich wie viele Instuktionen noch kommen werden die ich nicht nutzen kann.Wenn es schon bei sowas wie AVX bei der Software schon scheitert,dann kann man schon sich ausmalen wie hart es noch werden wird.

Und ja ich nehme die IPC versprechen sehr ernst weil ich mich an die wenigen Mehrleistung die dies ausmachen festklammere.DIe wenigen Prozent die merhleistung geben wird.
Also ist für die wo ne EIngeschrönkte Nutzfeld haben und nicht die gesammte CPU voll Auslasten.

Ich frage mich ob diese ganzen extras dazu führen das die CPU Auslastung dann durch das runter geht.Zum Glück steigen die Transistoren Anzahl weiter.So das selbst wenn ich nur 60% aller Transistoren nutze es dann dennoch mehr sind als es heute der Fall ist.

Wenn ich von den 19,2 Millionen nur 80 % Nutze und später dann 30 Millionen nur 55% ,dann wird wohl das letze mehr sein.Wobei bis ins kleinste weis man nicht ganz was so alles in der CPU ein Transistor macht.

Mir wollte einer weis machen es gebe doch nur ein Transistor und keine millionen.VIelleicht sind das ja sub Einheiten auf einen großen Transistor auch Schaltungen.Weil die ja komplexer sind als so ein einfacher Transistor es je sein könnte.
Und ja ich suche noch immer nach noch mehr Leistung.DIe CPU soll mehr können,die Software ist mir egal,denn die ist eh nur einfach gestrickt.Die CPU macht doch eh die meiste Arbeit.Also von daher spielt es doch keine Rolle welche Version,welche Art von Software.DIe CPU muss also immer volle Arbeit machen.
 
aha ok,also unterscheidet sich ein Threadripper im Kern garnicht von einem Ryzen verstehe.
Das erklärt auch die kleinen Unterschiede.Na dann bald wird die Leistung vom Threadripper 3970x bei der Leistung fallen.EIn Ryzen 9 7950x wird es möglich sein.Ich werde schon sehen.Habe nicht vor gehabt dies zu kaufen.Es wird hier im Forum gewiss welche geben die sich sowas kaufen werden.FÜr 2000€ die ich im moment eh nicht habe aber auch übertrieben bei der Anschaffung nur um von einem 5950x zum 7950x zu wechseln,sehe ich echt nicht ein. Und das alles nur um 1 Anwendung ein paar Prozent zu beschleunigen.Naja lohnt sich nur für die wo mehrere Anwendung verwenden.

Beim zocken bin ich bei der Planung aus nem i7 6950x einen reinen 4 kerner zu machen um Strom zu sparen weil keiner meiner alten Games diese CPU voll Auslasten können.Darum kann ich es machen.Habe es in reinen Spiele Rechner und reinen Arbeitsrechner unterteilt.
Ja ich weis wegen nur einer Software,aber gut das ist halt so.Wenn die nicht wäre,würde ich wohl bei einem 6 Kerner herumdümpeln oder noch immer auf einen 4 Kerner.
 
Ein Treadripper der 3000er Geeneration hat die selben Kerne wie ein Ryzen der 3000er Generation wie ein Epyc der 3000er Generation :-)
das sind Synergieeffekte, die da AMD benutzt. Es werden Massenhaft die selben Kerne Produziert und unterschiedlich viele davon zusammengepackt mit teils unterschiedlichen IO DIEs
 
das zusammen ergibt dann auch mehr Transistoren weil man die DIes dann x der entsprechenden Anzahl mulitplizieren muss.
Anscheinend kann man Anwendung mit der schiere an so vielen nichts anfangen.Somit bin ich wieder am Anfang.Ich bin immer auf der flaschen Färte mit den Register und so gewesen. Es gibt dann ja auch den Allzweck Register wie der Heißt.So dachte ich der könnte mir helfen bei der Leistung.Aber naja das war wohl ne falsche Vorstellung von der CPU gewesen.Weil so leicht ist es ja eben dann doch nicht.Das alles was ich hier so gelesen habe.Interessant.
 
ja ist irgendwie so.Am ende ist es wohl doch nicht so leicht ausfindig zu machen was für die jeweilige Anwendung am meisten bringt.Naja um das testen wird man da wohl echt nicht drum rum kommen.
 
Alexander2 schrieb:
Du verlierst dich in Details möchte ich behaupten @latiose88 :-)
er hat einfach auch faktisch wenig Ahnung - wenn dann hier Leute mit Details versuchen Dinge, welche er scheinbar misverstanden hat oder einfach falsch interpretiert, richtig zu stellen, dann endet das so. Zu viele verschiedene Fachtermini im am Ende doch komplexen Zusammenhang.

Der Use-Case von @latiose88 ist halt seine quasi unendlich vielen TV Aufnahmen zu konvertieren, dafuer nutzt er warum auch immer dieses eine Tool.

latiose88 schrieb:
Beim zocken bin ich bei der Planung aus nem i7 6950x einen reinen 4 kerner zu machen um Strom zu sparen weil keiner meiner alten Games diese CPU voll Auslasten können.Darum kann ich es machen.Habe es in reinen Spiele Rechner und reinen Arbeitsrechner unterteilt.
Um wieviel Strom denkst du geht es bei dir wenn du Kerne deaktivierst?
latiose88 schrieb:
Ich verwendet Windows 10,ein 32 Bit von 2016 Videoumwandlungs Programm namens Xmedia Recode
Warum nutzt du a) diese Tool und b) die 32 Bit Version wenn es eine 64 Bit Version gibt? Ich glaube auch niemand wird fuer dich die neuen Threadripper mit deinem Tool und Workload testen. Ich sehe auch nicht so ganz was dir das bringt, du wuerdest dir doch niemals eine solche Plattform zulegen. Wenn du ein weiter verbreitetes Tool nuzten wuerdest, dann koenntest du zudem auch die Benchmakr Ergebnisse dann interpolieren.

Ansonsten warte einfach Tests von der neuen AMD Plattform ab, aber denke bitte nicht in Registern etc.
 
  • Gefällt mir
Reaktionen: Colindo
Doch diese threadripper haben welche für diesed tool getestet. Nur die aktuellen die pro threadripper 5000 wird unmöglich sein weil es keiner hier hat und ich auch keinen kenne der es sich gönnen würde. Ja wird wohl an den extravaganten Preis liegen. Die threadripper der 3000 Serie lag wohl daran weil der Preis noch Ordnung war. Nun ist dies ja nicht mehr so.

Und naja wenn ich ehrlich bin könnte ich davon von der Summe auch 2 PCs der selben sorgte kaufen und wäre wohl deutlich schneller dran am Ende.

Achja beim sparen dieser einen CPU wären es gewiss 86 Watt oben rum weniger gewesen. So das die CPU maximal 56 Watt mit 4 kernen verbraucht. Weil pro Kern ne ersparnis von 14 Watt gewesen wäre.

Jedoch schmiere mit es beim hochfahren des Systems schon ab. Wohl das betriebsystem versucht von den anderen kernen zu booten. Naja hat halt nicht hingehauen gehabt.

Und den Rest ist klar, kann ich machen nach eigenen ermessen.
 
Nach der Info von Hardwareunboxed könnte man sagen es sind übertaktete Server CPUs, also Epyc.

Natürlich sind die ab Werk so, ist also nicht wirklich übertaktet :D sondern einfach mehr Takt als im Server Umfeld. Aber auch bei denen bleibt die Tatsache, das es die selben Chips sind wie bei den 5000ern Desktop CPUs und nur der IO Die ein anderer ist in dem Fall 8 Speicherkanäle und mehr PCI-E.

Wieviele Kerne kann dein Programm Auslasten bei den Desktop CPUs? und wurde das mehr bei den Threadripper? Ich hatte das ja so verstanden, das du beim Threadripper im Grunde nur noch mehr Instanzen hättest starten müssen um den überhaupt Auslasten zu können und beim normalen Desktop Ryzen musst du auch schon 2 Instanzen starten..
Also wenn du nicht einfach immer mehr Instanzen starten willst, dann bringt dir demnach der Threadripper oder gar Epyc nichts.

Dein Limit ist in erster Linie die Software, weil sie es nicht managed auf mehr Kerne zu gehen von sich aus.

Hier gibts auf jeden fall einen haufen Benchmarks die Das Tempo vom alten Threadripper und dem neuen einordnen. DesktopCPUs sind auch dabei.
https://www.phoronix.com/review/amd-threadripper-5965wx/2
 
Schwierig zu sagen aber durch die 2 Instanzen kann ich 16 kerne gut auslasten.

Der ryzen 9 5950x ist zu 93 % ausgelastet und der threadripper 3970x ist zu 75 % ausgelastet. Und für das der so schlecht ausgelastet ist und die Tatsache das smr abgeschaltet worden ist, ist dieser trotz dessen um 8 % schneller. Ich gehe von den weil diese 32 threads nativ sind ohne smt und es darum zu solch einer Steigerung kommt.

Ob der Nachfolger das überbieten wird hängt wohl davon ab wie stark die nativen 16 kerne ohne smt zulegen werden. Da spielt der takt wohl eben ne wichtige Rolle. Um damit gleich zu ziehen bedarf es 4,8 GHz für ryzen gegen 4 ghz threadripper. Aber ich lese was von nur 4,6 GHz all core. Wobei ipc wird hier wohl reichen um dies zum schlagen zu bringen. Hoch lebe Zen 4. Wobei an Wunder zu glauben wirklich ne sehr stark Vorstellungs Kraft braucht.

PS: ICH denke mal es sind wohl 11 Kerne je Instanz. Was mal einer geschafft hat durch die 22 Kerne je software, feste 11 Kerne zugeordnet hatte war mit dem 3960x gleich schnell gewesen. Ist mir allerdings bisher nicht gelungen die gleiche Instanz dauerhaft feste Kerne zu zu ordnen. Da erreicht man wohl die meiste Leistung. Ich war überrascht gewesen als das einer für mich getestet hatte. Genau so. Also 2x11 Kerne unter dauerlast. Der 3960x war sehr gut ausgelastet gewesen und sogar Richtung 100 %. Smt war auch da ebenso abgeschaltet gewesen wie beim 3970x. Nun so einfach ist das also nicht. Und ich wüsste auch nicht wer da so gut arbeiten könnte. Process picasso kennt nur die beiden Instanzen als ein und die selbe Arbeit an also kann man nur der einen so viel Kerne geben und das war es. Aber interessant war das Ergebnis schon gewesen.
 
Zuletzt bearbeitet:
solange du nicht Äpfel mit Birnen vergleichst wird der neue Schneller sein :-) aber lohnen wird sich das wohl nicht, du hast ja auch schon so massig viel Rechenpower mit 2 CPUs am dauerlaufen nehme ich an :D
 
Ne ne wie kommst du denn drauf das ich 2 PCs am Dauer laufen habe. Schrieb ja das ich das throretisch vom preis her könnte. Aber nicht machen werde. Alleine das die steomrechnung durch das steigt. Wobei ein optimierter 3960x 180 Watt Verbrauch hatte. Das ist wirklich schwer zu toppt.
Und nun ja es geht wohl wirklich nur noch aus Interesse ob da noch was gehen würde bei der ganzen leistung.
 
IBISXI schrieb:
Der ist genau so kühl wie AMD das vorgesehen hat. (läuft und hält)
Mit deinem Premiumkühler, sogar noch kühler.
Was für ein Blödsinn, in Tarkov ist der bei 75 Grad und bei 60% Auslastung, bei 85 Grad ist da Schluss.
Wo ist da kühl? Mein beschießener 4770K übertaktet auf 4300GHz ist da maximal bei 65 Grad.
Beim AMD habe ich Lüfterkurve angepasst, dass er bei 60 Grad auf 100% Umdrehung geht, beim alten Intel erst ab 80 Grad. Unter Prime ging der Intel auf 80 Grad, beim AMD traue ich mich gar nicht zu testen.
 
Und? Alles so wie von AMD vorgesehen.

Was dein 4770K macht, ist irrelevant.

Du kannst auch keine Ente mit einem Porsche vergleichen.
 
  • Gefällt mir
Reaktionen: Cyberbernd und aldaric
Zurück
Oben