Chillaholic schrieb:
Intel ist bloß spürbar effizienter im Leerlauf.
Was aber in dem Fall primär am X570 sowie TRX40 liegt.
Beide Chipsätze sind absolut keine Kostverächter, was den Leerlauf angeht. Die 3x00er verhalten sich auf B450 und X470er doch recht normal im Leerlauf, auch wenn durch den Chiplett-Design durchaus ein paar Watt mehr auf der Urstehen.
Muffknutscher schrieb:
Natürlich gewinnt Schweinetel weil die mehr Takt auf weniger Kernen fahren.
Wobei der maximale Takt auch bei Intel in den entsprechenden Bereichen nicht viel höher ausfällt und die CPUs sich bei Single-Core Anwendungen als auch Spiele nicht so viel geben.
Die einzigen CPUs die im Single-Core noch davon fahren sind die sehr hoch taktenden 6c und 8c CPUs. Jedoch ist der Leistungsunterschied auf dem Niveau auf dem wir uns befinden, eher irrelevant.
Als Privatanwender macht man aktuell weder mit AMD noch mit Intel etwas falsch.
Baal Netbeck schrieb:
...Hier wäre es mal cool zu sehen, wie ein reines Raytracing Spiel laufen würde. ...
Nicht so gut, wie du nun vermutest. Gleich dazu mehr.
calluna schrieb:
Was denkst du ist schneller... eine CPU mit 64 Kernen und AVX256 oder eine GPU mit unzähligen kleinen Recheneinheiten, die für diese Aufgabe ausgelegt sind. ;-)
Also eine 64-Kern-CPU mit je 2 AVX256-Einheiten kommt am Ende, wenn man es runter Brechen will, auch auf
ca. 1024 INT32/FP32-Shader. Dazu kommen pro Kern noch 4 reine INT32/64-ALUs hinzu, sodass man am Ende auf gut 1280-Rechenwerke kommen.
Ein guter Software-Renderer kann hier durchaus schon Achtungserfolge für sich verbuchen und kann auch schneller sein als eine GPU mit ähnlicher Rohleistung, weil viel mehr Daten in den Caches gehalten werden können und ebenso der deutlich einfacher Zugriff auf den Caches pro Core ist bei RayTracinung, genauer der BVH-Suche, Gold wert.
Es hat ja ein Grund, warum sowohl NVIDIA als auch AMD die Wege der Shader auf die Caches mit Turning als auch RDNA direkter gestalten und ebenso, warum sie spezielle Funktionseinheiten für die BVH-Suche (NVIDIA RT-Cores / AMD als Erweiterung in den TMUs) entworfen haben und diese noch direkter auf die Caches als ach den Arbeitsspeicher zugreifen können.
Baal Netbeck schrieb:
Die GPU ist sicherlich viel schneller....aber trotzdem fände ich es interessant....es gab ja schon Quake 3 und 4 mit CPU Raytracing....Also vor vielen vielen Jahren....damals noch mit mehreren Quadcore CPUs.....das jetzt mit 64 Kernen neu zu probieren wäre einfach ein schöner Vergleich.
Wobei man hier doch etwas klar stellen sollte:
Das RayTracing von Daniel Pohl, das er mit Quake 3, Quake 4 und glaub ich mit Wolfenstein (2009) gezeigt hat, war doch noch recht "simpel". Es zeigte zwar beeindruckende (direkte) Schatten und Spiegelungen, gleichzeitig war es jedoch von der Beleuchtung als auch den indirekten Schatten sehr simpel, da viele Effekte, die wir da heute in den Rasterizer kennen, überhaupt nicht berechnet wurden. Bei Quake 3, Quake 4 und Wolfenstein dürfte es sich damals wohl um rekursives
RayTracing gehandelt haben.
Die GPUs werden jedoch auf das PathTracing ausgelegt, dass wesentlich glaubwürdigere Schatten, Beleuchtung und Reflexionen berechnet und daher auch noch mal andere Leistungsanforderungen stellt. Ein PathTracer wäre damals vermutlich auf den Quad-Cores und Co nicht gelaufen.
Der rekursive RayTracer von Quake 3 und Quake 4 würde heute vermutlich auf einer 64-Kern-CPU durchaus schneller laufen als damals und könnte sogar FullHD bei 60 Frames schaffen, gleichzeitig könnte aber selbst eine "Mittelklasse" GPU Quake 3 und Quake 4 mit rekursiven RayTracing bei FullHD die 60 Frames schaffen und wäre günstiger. (Nur Vermutung).
Bei einem PathTracer könnte die 64c-CPU durchaus auch "Vorteile" haben, aber nur bei dem Durchlauf des BVH-Baums, da die CPU größere Caches hat und diese auch sehr schnell Angebunden sind. Sobald die Shader aber ausgeführt werden, ist die GPU wieder in Vorteil.
Es hat schon einen Grund, warum NVIDIA mit Turning als auch AMD nun mit RDNA die Latenzen als auch die Wege der Shader auf die Caches verkürzt und optimiert hat und ebenso, warum NVIDIA die RT-Cores entwickelt hat, die ebenso direkt mit den Caches und dem VRAM verbunden sind. Und es ist der Grund warum AMD die BVH-Funktionen in die TMUs integriert, da diese eben auch sehr direkt auf den RAM zugreifen können.
teufelernie schrieb:
Jeder Cache der nicht direkt an dem Core hängt, wäre aber recht langsam, auch wenn das "Fabric"mittlerweile wesentlich besser ist.
...
Der L3-Cache wäre dennoch schneller als der RAM und die Latenzen wären auch niedriger.
ZeroZerp schrieb:
Somit ist die CPU für eine Mehrzahl der Benutzer belanglos.
Genau so ist der 9900K und 9900KS für die meisten Benutzer belanglos, weil der Mehrwert - bei Anwendungen - von 5GHz gegenüber den kleineren Modellen - auch von AMD mit 4,5 und 4,0 GHz im Alltag doch eher überschaubar bis nicht vorhanden sind.