News 8-Kern-CPUs: Core i9-9900K & i7-9700K sind offiziell, Kritik an Benchmarks

modena.ch schrieb:
Dann sind AMDs immer anfällig auf Vollbestückung, mit wenigen Ausnahmen bei gewissen Steppings
schon früher bei Phenom II können bei Vollbestückung selten dieselben Ramtakte gefahren werden wie
bei halber Bestückung.

Dann ist das aber AMDs Problem und nicht das der Tester.

Wenn man sich eine Workstation kauft, erwartet man schließlich normalerweise, dass diese auch vernünftig mit Vollbestückung umgehen kann. Alles andere ist doch ein Armutszeugnis.

Wir wissen beide jetzt natürlich nicht, ob das der Grund war für die Settings in dem Test.

Man kann sich natürlich auch darüber streiten, was jetzt fairer ist: Immer der gleiche RAM oder RAM nach Spezifikation.
 
Hopsekäse schrieb:
Die Funktionen sind da, also stelle ich es anders ein und starte es so...? Wäre schön, wenn es so einfach wäre.
Bei sogenannten hybriden Anwendungen, sprich die multi-processing und multi-threading, implementieren, ist es so einfach. Ich muss ja beim starten nur angeben wie viele Prozesse ich bsp. pro Socket/Node/o.ä. haben möchte.

Hopsekäse schrieb:
Ich habe gerade keine Werte zur Hand und arbeite nicht primär mit Stencils, aber eigentlich sollten gerade die eher schlecht auf "mehr NUMA" reagieren. Ja, die Tools um das notwendige Übel NUMA zu berücksichtigen gibt es.
Nein, stencils haben ja den Vortiel primär nur auf nearest-neighbor communication angewiesen zu sein. NUMA wäre tatsächlich dann gravierend wenn jeder mit jedem kommunizieren muss. Mehr dazu weiter unten bei einzelnen "Geschwindigkeiten".

Hopsekäse schrieb:
Aber anhand deiner weiteren Ausführungen muss ich davon ausgehen, dass du es nicht tatsächlich auf einem Epyc-System getestet hast...
Haben hier im Haus Intel SNB, IVB, HSW, BDW, KNC und KNL und eben auch AMD Epyc. Nur (leider) noch keine SKL, aber Test dafür kann man remote auf entsprechenden Clustern ausführen.

Hopsekäse schrieb:
Es ist mMn etwas illusorisch zu denken, dass das keine Performance-Auswirkungen hätte. Wenn man bei beispielhaft insgesamt 32 Kernen anstelle von einmal NUMA alle 16 Kerne (QPI) nun alle 4 Kerne einen Prozess anlegen muss, der mit einem anderen Prozess mit Geschwindigkeit X (intra-Chip) kommuniziert und mit 2 anderen mit Geschwindigkeit Y (inter-Chip), dann ist das schon eine andere Geschichte. Und das ist jetzt noch mit der Annahme gemacht, dass das AMD-System ein Single-Sockel-System ist und das Intel ein Dual. Da kommt dann noch Geschwindigkeit Z dazu, wenn's auf den anderen Sockel geht (kein Wunder dass AMD 1-Socket pusht).
Und die Kommunikation zwischen den 32 Kernen ohne NUMA hat unabhängig davon welche 2 Kerne miteinander kommunizieren die selbe Latenz und Bandbreite, das ist illusorisch.

Ja, AMD hat hier Geschwindigkeit A innerhalb eines CCX, B innerhalb eines "Dies", C zwischen 2 Dies auf einem Socket, D zwischen 2 Dies auf unterschiedlichen Sockets, E zwischen zwei Dies in unterschiedlichen Nodes. Wobei E noch weiter aufgespalten wird, abhängig von der genutzten Fabric Topologie.

Das ist kompliziert, korrekt, aber wie sieht es den bei Intel aus?
SKL mit deaktiviertem SNC: A, B und C sind eine "Gruppe", wobei nicht eine Latenz/Bandbreite, sondern ein breites Spektrum.
SKL mit aktiviertem SNC: A und B eine Gruppe, C ist zwischen zwei SNCs.

KNL mit deaktiviertem SNC: A zwischen 2 Cores in einem Tile, B und C sind eine "Gruppe" zwischen Cores in unterschiedlichen Tiles
SKL mit aktiviertem SNC: A zwischen 2 Cores in einem Tile , B zwischen 2 Cores in unterschiedlichen Dies, C ist zwischen zwei SNCs.

(In allem wurden HW Threads ignoriert.)

Also eigentlich nicht wirklich anders. Eine zusätzliche Ebene hin oder her, macht auch nichts. Im Idealfall stimmen Dimensionen mit den einzelnen Ebenen überein.

Und da hier der Begriff gefallen ist: SNC (Sub NUMA Clustering). Dies erlaubt einen SKL in 2 virtuelle NUMA Domains, einen KNL in 2 oder sogar 4 virtuelle NUMA Domains einzuteilen.
Diese Option verkauft Intel kurz gefasst sogar als: "Nutze NUMA Vorteile in entsprechenden Anwendungen aus." Ja, Intel verwendet hier "NUMA" und "Vorteile" in einem Satz. Es ist eben nicht alles schwarz oder weiß, je nach Anwendung passt das eine System oder das andere besser.

Hopsekäse schrieb:
Ganz ehrlich aus der Praxis: vermutlich wird man eher die untere NUMA-Ebene (CCX) ignorieren und eventuelle penalties in Kauf nehmen...
Ja, vmtl., bzw. würde man einfach benchmarken. Ansonsten git es ja auch noch nested multi-threading.

Hopsekäse schrieb:
Habe hier gerade mal das erstbeste Ergebnis rausgesucht für Stencils und Epyc:
https://www.phoronix.com/scan.php?page=article&item=amd-epyc-7351p&num=4
Gerade der OpenMP-Stencil schmeckt dem Epyc gar nicht. 32 Kerne outperformed von 20 Intel-Kernen (die beiden haben allcore sogar denselben Takt), 16 Kerne auf dem selben Niveau wie höher taktende 8 Intel-Kerne.
Ist ja auch eine reines multi-threading Beispiel, das wird nicht gut auf solchen Systemen laufen. Das hatte ich nie behauptet.

Hopsekäse schrieb:
Natürlich hast du recht und man KANN NUMA behandeln, bzw. es gibt gangbare Wege auch aus NUMA-belasteten Systemen gute Leistungen herauszuholen. Es ist nur bei weniger NUMA-belasteten Systemen wesentlich leichter und bei ansonsten vergleichbaren Systemen kommt man auch mit weniger NUMA dichter an die Peak-Werte. Wir haben ja hier nur über einen Aspekt (process und thread placement) geredet. Richtig gut optimiert hast du ja erst, wenn du die tradeoffs richtig gemacht hast. Man kann/muss ja dann auch noch drüber nachdenken, ob man vielleicht an den Chunksizes (was beim Stencil vielleicht eher Patches oder Cell-Selections sind) dreht, um relevante Daten möglichst NUMA-nah zu haben...
Ist korrekt, nur gibt es faktisch kein NUMA unbelastetes System, und auch diese haben wenn andere Nachteile...

Hopsekäse schrieb:
Wobei man wenn man sowas möchte wohl gerade Intels Mesh besonders gut geeignet ist.
Genau das ist nänlich kein Vorteil, das Intel Mesh ist eine Katastrophe. V.a. beim KNL mit seinen 64+ Cores ist bsp. eine Thread Barrier über den gesamten Chip sehr sehr teuer. Es läuft also oft Code mit 4 Prozessen und dann Threading auf 16+ Cores besser, da hier der multi-processing overhead geringer ist als die Ersparnis nur noch einen Thread Barrier über 16 Cores zu benötigen. Schlussendlich also alles Anwendungsspezifisch, bzw. man muss es einfach alles benchmarken.
 
  • Gefällt mir
Reaktionen: Alex2005 und Ernie75
nospherato schrieb:
Ich muss sagen, das mit dem game mode find ich schon witzig :D
Als Gegenvorschlag:
Das Tool bietet auch an den RAM Takt zu senken, den CPU Takt zu senken und Kerne sogar noch einzeln abzuschalten...
Warum nutzen wir das nicht für den Test, ist doch auch von AMD bereitgestellt:D?

Und das ist alles rein AMDs schuld. Wie konnten die nicht ahnen, dass ein Tool für den ambitionierten Anwender von einer Testklitsche nicht verstanden werden wird?

:freak:
 
  • Gefällt mir
Reaktionen: Herr Melone, Unnu, DarknessFalls und 2 andere
Banned schrieb:
Dann ist das aber AMDs Problem und nicht das der Tester.

Sehe ich nicht so. Gerade auf dem 2700X werden vermutlich 90% der Leute mit 2 Riegeln fahren und zwar mit 16GB und weniger. Laut Steam Survey haben nur 3% der Nutzer mehr als 16 GB RAM. Dafür dass der Test "Praxisnähe" simulieren soll (wie mit AMD's boxed Kühler und out-of-the-box RAM timings) sind 4x16GB Ram reichlich praxisfern.
 
  • Gefällt mir
Reaktionen: Obvision, GERmaximus und Ernie75
Aldaric87 schrieb:
Also läppische 500-600 € für den Intel Mainstream 8-Kerner+HT.

Welch Überraschung, hatten doch einige hier im Forum prophezeit das der 8-Kerner auf keinen Fall teurer wird als der 8700k bei Release.

Naja, man holt sich also nun auch im Anwendungsbereich im Mainstream die Leistungskrone zurück, will dafür aber mal eben das doppelte im Vergleich zum 2700x.

Da werden viele dann lieber auf AMD's 7nm Generation warten.

AMD hatte die Leistungskrone ?
Aber nicht im Gaming. Da ist noch immer der 8700K an erster Stelle. Und der wird dann wohl nun von dem 9900K abgelöst.
 
Das Schlimme ist nicht, dass dieser Fehler passiert ist, sondern dass Intel darauf nicht eingeht.

Hätte man gesagt, dass da was falsch gelaufen ist und man nen korrekten Test nachreicht, wäre doch alles gut gewesen. Aber so...


@dr. lele

Es ging um TR mit 128GB RAM. ;)

In Bezug auf Puget Systems. Hatte hier jemand irgendwie eingeworfen.
 
dr. lele schrieb:
Vielleicht bietet Intel ja auch Power-Saving oder so an, klingt ja auch gut und hilft bestimmt der Effizienz. Könnte man ja auch einfach anmachen oder? Die Dokumentation sollte man ja bloß nicht lesen und einfach alles anmachen was einem gefällt und das dann vergleichen.

Mach dich nicht noch mehr lächerlich!
Noch mal extra für dich "AMD Game Mode" was macht man denn mit einem Game Mode ... höchst wahrscheinlich Spielen. Wenn AMD durch den Game Mode seine CPUs ausbremst ist das deren Bier und kann man wohl nicht Intel vor die Nase reiben und die als Betrüger da hinstellen. Test unter real Bedingen nennt sich das. Wenn sich jemand so ein Systzem kauft und einen Blick ins Controllpanel wirft wird er auch zwangsläufig auf Grund der Beschreibung dort den Game Mode nutzen. Da braucht man einem auch nicht mit irgernd welchen Whitpapers zu kommen. Soll AMD eben seinen Game Mode als Ultra-Low-Energiesparoption vermarkten aber dann nich tals Game-Mode. Im Game Mode braucht man Leistung, wird das nicht erfüllt hat AMD eben Mist gebaut.
 
Der Game Mode ist für Threadripper gedacht, nicht für Ryzen. Man kann höchsten sagen, AMD hat verpennt den Game Mode für Ryzen zu entfernen/unsichtbar machen/deaktivieren.

Intel sollte auch checken was Sie einstellen, wenn Sie fair bleiben wollen würden :lol:
 
  • Gefällt mir
Reaktionen: Mrdk, DarknessFalls und GERmaximus
YforU schrieb:
Beispiel:
AMD: 2x24C mit 512GB -> 6C mit 64GB (da 2x 4x6C)
Intel: 4x12C mit 512GB -> 12C mit 128GB

Selbst in diesem Fall ist der Node doppelt so groß.

Ok, aber das macht doch mit Hinblick auf NUMA aware Software programmierung keinen Unterschied (NUMA Aware muss sie so oder so sein) und außerdem ist doch die Latenz innerhalb eines Packages bei AMD deutlich geringer als zwischen zwei Sockeln bei Intel. Außerdem kommt imho noch dazu das die 4x6C je Sockel bei AMD im UMA Mode laufen, sprich jeder Kern die gleiche Latenz zum Speicher hat (bei max. Bandbreite). Entsprechend sieht die Software bei beiden Systemen nur zwei NUMA Nodes.

Wie gesagt, bin Laie....
 
  • Gefällt mir
Reaktionen: s0UL1
Banned schrieb:
Dann ist das aber AMDs Problem und nicht das der Tester.

Wenn man sich eine Workstation kauft, erwartet man schließlich normalerweise, dass diese auch vernünftig mit Vollbestückung umgehen kann. Alles andere ist doch ein Armutszeugnis.

Wir wissen beide jetzt natürlich nicht, ob das der Grund war für die Settings in dem Test.

Man kann sich natürlich darüber streiten, was jetzt fairer ist: Immer der gleiche RAM oder RAM nach Spezifikation.

Seit wann ist AM4 eine Workstation Plattform? Und TR wurde nicht mit Vollbestückung gefahren (Testaufbau war 4x16) und TR hat auch kein Problem mit Vollbestückung.
 
Cerebral_Amoebe schrieb:
Beide CPUs mit eigenem boxed-Kühler getestet, dann würde sich keiner beschweren.
Aber wahrscheinlich kommt der Intel-boxed nicht mit der wahren TDP klar -> ca. 200W

Der (nicht vorhandene) boxed Kühler zeigt dann, dass die CPUs super schnell ins Uefi kommen, sich aber kein Betriebssystem starten lässt ;)

Aber ihr habt Recht: man testet beide mit dem gleichen kühler oder dem was dabei ist. In dem Fall also mit dem gleichen Kühler.

tobi1531 schrieb:
Mach dich nicht noch mehr lächerlich!
Noch mal extra für dich "AMD Game Mode" was macht man denn mit einem Game Mode ... höchst wahrscheinlich Spielen.

Da liegt ne Dokumentation bei. In Farbe und bunt und mit Bildern. Links dazu wurden hier gepostet und sind leicht zu finden. Und die Testklitsche hatte da keinen Zugang drauf? RTFM hat man früher mal gesagt.
 
  • Gefällt mir
Reaktionen: Herr Melone, s0UL1, Ceberus und 2 andere
tobi1531 schrieb:
AMD Bietet einen Game-Mode in ihrem Controll-Panel an und Intel wird jetzt dafür kritisiert weil dieser die Leistung vom AMD Systemen in Games drossel. Lustiges Völkchen im AMD Lager.
Mit dem Kühler genauso lächerlich. Der AMD Kühler wurde doch so hoch gelobt und jetzt auf einmal ist auch wieder Intel der böse weil sie dieses Meisterstück verwenden. Intel hat immer noch die schnellere CPU und fertig.
Alles was man Intel hier vorwirft sind doch Fehler die einzig auf seiten von AMD liegen.

"Game - Mode" sollte man vielleicht anders interpretieren. Nicht als „Modus für Spiele“ sondern eher als „Modus zum –rumspielen-„ an den Einstellungen der CPU (unter Anderem eben auch für ältere Spiele damit diese überhaupt laufen usw.).
EDIT: Bei Ryzen ist das sogar als "Legacy Compatibility - Mode" angegeben!

Denke so war das gedacht. Sonst hätte es eher „Gaming – Mode“ geheißen wenn es „nur für Spiele“ gemacht wäre und diese bzw. alle beschleunigen sollte. Die Funktionalität des Tools unterstützt diese These.

Ich gebe zu dass der Name irreführend ist aber es erklärt sich wenn man AMDs Beschreibung zum Tool anschaut. Es ist ein „optionales“ Tool welches !NICHT! standardmäßig aktiviert ist. Das Tool ist somit nicht der Status Quo bzw. der Normalzustand bzw. Spezifikationszustand für die AMD CPU. Es ist ein Tool zum „anpassen“ falls man Anwendungen hat, die eben nur unter bestimmten Bedingungen funktionieren und man dazu Anpassungen durchführen muss was bei den Tests von PT aber nicht nötig war bzw. in diesem Fall sogar Benachteiligungen mit sich gebracht hat. PT kann nicht behaupten, sich über die Funktion dieses „Modes“ nicht bewusst gewesen zu sein. Um das raus zu bekommen bedingt es lediglich 2min Recherche im Netz wenn man sich nicht sicher ist was das sein soll. Bei so einem komplexen Thema installiert und aktiviert man eben nicht einfach mal Blind alles mit der Erwartung dass es schon passen wird ohne sich etwas informiert zu haben. Vor allem nicht wenn man sich als „Experte“ ausgibt und „unabhängige“ Untersuchungen durchführt die öffentlich gemacht werden. Wenn man schon alles in den vom „Hersteller vorgegebenen Spezifikationen“ getestet hat wie PT angibt, dann hätte der „Game – Mode“ aus bleiben müssen!
 
Zuletzt bearbeitet:
@tobi1531 Der Game Mode ist nur für Spiele gedacht welche mit Multicore Prozessoren Probleme haben.
Ich will denen ja nichts unterstellen aber ich sehs folgendermaßen:

Game Mode aus: Oha, die Prozessoren von AMD sind zu wenig weit abgeschlagen - Testergebnisse löschen
Game Mode an: Ah ja, Intel liegt weit vorne. Keine Infos bezüglich des Testparcours und den Einstellungen preis geben

EZ win...
 
Ich sagte ja AM4 ist Consumer, TR4 ist Workstation.
 
  • Gefällt mir
Reaktionen: Banned
ZeroZerp schrieb:
@Smartcom5
Was regst Du Dich so auf? Die Retourkutsche der ersten unabhängigen Tests wird doch genau das liefern, wonach Du Dich so sehr sehnst -> Eine gestreckte Rechte in Intels Gesicht.

CB muss sich neutral verhalten und auch in Betracht ziehen, dass es ein Versehen sein könnte. Vorverurteilungen stünden einem neutralen Magazin nicht gut zu Gesicht.

Lass sie sich doch selbst demontieren... Ist doch ein nettes Schauspiel.

Grüße
Zero
Es bleiben aber für die normalen Konsumenten nur die Worte Intel ist 50% Scheller stehen... dann muss ein neutrales Magazin aber auch in die Headline schreiben das der ryzen nur mit 4 lernen und halb so schnellen ram läuft!
 
ro///M3o schrieb:
"Game - Mode" sollte man vielleicht anders interpretieren. Nicht als „Modus für Spiele“ sondern eher als „Modus zum –rumspielen-„ an den Einstellungen der CPU (unter Anderem eben auch für ältere Spiele damit diese überhaupt laufen usw.).

Fast, Game Mode, weil Spiele massive Probleme mit mehr als 20 Threads bekommen und teils den Betrieb komplett verweigern. Deswegen der "Game Mode" der die Kerne/Threads halbiert, viertelt damit am Ende 16 Threads/Kerne bei rumkommen.
 
  • Gefällt mir
Reaktionen: DannyA4
@Hopsekäse @YforU

Und um noch etwas hinzuzufügen. Es ist aus meiner Sicht relativ sicher das sich die gesamte Branche zu dem von AMD eingeschlagenen Weg bewegen wird. Die hohe Kunst des CPU Designs sind nämlich die Big Dies von Intel auch nicht. Sie sind in erster Linie die hohe Kunst der Fertigung und die wird in den kommenden Jahren ein Problem werden.

Epyc ist die erste inkarnation des Chiplet Designs. Der nächste Schritt (für den hat AMD gerade einige Patente eingereicht) wird der Chiplet Ansatz auf einem aktiven Interposer. Das ist dann quasi Intels Mesh auf einem aktiven Network Interposer.

https://spectrum.ieee.org/tech-talk...iplet-revolution-with-new-chip-network-scheme

Ich halte den Ansatz für sehr vielversprechend und auch bei Intel werden wir so etwas bald sehen.

Man muss sich doch nurmal in anderen Industrien umschauen. Mir fällt kein einziges Beispiel ein, in dem sich eine modulare Bauweise auf lange sich nicht durchgesetzt hat, einfach weil das enorme Kosten- und Fertigungsvorteile hat.

Klar wäre eine Waschmaschine mit integrierter Kaffemühle geil - für eine handvoll Leute. Und selbst Waschmaschinen mit Trocknerfunktion haben sich nie durchgesetzt. Das es sie nicht gibt liegt aber nicht daran das kein Waschmaschinenhersteller es drauf hat/zu faul ist wie du es sagst. Es gibt genau einen Grund warum es ein solches Multifunktionsgerät nicht auf dem Markt gibt.....
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Herr Melone, s0UL1, valnar77 und 2 andere
Zurück
Oben