So als Fazit
Kann man sagen das r7 1700(x) und 1800x nach dem OS sheduler patch
ein quasi numa node dual socket server chip ist.
Somit sind alle Daten die in einen ccx sind nicht direkt teilbar mit dem anderen ccx
So gesehen können serielle programe nur auf 4 Kerne mit smt zugreifen aber windows kann den ccx komplett vom OS hinetrgrundlast befreien was dan die r7 cpu quasi gleich schnell macht wie ein ci7 7700k bei 5ghz
Aber schneller wird dieser nicht.
Warum ist das so
mein verdacht ist das die infinity fab ursprünglich ramtakt mal 128bit zwischen den ccx verbunden ist bzw geplant war
nur hatte man den NB controller ein Problem das die dual channel nicht parallel Daten in den L3 laden kann sondern nur je ccx 64bit
Das reduziert gewaltig die gb/s zwischen den ccx gedacht waren cpu takt ~3,6ghz = 128bit =460gb/s
dann machte der NB controller noch probleme weil dieser nicht den theoretischen ramtakt (ddr4 3600) mit macht sondern nur den realen
1800mhz
ergibt 115.2gb/s
das wäre das Optimum derzeit
Der L3 macht aber 450gb/s somit muss bei ccx L3 share 4 takte warten
Aktuell ist es aber so das das maximal 1333mhz nur gehen also maximal 85,3gb/s
also wartet ein ccx auf 5 Takte
ein takt ist 11,1ns
Die latenzen vom Ram sind indemfall relativ egal außer windows veranlasst den ram als victim Speicher zu nutzen
was bei Latenze ab 70ns im L3 auch egal wäre
Lösung ist derzeit den ramtakt zu erhöhen und auf min ddr4 3200 zukommen (102,4gb/s) was nur 4 takte und 44,4ns bedeuten würde.
ich glaube erst bei zen+ wird amd den bus zwischen den ccx erhöhen können
auf 128bit und somit die latenz auf 2 takte reduziert.
Also was tun
Warten auf OS patch was die cpu als numa node 2 mal quadcore behandelt
Anwendungspatches sind nicht nötig
bios patches was den ramtakt erhöht
was nicht möglich ist bei einen numa node Annahme des OS mehr als 4 Kerne bei serielle Programmen werden nicht gehen sondern nur quad mit smt.
Somit sind intels x99 (x299) hexa octa überlegen in seriellen Anwendungen. teils unterlegen bei linearen Anwendungen.(besseres smt)
das wird die server marke von intel (xeon) empfindlich treffen
ich glaube nicht daran das amd die CPu für home Nutzer entwickelt hat sonder dies ist eine reiner server chip design.
Nur hat amd die NB bit Anbindung einen Fehler drin.
Dies wird es bei zen+gefixt. bis dahin sind die octas von amd als Gegner für den ci7 so1151 anzusehen
Und ein kleiner seitenhieb Richtung workstation xeon
also hat man wohl etwas verkackt beim marketing, wie üblich bei AMD
Sind also die CPu schlecht fürs gaming, nein sind sie nicht aber der Durchbruch das intel hexa und octa billiger werden wird nicht passieren.
Schade und das alles nur weil man einen Fehler in der wichtigsten Verbindung bei einen solchen design hat.
Was wäre die Lösung falls das per design nicht zu lösen ist.
ccx modul mit 6 oder mehr Kernen
mit der brechstange den ramtakt erhöhen. ob ddr4 7200 machbar sind?