@Piktogramm
Dass Sättigungseffekte bei diesen CPU eintreten ist klar, auch wird es immer einen kritischen Flaschenhals geben - aber darauf wollte ich ja hinaus. Bei Intel war es verglichen mit Epyc 1 zB immer so dass die große Homogenität und Gleichbehandlung aller Kerne in diversen Szenarien ein Vorteil war. AMD hat das überarbeitet und diese massive IO die implementiert. Diese muss wie du richtig sagst in der Lage sein alle 64 Kerne und 128 Threads zu füttern.
Für die klassischen Server im Web Umfeld, Storage, Virtualisierung usw hat man aber immer ein gewisses Clusters an Zusammengehörigkeit in den Aufgaben, zB eine VM mit 4 Kernen. Da kommt Epyc dann voll auf seine Kosten da sein Design mit teils längeren Latenzen nicht zum Tragen kommt, im Gegenteil, innerhalb dieses Clusters im CCX, demnächst also bis 16Threads, hat man kleinere Latenzen als Intel.
Wenn man aktuell natürlich wie in Supercomputer viele 1000 Threads auslasten will, dann braucht es ohnehin ein sehr spezialisiertes Konzept dass die Arbeit auf die Nodes verteilt.
Ka was die Grenze ist die man aktuell sinnvoll in einer CPU anbinden kann. Im Prinzip steht AMD bei 64 aber machen wir uns nichts vor, an dieselbe IO die wird man bald schon statt 2x 4er CCX 2x 8er hängen (Zen 3), also 128 Kerne.
Intels Mesh hat sich bei solchen Zahlen noch nicht beweisen müssen, nicht Mal bei den Knights Karten, ich meine da kam das Mesh erstmalig zum Einsatz?
Das stacken der Die sollte beim Mesh aber auch voll durchschlagen und Wege kurz halten. Intel steht bei glaube ich 38 Kernen beim IceLake SP, im Mesh. Wann das Mesh gesättigt ist ist schwer zu sagen, ich denke 3D stehen mehr Wege zum Ram zur Verfügung die der Kern nutzen kann. Natürlich muss die generelle Speicheranbindung gut genug sein um die Kerne zu versorgen.
https://www.alcf.anl.gov/files/HC27.25.710-Knights-Landing-Sodani-Intel.pdf
Interessanterweise macht Intel hier auch Numa Nodes bei Qadranten, oder zb Layern wenn mal gestacked wird - eben dass wie bei AMD im CCX die zugehörigen Aufgaben in einem Quadrant landen.
Edit. Die kleinen Kerne haben mittlerweile ja auch 90% des Featureset der großen, sind aber wesentlich kleiner. Dazu gehört recht hohe IPC, SMT, vermutlich sogar AVX.