Ein bisschen enttäuschend ist die Performance schon.
Womöglich zeigt sich langsam das hässliche Gesicht der Intel Entwicklungsdirektive, dass nur Features in die Architektur eingebaut werden, wo 1% mehr Chipfläche gleich 2% mehr Performance bringt. Sofern die Legende stimmt...
Am Front-End ist nicht mehr viel zu machen. Mit Sandy Bridge und Haswell hat man hier bereits soweit zu Tode optimiert (Loop Caches, Branch Prediction), dass die Cache-Miss-Rate schon relativ gering sein dürfte.
Im Back-End hat man in den letzten Generation mal hier und da einen Execution Port drangeschustert aber irgendwann ist hier auch die Sinnhaftigkeit in Frage gestellt, wenn das ILP und eine Vergrößerung der OoO-Pipeline nicht mehr den gewünschten Fortschritt bringt. Dann geht es nur noch über neue und breitere Vektor-Einheiten, wo aber auch die Software entsprechend mitspielen muss.
In der Cache-Hierarchie an sich sonst nicht viel getan. 32 KB L1D/L1I, 256 KB L2 dedicated pro Core und 2-2,5 MB Shared LLC pro Core. Es ist anzunehmen, dass eine Vergrößerung von L2 + LLC nochmal einen Performance-Schub bringen wird. Das hilft aber am Ende auch wenig, wenn 10% mehr Chipfläche am Ende aber nur 5% mehr Performance bringen.
Das freut zwar den Anwender, wirtschaftlich ist aber was anderes.
Was bleibt sonst noch?
Eigentlich hätte ich ja erwartet, dass Intel irgendwann mal das SMT auf vier Threads (oder sogar acht) aufbohrt. Angesichts der miesen Skalierung im Desktop-Bereich auf mehr Threads, würde das aber allenfalls in theoretischen Benchmarks oder nur wenigen Applikationen etwas bringen. Vielleicht ist es ja irgendwann bei der Server-Ablegern soweit (Xeon Phi hat ja schon 4-way SMT)
Taktfrequenz steigern würde weitgehend lineare Performancezuwächse erzeugen, jedoch setzen einem die Materialien gewisse Grenzen. Und 300 Watt TDP lässt sich heuer eher schlecht verkaufen. (außer bei GPUs, da geht das komischerweise noch immer weiter nach oben)
Sieht also eher schlecht aus.
Das Problem hat aber nicht nur Intel, sondern alle anderen auch.
IBM hat noch den Vorteil, dass man dort weitestgehend machen kann, was man gerade will, da man mit System-i und System-z ein relativ abgeschottetes Ökosystem pflegt. Die System-p-Series konkurriert zwar (auch durchaus erfolgreich) mit den größeren x86-Boliden, aber auch dort herrschen etwas andere Gesetze, als im klassischen x86-Markt.
Und AMD muss nächsten Jahr erst einmal beweisen, dass sie mit Zen einen heiligen Gral gefunden haben.