@pp: die in den Spielen höhere Rechenleistung dürfte wohl aus der Kombination zweier Merkmale resultieren:
2 FPUs beim P-M (der PII/III hatte 2, von daher postuliere ich selbiges mal für den M
) - damit schon mal doppelte FP-Leistung bei gleichem Takt, für Spiele nicht unwichtig
+
Kürzere Pipe: bei chaotischen Rechenszenarien wie Spielen kommt es häufig vor, daß die folgende Operation das Ergebnis des Vorgängers benötigt. Es muß also gewartet werden, bis der Wert vorliegt: das dauert zB beim PIII nur 10 Takte, beim Prescott 31!
Da kann bei letzterem selbst Branch Prediction (welche Berechnungen liegen denn noch an und können in der Wartezeit berechnet werden?) und HT nicht mehr so viel rausholen, zumal ersteres auch der P-M hat...
EDIT: dazu kommt dann noch der Fall, daß ein oller Interrupt bei der CPU anklopft und sofort den Oberbefehl haben will. Die längere Pipe beim Prescott muß dann erstmal gecached werden. Zumal auch hier das Handicap der wenigen ALUs(2) und FPU (Plural gibts ja nicht
) zuschlägt...
---
Ich möchte nochmal bemerken, daß der Transistoren pro Fläche-Count beim P-M für den Fertigungsprozeß ziemlich groß ist. Da kommt ja nicht mal AMD ran (Dothan: 140Mio auf 84. Winchester: 68Mio auf 84). Irgendwas muß da noch im Busc...ähh...Silizium sein....
---
Der Test ist ansonsten mal wieder jenseits von Gut und Böse...
---
EDIT² für PP
Jeder Spannungspuls braucht seine Zeit, bis er einen Transistor "durchquert" hat". Also Spannung geht am Eingang auf HIGH, dann dauerts eine Zeit, dann ist auch die Spannung am Ausgang entsprechend der Schaltung dazwischen. Je größer diese ist (=je komplexer der einzelne Pipeschritt), desto länger dauert das. Ist dann aber blöd, wenn der Spannungspuls durch zu hohe Taktrate zu kurz ist
.
Laufzeit ist das Stichwort.
Wenige komplexe Pipes: lange Schaltzeiten, weniger Takt.
Viele einfache Pipes: kurze Schaltzeiten, mehr Takt.