Matzegr
Commander
- Registriert
- Jan. 2011
- Beiträge
- 2.628
Elkinator schrieb:die FPU war bei bulldozer selbst bei der ersten generation nie das problem, auch wenn das viele "experten" behaupten.
die wird kaum ausgelastet und es hat im normalfall eh jeder kern seine eigene FPU, 256bit AVX code ist ja noch reletiv selten.
Die FPU bei der K15-Architektur hat in bestimmten Bereichen (FADD und FMUL) Nachteile gegenüber der K10-Architektur bei Multithread-Anwendungen.
Bei K10 stehen nach dem FP-Scheduler 2 Pipes pro Thread zur Verfügung (1xFADD+1xFMUL). Bei K15 kommt nach dem Scheduler eine FMAC pro Integer-Kern (1xFADD+1xFMUL kombiniert). Während (bei Auslastung aller Threads) ein Thread beim Llano also 1xFADD und 1xFMUL abarbeiten kann, kann ein Thread bei Trinity/Richland nur 1xFADD oder 1xFMUL abarbeiten, somit sind die 4 Threads beim AMD A8-3870K im Vorteil da 8 Pipes (4xFADD + 4xFMUL) gegen 4 FMACs beim 2 Modul-Trinity/Richland stehen sofern die Software kein FMA nutzt.
Das sieht man wunderschön beim FPU-lastigen Cinebench. Während Llano bei Multithread mit 98% gut skaliert sieht es bei Trinity mit 77% bescheiden aus. Bei Single-Thread liegt Trinity 17% vor Llano, bei Multithread zieht der Llano vorbei und liegt nun 8% vorne.