A
Anonymous
Gast
"Die Opteron SSE 128bit SIMD Befehle sind somit 30 Prozent langsamer als die MMX 64bit SMD Befehle des Athlon XP?"
Der Athlon XP hat auch die 128 bit SSE Register.
Nur wird halt bei Opteron SSE2 verwendet und beim Athlon XP halt verstaendlicherweise nur SSE(1).
Der Hauptunterschied SSE(1)SSE2 ist eigentlich nur das SSE(1) 4x32bit Gleichkommazahlen in so ein 128bit Register verarbeiten kann und SSE2 2x64bit Gleichkommazahlen.
@Bokill
An der Kompetenz deiner Komentare kann man allerdings auch zweifeln.
Denn dein Beispiel mit dem ignorieren der SSE1 Befehlen kommt hier wohl kaum zum tragen, da ja wohl verschiedene Programme von verschiedenen Hersteller mit Performance Problemen bei aktivierten SSE2 zu kaempfen haben.
Und genutzt wird es ... da TMPGEnc die SSE2 Optionen nur freischaltet wenn der CPUID Befehl es mit auf der Featureliste hat.
Die Sache mit dem Optimierungen auf eine bestimmte Architektur (z.b P4) ... welcher AMD Compiler soll das denn bitte fuer Hammerprozessoren machen ?!
Abgesehen davon das ein grosser Teil der Programme wohl immernoch auf Pentium 1/Pro Architektur optimiert ist, schliesslich muessen die Programme auch auf allen moeglichen CPU-Typen laufen.
Lediglich solche Extensions wie MMX, 3DNow und SSE werden verwendet.
Es sei den man hat Linux/BSD und Kompiliert die Programme fuer einen bestimmten CPU-Typ ... was aber bei Windows wohl kaum gegeben ist.
Und das der Athlon XP 2600+ den Opteron 1.6 Ghz in den hier gezeigten Benchmarks (Sandro und TMPGEnc) fertig macht ... das ist traurig nicht merkwuerdig und beruht wohl auf der langsamen SSE2 Umsetzung.
Der Athlon XP hat auch die 128 bit SSE Register.
Nur wird halt bei Opteron SSE2 verwendet und beim Athlon XP halt verstaendlicherweise nur SSE(1).
Der Hauptunterschied SSE(1)SSE2 ist eigentlich nur das SSE(1) 4x32bit Gleichkommazahlen in so ein 128bit Register verarbeiten kann und SSE2 2x64bit Gleichkommazahlen.
@Bokill
An der Kompetenz deiner Komentare kann man allerdings auch zweifeln.
Denn dein Beispiel mit dem ignorieren der SSE1 Befehlen kommt hier wohl kaum zum tragen, da ja wohl verschiedene Programme von verschiedenen Hersteller mit Performance Problemen bei aktivierten SSE2 zu kaempfen haben.
Und genutzt wird es ... da TMPGEnc die SSE2 Optionen nur freischaltet wenn der CPUID Befehl es mit auf der Featureliste hat.
Die Sache mit dem Optimierungen auf eine bestimmte Architektur (z.b P4) ... welcher AMD Compiler soll das denn bitte fuer Hammerprozessoren machen ?!
Abgesehen davon das ein grosser Teil der Programme wohl immernoch auf Pentium 1/Pro Architektur optimiert ist, schliesslich muessen die Programme auch auf allen moeglichen CPU-Typen laufen.
Lediglich solche Extensions wie MMX, 3DNow und SSE werden verwendet.
Es sei den man hat Linux/BSD und Kompiliert die Programme fuer einen bestimmten CPU-Typ ... was aber bei Windows wohl kaum gegeben ist.
Und das der Athlon XP 2600+ den Opteron 1.6 Ghz in den hier gezeigten Benchmarks (Sandro und TMPGEnc) fertig macht ... das ist traurig nicht merkwuerdig und beruht wohl auf der langsamen SSE2 Umsetzung.