Test AMD Athlon 64 3400+ im Test: Jetzt mit 2,2 GHz Realtakt

Solange die Pipe gefüllt ist, solange geht die Rechnung der längeren Pipe auf. Denn je mehr takt bedeutet, dass es schneller abgearbeitet werden kann. Es ist nicht so, dass AMD immer 17Stufen braucht, um eine Aufgabe zu bewältigen, und intel immer 30! Solange die Pipe gefüllt ist, solange ist Intel besser, auf Grund des höheren Taktes. Solange Intel eine exakte Sprungvorhersage geben kann, solange ist intel schneller, dank, oh mein gott, des höheren Taktes. Erst, wo die Sprungvorhersage nicht zu trifft und das trifft oft in Spielen auf, verliert der Intel. Die CPU kann die Sprungvorhersage nicht optimal treffen. Damit muss erstmal die ganze pipe geleert werden, welches zeit kostet. Mit der Erhöhung des Caches aber, hat man die Sprungvorhersage verbessert. Genau aus diesem Grund ist angeblich der Prescot im selben takt, gleich so schnell wie der P4C,
 
Na als Verbesserung kann man das aber auch nicht verkaufen, wenn eine neue CPU erstmal vor allem durch gesunkene proMhz Leistung auffällt.
Diese Übung machen sie doch nur für möglichst hohe Taktraten, und wenn er die mal hat geht diese Rechnung sicher auch auf und der P4 wird deutlich übertroffen.
Aber genau an den deutlich höheren Taktraten fehlt es halt erstmal deutlich eine ganze Weile.
Diesen "proMhz-Schwächling" als 3, 3.2 oder 3.4, wer braucht den sowas.
 
BodyLove schrieb:
Solange die Pipe gefüllt ist, solange geht die Rechnung der längeren Pipe auf. Denn je mehr takt bedeutet, dass es schneller abgearbeitet werden kann. Es ist nicht so, dass AMD immer 17Stufen braucht, um eine Aufgabe zu bewältigen, und intel immer 30! Solange die Pipe gefüllt ist, solange ist Intel besser, auf Grund des höheren Taktes. Solange Intel eine exakte Sprungvorhersage geben kann, solange ist intel schneller, dank, oh mein gott, des höheren Taktes. Erst, wo die Sprungvorhersage nicht zu trifft und das trifft oft in Spielen auf, verliert der Intel. Die CPU kann die Sprungvorhersage nicht optimal treffen. Damit muss erstmal die ganze pipe geleert werden, welches zeit kostet. Mit der Erhöhung des Caches aber, hat man die Sprungvorhersage verbessert. Genau aus diesem Grund ist angeblich der Prescot im selben takt, gleich so schnell wie der P4C,


mit ner größeren pipe erhöht sich die fehler qoute und mit jedem fehler wird die pipe neu geladen... darum längere pipe = langsamer.

sieht man auch prima bei anwendungen wos nicht auf bandbreite oder cache ankommt, da zersägt nen alter 3200+ barton nen 3200+ A64 mal eben ganz locker, grund: A64 hat ne längere pipe bekommen.

darum kannste das total knicken, und im vergleich zum barton --> A64 ist die pipe beim NW --> prescott wesentlich mehr verlängert worden.
icon13.gif
 
@bodylove
genau so ist es. ein zentrales problem sind abhängige berechnungen wie z.b. bedingte sprünge, wie sie durch einfache "if" anweisungen entstehen. aber auch berechnungen wo das ergebnis gleich in der nächsten rechnung benötig wird führt zu sogenannten "stalls" in der pipe, so dass einfach wartetakte in die pipe eingeschoben werden müssen. durch eine längere pipe erhöht sich die wahrscheinlichkeit von stalls.
es ist aber sehr wohl möglich auch bei langen pipes stalls zu vermeiden. allerdings kann man beim p4 den eindruck gewinnen, dass diese mechanismens serh ineffizient eingesetzt wurden. ich möchte nur nochmal drauf hinweisen dass das nicht unbedingt was mit der langen pipe zu tun hat, sondern mit der prozessorarchitetktur allgemein.
ein mechanismus war z.b. die "ht"-technologie, bei der 2 unabhängige berechnungen "quasi parallel" ablaufen, und so abhängige berechnungen vermieden werden können.
 
XTR³M³ schrieb:
mit ner größeren pipe erhöht sich die fehler qoute und mit jedem fehler wird die pipe neu geladen... darum längere pipe = langsamer.

Das stimmt teilweise, da in Bezug auf den Prescott, diese Fehlerquote gemindert wird, da man den Cache erhöht hat. Zum einen Bekommt er eine bessere Pro/Mhz leistung, zum anderen wird dies ihm wieder weggenommen, da man vor hat, mit der Architektur mehr Takt rauszuholen.

sieht man auch prima bei anwendungen wos nicht auf bandbreite oder cache ankommt, da zersägt nen alter 3200+ barton nen 3200+ A64 mal eben ganz locker, grund: A64 hat ne längere pipe bekommen.
Nein, wenn mal ein Athlon 3200+ schneller sein soll, als der a64 3200+, dann liegt es nicht daran, dass die Pipes länger geworden sind, (ich glaube um 7 stufen), sondern einfach daran, dass der Athlon 3200+ mit 200Mhz schneller getaktet wird.

darum kannste das total knicken, und im vergleich zum barton --> A64 ist die pipe beim NW --> prescott wesentlich mehr verlängert worden.

Das kann man so auch nicht sagen. Der A64 hat zwar mehr Stufen bekommen, aber dieser ist anders aufgebaut, als wir uns das vorstellen. DIe stufen wurden nicht erhöht, um primär mehr takt zu erreichen, sondern die schon vorhandene gute Pro/Mhz Leistung zu optimieren. Wieso sonst ist ein A64 3000+schneller als ein Athlon 3200+? Gleicher 2level cache, und sogar 200Mhz weniger.



@greenmamba

Full ACK.
 
BodyLove schrieb:
Das stimmt teilweise, da in Bezug auf den Prescott, diese Fehlerquote gemindert wird, da man den Cache erhöht hat.

danke bodylove! :)
den zusammenhang von sprungvorhersage und cache-größe sehe ich (noch) nicht. sprucngvorhersagemechanismen arbeiten nicht auf dem cache, sondern auf registern. der cache hat aus der prozessorsicht die rolle des arbeitsspeichers. der cache ist ja völlig transparent, und der prozessor (alu/fpu...) hat eigentlich keinen einfluss drauf. :confused_alt:
 
ich hatte mal gelesen, dass man mit hohem Cache die Wahrscheinlichkeit erhöht, eine richtige Sprungvorhersage zu treffen. Leider finde ich den text nicht mehr. Ich werde es aber nachliefern.:mad:

Aber hoffe du gibst mir recht, wenn ich sage, dass mit dem höheren Cache und dem MUL-Einheit für Integer, die Pro/Mhz leistung steigt, aber dank der längeren Pipe, in einigen Anwenundungen die Pro/mhz dadurch gesenkt wird. Auch müssen wir bedingte Sprünge von unbedingten Unterscheiden. Unbedingte Sprünge kann man immer perfekt vorhersagen. Deswegen ist der P4 auch in Multimediaanwendungen schneller, weil man die Sprungvorhersage, dank der vielen If anwendungen, besser vorhersagen kann, als in Spielen. Erst wenn die pipe gefüllt bleibt, kann man vom höheren Takt profitieren.
 
ja, wir sind uns in fast allen punkten einig! :)
if-anweisungen haben immer bedingte sprünge zur folge. unbedingte sprünge entstehen durch normale prozeduraufrufe (funktion-calls), und werden nicht vorhergesagt, weil sie schon zur compilezeit feststehen. diese art von sprüngen sind kein problem beim pipelining, dafür aber beim debuggen. (das ist aber ein anderes thema, welches aber auch einfluss auf das prozessordesign hat!)

BodyLove schrieb:
Aber hoffe du gibst mir recht, wenn ich sage, dass mit dem höheren Cache und dem MUL-Einheit für Integer, die Pro/Mhz leistung steigt, aber dank der längeren Pipe, in einigen Anwenundungen die Pro/mhz dadurch gesenkt wird.

Durch einen größeren Cache steigt natürlich auch bis zu einem gewissen Maße die "pro/MHZ" leistung, weil etwas seltener auf ram-zugriffe gewartet werden muss. latenz cache/ram ist größer als 1/10! Da geb ich dir vollkommen recht! :)

MUL-Einheit= Multiplizierer/Dividierer??

ps: über 95% der speicherzugriffe werden bereits durch den cache befriedigt! :)
 
BodyLove schrieb:
Wieso sonst ist ein A64 3000+schneller als ein Athlon 3200+? Gleicher 2level cache, und sogar 200Mhz weniger.


weil er bessere latenzen hat und davon profitieren athlons ungemein, intel dagegen sind die latenzen ladde, die brauchen nur bandbreite.
 
Green Mamba schrieb:
MUL-Einheit= Multiplizierer/Dividierer??

Soweit ich weiss, ist die MUL-Einheit für Integer etwas, welches auf darauf optimierten Befehlen latenzen senken soll. Ergo eine zusätzliche Befehlseinheit. Somit steigt die Pro/Mhz Leistung.:)

Ausserdem soll die CPU "intelligenter" geworden sein.Sie kann anscheinend besser voraussagen, wann ein sprung entsteht und wann nicht.
 
achso, war jetzt das erste mal dass ich von dieser abkürzung höre (mul). weiß auch nicht so wirklich was sich dahinter verbirgt. google und mein rechnerarchitektur-buch konnten mir auch nix weiter dazu sagen. :(

das thema branch-prediction ist nach wie vor ein wichtiges forschungs-thema, und demnach noch lange nicht an den grenzen dessen was möglich ist angelangt. bereits die ganz einfachen mechanismen zur sprungvorhersage sind derart abartig abgefahren kompliziert... :rolleyes:
aber noch längst nicht am ende der fahnenstange! :)
 
ja. Eigentlich muss beim Branch Prediction das befehl schon einmal durchlaufen sein. bzw. es werden bei machen sogar mehrere durchlaufene bedingte Sprünge vorrausgesetzt, um überhaupt eine Vorhersage zu treffen. Nun gibt es eine Formen von B-P, welches sogar, wie schon erwähnt, mehr als nur 1-Durchlauf brauchen, um etwas vorherzusehen. Bei diesen ist die Vorherssage aber sehr gut. Andere wiederrum brauchen "nur" einen durchlauf, um eine Voraussage zu treffen. Diese sind aber mit schlechten Vorhersageraten gebunden.

Wichtig ist "einfach" ein perfektes optimum zu finden. Das gelang anscheinend keinem der Großen Hersteller. ;)
 
planet3dnow! spricht es ganz klar aus:

"Beim Zugriff auf den Arbeitsspeicher zeigen sich die Vorzüge des integrierten Memory-Controllers des Athlon 64 am deutlichsten! Während der nForce2 Chipsatz unter den Sockel A Chipsätzen bisher als Produkt mit einem konkurrenzlos guten Speicher-Controller galt, wirken die beiden Athlon XP Systeme im direkten Vergleich mit den neuen Athlon 64 CPU wie Relikte aus einer längst vergangenen Epoche! Bis zu drei mal so viel Zeit lassen sich die Sockel A Boards beim Zugriff auf den Speicher! Interessant auch, daß der Athlon 64 aufgrund seines schnelleren unbuffered Speichers noch einmal kürzere Zugriffszeiten zustande bringt, als der Athlon 64 FX, dem hier auch sein Dual-Channel Controller nicht hilft. Registered Speicher kostet Leistung!


siehe hier, (diagramm latenzen arbeitsspeicherzugriff unten auf der seite):

http://www.planet3dnow.de/artikel/hardware/a64/17.shtml

so deutlich kann man es also auch aussprechen.

------------------------------------------------------

und noch am rande:

"Eine interessante Erfahrung mußten wir bei SETI@Home machen. Galt der SETI-Client bisher als äußerst speicherlastig, so scheint nun beim Athlon 64 in der Tat eine Sättigung der Rechenkapazität der FPU-Unit eingetreten zu sein. Der Client quittiert mehr Speicher-Performance beim Athlon 64 kaum noch mit kürzerer Rechenzeit. Der Speicher-Controller des Athlon 64 kann bei SETI@Home also mehr Daten anliefern, als der Core verarbeiten kann. Das sind wir von herkömmlichen Systemen anders gewohnt!"
 
Zuletzt bearbeitet:
perfekt!57 schrieb:
planet3dnow! spricht es ganz klar aus:

"Beim Zugriff auf den Arbeitsspeicher zeigen sich die Vorzüge des integrierten Memory-Controllers des Athlon 64 am deutlichsten! Während der nForce2 Chipsatz unter den Sockel A Chipsätzen bisher als Produkt mit einem konkurrenzlos guten Speicher-Controller galt, wirken die beiden Athlon XP Systeme im direkten Vergleich mit den neuen Athlon 64 CPU wie Relikte aus einer längst vergangenen Epoche! Bis zu drei mal so viel Zeit lassen sich die Sockel A Boards beim Zugriff auf den Speicher! Interessant auch, daß der Athlon 64 aufgrund seines schnelleren unbuffered Speichers noch einmal kürzere Zugriffszeiten zustande bringt, als der Athlon 64 FX, dem hier auch sein Dual-Channel Controller nicht hilft. Registered Speicher kostet Leistung!


siehe hier, (diagramm latenzen arbeitsspeicherzugriff unten auf der seite):



http://www.planet3dnow.de/artikel/hardware/a64/17.shtml

so deutlich kann man es also auch aussprechen.

Ja, dass ist aber schon mit dem "alten" A64 gegeben gewesen. Ich will wissen, wieviel besser die Latenzen im Vergleich, alter A64 neuer A64 geworden ist. Es ist klar, dass die Speicherzugriffe zum Axp gesenkt wurden, da der Speichercontroller nicht in der northbridge sitzt.:)

planet3dnow sagt imho hier nichts neues.
 
Trainer schrieb:
hmm also zu diesem ganzen INTEL gegen AMD getue und gemache kann ich nur eines sagen!
ich habe jahrelang nur amd besessen und war auch nie enttäuscht von denen was die leistung usw angeht. vorallem nicht bezüglich des preis/leistungs verhältnisses....

jetzt habe ich mir vo kurzem nen INTEL zugelgt und kann nur sagen das ich den um nix mehr gegen nen AMD tauschen würde. alleine schon wenn man mal von der lautstärke her die sache betrachtet. mein intel system schnurrt leise wie ein kleines kätzchen (p4 3 ghz). der alte amd(xp1800+) hingegen hörte sich an wien kraftwerk. ein lüfter nach dem andrem im tower drin nur damit das ding bloss nit zu heiss wird. und intel hat mal locker die doppelte taktrate und weniger als die hälfte an lautstärke. zudem kommt die souveränität. niemals absturz oder sonstiges.... naja ist meine meinung

man betrachte amd!!! die kommen jetzt gerade mal mit ihrem 64bit kram da (den eh kein mensch braucht) so grade mal die leistung des p4 ran den es ja schon seit über einem jahr in dieser architektur gibt...echt lächerlich
und dann steckt der 64er auch noch in den kinderschuhen vorallem was die boards usw. angeht...NEIN DANKE

1. mein 2. AMD(2100+ lukü) wenn ich will ist super leiste wenn ich alle lüfter auf 5V stelle --> unhörbar dank papst power. und dann ist er immernoch kühlgenug um ihn auf 2GHz zutakten bei 200*10 @ 1.60V

2. hatte ich nochnie abstürze ausser wenn ich es beim clocken übertreiben habe... und das in über *grübel* 6 jahren nur mit AMD :cool_alt:

3. amd komtm also grade eben an intel ran..... *bla* danke das du dein n00b sein hiermit bestätigt hast.

AMD hat die derzeit schnellsten CPU's und intel hinkt hinterher. und nur nebenbei: der A64 sollte schon vorletztes jahr(2002) kommen, aber durch produktions schwierigkeiten has halt nen jahr länger gedauert... intel ist da janicht besser.

und in den kinderschuhen steckt der A64 nicht, die boards im übrigen auchnicht.

die sind nämlich alle saustabil und verdammt fix. ndas einzige manko ist das alle chipsätze ausser SIS kein fixen PCI haben, nforce 3 hat dafür nen fixen AGP und alle 33MHZ grundtakt einen teiler parat. langt also.

nia hingegen hat zwar keine teiler aber dafür haben die onboard mäßig alles was geht.


kurz: du nix ahnung darum lieber still und erstmal einwenig wissen aneignen bevor du loslaberst :o
 
Zurück
Oben