naja die erklärung auf deinem link hört sich zwar für das Beispiel autobahn gut an aber irgendwie glaub ich nicht dass des bei ner cpu so ist (eine doppelt so große Autobahn entspräche mehr einem höhrem FSB oder Speicherbandbreite):
das stammt aus Wikipedia:
Nachteil – Speicherverbrauch
Alle Adresswerte sind 64 Bit statt 32 Bit breit, ihre Speicherung verbraucht daher doppelt soviel Platz, bei Bewegungen zwischen RAM und CPU müssen somit doppelt so viele Bytes bewegt werden, und sie verbrauchen auch in den Caches doppelt soviel Platz. Auch manche andere Objekte werden bei der Neuübersetzung von herkömmlichem x86-Code von 32 Bit auf 64 Bit im x86-64-Modell erweitert. Sichtbar wird dieses in den erzeugten Programmdateien, die in der Regel 25 bis 30 Prozent größer sind. Dies kann die Ausführungsgeschwindigkeit der Programme spürbar herabsetzen.
Neutral – Gleitkommaoperation
Die SSE-Einheit übernimmt den weitaus größten Teil der Berechnungen für Multimedia und Mathematik, sowohl für Gleitkommawerte als auch für ganzzahlige gepackte Zahlen mit mehreren Werten, darunter vor allem Vektoren und Matrizen. Die Erweiterung der ALU-Register auf 64 Bit tangiert diese Einheit gar nicht, da die SSE-Register schon immer 128 Bit breit waren, so dass SSE-Berechnungen unverändert ablaufen. Die nachfolgend genannte Verdoppelung der Registerzahl betrifft jedoch auch die SSE-Mediaregister.
Vorteil - mehr Speicher pro Prozess
Die Grenze von 2 (bzw. 4) GiB adressierbarem Hauptspeicher pro Prozess von der klassischen i386-Architektur entfällt.
Vorteil – Registeranzahl
Unabhängig von der 64-Bit-Aufweitung weist die AMD64 eine doppelte Zahl an allgemeinen Registern auf. Das ist vorteilhaft bei vielen Zwischenwerten in einer Prozedur, die nicht mehr zeitweise auf den Aufrufstapel im Hauptspeicher ausgelagert werden müssen. Da die althergebrachten acht Register schon immer knapp waren, setzt man hier 25 bis 30 Prozent[2] Geschwindigkeitsvorteil bei 64-Bit-Programmen an. Zusätzlich wird die Verwendung von Registern zur Übergabe von Parametern an Unterprogramme ermöglicht, so dass komplexe Berechnungen mit vielen Hilfsfunktionen hier weniger ausgebremst werden als bei der Parameterübergabe über den Stapel.
Vorteil – Adressbreite
Wenn Datenmengen im Gigabyte-Bereich verarbeitet werden, entfallen aufwändige Zugriffsberechnungen mit 32-Bit-Differenzen zu Basisadressen. Insbesondere beherrschen alle Betriebssysteme das Einblenden von Dateien auf der Festplatte in den Hauptspeicher (virtual file mapping) – statt stückweiser Abarbeitung kann nun faktisch die gesamte Festplatte für den Direktzugriff in einem Stück eingeblendet werden. Hilfsfunktionen mit Dateizeigern entfallen komplett und degenerieren zu einfachen ALU-Operationen.
Vorteil – Integerarithmetik
Anwendungen, die auf Integerarithmetik angewiesen sind, profitieren sehr davon, dass Multiplikationen mit ganzen Zahlen größer als 32 Bit erheblich schneller verarbeitet werden. Dies trifft zum Beispiel auf Kryptographie und Audio- beziehungsweise Videoencoding zu.
das was in deinem text als vorteil gewertet wird ist wohl eher ein Nachteil (1. Punkt) und die Vorteile bringen nur in Spezialfällen was, aber garantiert nie 100 % mehrleistung.