Wie erklärt sich der geringe Performancezuwachs bei Triple-Channel

Trolleule

Cadet 1st Year
Registriert
Nov. 2014
Beiträge
10
Hi,
ich habe viele Beiträge a la Dual-Channel vs. Triple Channel gelesen und scheinbar lohnt sich ein Triple Channel Betrieb aktuell nicht, was auch Tests bestätigen, siehe http://www.tomshardware.de/Core-i7-Nehalem,testberichte-240172-5.html

"Es ist klar zu erkennen das die Performancesteigerung von Dual- auf Tri-Channel gering gegenüber von Single- auf Dual-Channel ausfällt. Grund hierfür könnte sein, dass der Core i7 mit 3,20 GHz noch zu langsam für den Tri-Channel-Mode ist..."


aber ich konnte nirgendwo eine Erklärung dazu finden, wie sich dieser nur geringe Performancezuwachs zu Stande kommt. Scheinbar ist die CPU der limitierende Faktor?? Gerne mit Zahlen :)

Kann mir das bitte jemand erklären?

Und vllt. kann mir noch jemand folgende Frage beantworten:
Viele schreiben, das für einen Gaming PC nicht mehr als 8GB DDR3 RAM lohnenswert sind. Schon klar, dass Videobearbeitung etc. viel und auch mehr Speicher fressen als Spiele, aber woher nehmen diese Leute diese Behauptung? Kann man das irgendwie in Erfahrung bringen oder berechnen?

Danke schon mal
 
Recht einfacher Grund: Von Single auf Dual Channel war es 1:2=> Steigerung um Faktor 2. Von Dual auf Tripple 2:3=> Steigerung um Faktor 1.5.

Und ausserdem wird wohl der Controller auch etwas limitieren.

Für Spiele reichen 8GB, weil die wenigsten Spiele jemals mehr als 4gb Ram für sich beanspruchen. Dann sind 4gb für Windows und Hintergrundprogramme über => mehr als genug
 
So oft hängt man ja auch nicht im RAM-Durchsatz-Limit drin...
 
Danke für die Erklärung.

Das mit den Games habe ich verstanden, aber das mit dem Triple-Channel ist mir noch nicht ganz klar, das mit der Steigerung um Faktor x ist ja lediglich ein mathematisches Gesetz :D

Vllt. frag ich mal anders. Welche Spezifikationen müsste meine Komponente (CPU) haben, damit Triple Channel sich lohnen würde/ die volle Performance erreicht?
 
Der Prozessor hat einen riesigen Cache, der dazu da ist, dass so wenig Daten wie möglich aus dem RAM (oder in das RAM) geschoben werden müssen. Viele Programme laufen komplett im Cache vom Prozessor ab. Was soll da dann das RAM bzw. die Bandbreite vom RAM für Auswirkungen haben?

war10ck_ schrieb:
Für Spiele reichen 8GB, weil die wenigsten Spiele jemals mehr als 4gb Ram für sich beanspruchen. Dann sind 4gb für Windows und Hintergrundprogramme über => mehr als genug

Kommt drauf an, was und wie man etwas spielt.
RAM kann man nie genug haben. Die Geschwindigkeit und die Bandbreite vom RAM kann man eher vernachlässigen. Die Menge bringt immer Punkte.

Ich z.b. brauch manchmal 27GB Systemram beim zocken. (Ist natürlich ein Extrembeispiel)

Trolleule schrieb:
Vllt. frag ich mal anders. Welche Spezifikationen müsste meine Komponente (CPU) haben, damit Triple Channel sich lohnen würde/ die volle Performance erreicht?

Du benutzt Programme im CPU-Limit die nicht in den Cache des Prozessors passen und so viele Daten in/aus dem RAM schieben/holen. Einfach, oder? Dabei wird die Spezifikation vom Prozessor belanglos.

Es ist immer von der Software abhängig was man an Hardware nötig hat. Warum wollt ihr das immer umkehren?
 
Zuletzt bearbeitet:
Danke für die Erklärung HisN. Ich hab mich gestern Abend nochmal eingelesen, aber ich verstehe den ein oder anderen Zusammenhang immer noch nicht. Mir ist an der Stelle nur das WARUM wichtig zu verstehen.

Du schreibst
Code:
Viele Programme laufen komplett im Cache vom Prozessor ab. Was soll da dann das RAM bzw. die Bandbreite vom RAM für Auswirkungen haben?

Wird das bei den Benchmark Tests berücksichtigt oder wieso kommen die Werte so nah an die theoretischen Nennleistungen (max. Bandwidth) der Arbeitsspeicher ran.

z.B. bei diesem Benchmark wurde der Core i7 965 mit 3,2 Ghz (demnach eine QPI Bandbreite von 6,4 GT/s = 25,6 GB/s Datentransfer) und DDR3 1333Mhz im Dual-Channel Modus (vermutlich) verwendet.

Die theoretische max. Bandwidth von DDR3 1333 Mhz beträgt 10,6 GB/s (1333 Mhz * 64 = 10,6 GB/s) und im Dual-Channel Modus 21,2 GB/s, im Tri-Channel 32 GB/s.

Zuerst dachte ich die QPI Bandwidth hat was mit der Limitierung zu tun, aber wie kommt es dann, dass der übertaktete Core i7 965 im Test schlechter abschneidet als der normale??, die QPI Bandbreite steigt ja proportional zur CPU Frequenz an :(


Anhang anzeigen 454905
 
Zuletzt bearbeitet:
Was für ein Benchmark?
 
Ungültige Angabe: Anhang
 
Hier ist der Review.

http://www.tomshardware.de/Core-i7-Nehalem,testberichte-240172-19.html

Hier ein Benchmark vom Review.
005_sandra_mem_int[1].png
 
Das ist ein Bandbreiten-Benchmark. Was hat jetzt die Ram-Bandbreite mit der tatsächlich vorhandenen Leistung zu tun?
 
Der Benchmark zeigt doch die tatsächliche erreichte Bandbreite (Datendurchsatz) an und je höher, desto besser oder?

Da der Speichercontroller in der CPU liegt und somit direkt an den RAM gebunden ist (ich schätze mal QPI ist hier die Schnittstelle zw. CPU und RAM, beim Core i7 965 hätte diese dann eine Bandbreite von 6,4 GT/s = 25,6 GB/s laut Intel Spezifics.) sind für die tatsächliche max. Bandbreite doch nur die CPU und der Speichertakt des RAM (bei DDR3 1333 entspricht der Speichertakt 166 Mhz) ausschlaggebend ggf. ist noch entscheidend in welchem Modus der Speicher arbeitet, denn dadurch verdoppelt oder verdreifacht sich die Bandbreite, richtig?

Im Review wurde für den Core i7 965 folgende Sythetische Bandbreiten gemessen:

Sythetische gemessene Bandbreiten
Prozessor Channel Lesen Schreiben Kopieren Latenz
Core i7 Tri DDR3-1333 15,5 GB/s 13,8 GB/s 19,4 GB/s 34,3 ns
Core i7 Dual DDR3-1333 14,7 GB/s 13,8 GB/s 18,9 GB/s 29,6 ns
Core i7 Single DDR3-1333 10,3 GB/s 10,3 GB/s 14,3 GB/s 28,5 ns

Theoretisch sollte mit Tri-Channel und DDR3 1333 Mhz eine max. Bandbreite von 30GB/s möglich sein, wieso sind es tatsächlich nur 19,4 GB/s und wie kommt es, dass trotz höherer CPU Taktfrequenz beim übertakteten Core i7 965 (= höherer QPI Bandbreite) weniger Datendurchsatz möglich ist als beim normalen 965?

Irgendwo bring ich da glaube ich was durcheinander, wäre schön wenn du/ jemand das mal genauer erklären könnte?!
 
Zuletzt bearbeitet:
Du zäumst das Pferd von der falschen Seite auf. Mehr Bandbreite ist besser?
Naja, wenn Du ein Programm hast, das ausschließlich im Cache vom Prozessor läuft. Wen interessiert dann die Bandbreite vom RAM? Es wird ja nicht benutzt.
Verstehst Du auf was ich hinauswill? Bandbreite ist nur wichtig, wenn man Bandbreite auch braucht. Aber wenn die Prozessor-Hersteller schon wie verrückt daran arbeiten, dass die Bandbreite so wenig wie möglich zum tragen kommt .... dann interessiert sie irgendwann nur noch einen kleinen Kreis Anwender, der Software hat die Bandbreite braucht. Bei Anwendungen wie WinZip und WinRAR ... da kann man Bandbreite gebrauchen, z.b.
Aber das bedeutet nicht das auch Dein Word Bandbreite braucht, oder Deine SMS-App.

Ich kann ja wieder den Auto-Vergleich bringen.
Juhu, die Autobahn hat 6 Spuren. Aber mein Auto braucht nur eine davon. Und jetzt?
 
Danke für die Mühe, ich verstehe was du mir sagen willst, allerdings würde ich das Thema gerne mehr im technischen Sinne betrachten. Ich brauche das Verständnis fürs Studium.

Also ich verstehe, dass mein Komplettsystem diese enormen Bandbreiten nicht nutzen wird, weil einfach die Software nicht dafür ausgerichtet ist solche Bandbreiten zu verwalten, aber wenn wir das Ganze mal technisch, also nur die theoretischen Nennleistungen und tatsächlich möglichen Nennleistungen betrachten, wie würden sich dann die im Review gemessenen Werte erklären bzw. wieso schafft das dort verwendete Testsystem nicht die theoretischen 30GB/s im Tri-Channel Modus sondern nur halb so viel?
 
Trolleule schrieb:
wieso schafft das dort verwendete Testsystem nicht die theoretischen 30GB/s im Tri-Channel Modus sondern nur halb so viel?
Das hätte eventuell in den ersten Beitrag gehört :-)
 
Ja, dafür war der Link vorgesehen :D, aber verständlich, Links werden generell gerne ignoriert. Glaubst du, du kannst das mal technisch erklären?

Das verrückte ist ja, die neuen Haswell CPUs benutzen statt QPI, DMI oder DMI2 mit 5 GT/s (PCI Express 3.0 x16) und kommen gerade mal auf eine max. Bandbreite von 2GB/s. Der Core i7 2700k beispielsweise unterstützt wie der 965 Arbeitsspeicher mit Taktfrquenz 1333 Mhz und kommt trotz geringer Bandbreite des Speichercontrollers (DMI/DMI2) auf die theoretische max. Bandbreite von 21,2 GB/s (Dual Channel Modus), siehe Benchmark.

Du siehst irgendwo ist da noch was unklar. Helf mir mal bitte das Ganze zu sortieren, auf technischer Ebene.

sandra-memory-bandwidth[1].png

Edit: Ich sehe gerade, dort wurde DDR3 1600 Mhz verwendet, jetzt versteh ich gar nichts mehr :(
Dann müsste doch eigentlich 25,6 GB/s drin sein???
 
Zuletzt bearbeitet:
Ich bin eher Beobachter als Ingenieur. Die technische Seite kann ich nur rudimentär zusammensortieren. Da bin ich keine Hilfe.
 
Trolleule schrieb:
Das verrückte ist ja, die neuen Haswell CPUs benutzen statt QPI, DMI oder DMI2 mit 5 GT/s (PCI Express 3.0 x16) und kommen gerade mal auf eine max. Bandbreite von 2GB/s.
QPI ist nur für die Anbindung zwischen den Xeon CPUs bei Systemen mit mehr als einer CPU, DMI2 entspricht PCIe 2.0 x4 und ist nur zur Anbindung des Chipsatzes, die 16 PCIe 3.0 Lanes und das RAM sind direkt an die CPU angebunden, damit haben werde QPI noch DMI etwas zu tun und die Bandbreite der 16 PCIe 3.0 Lanes ist weit höher als 2GB/s, die entsprechen dem theoretischen Limit vom DMI 2.0 ohne Berücksichtigung der Overheads der höheren Protokolllayer, reale gehen davon noch mal so etwa 20% ab.

Trolleule schrieb:
Dann müsste doch eigentlich 25,6 GB/s drin sein???
Das sind alles theoretische Werte, die unterschlagen aber die Latenzen, denn man kann eben nicht immer nur Nutzdaten übertragen, bei Links wie SATA oder PCIe gehen auch Befehle und Prüfsummen über die Leitung und beim RAM muss man eben nach der Adressierung warten, das sind die Latenzen und die reduzieren eben die theoretische Bandbreite auf den realen Durchsatz. Der Haswell dürfte in dem Test übrigens schlechtere Werte erreicht haben, weil auch AVX verwendet wurden die Haswell bei intensiver Nutzung von AVX runtertakten, da das viel Hitze erzeugt. Würde man für entsprechende Kühlung sorgen und das im Setup des BIOS unterbinden, wäre der Haswell mit seinen beiden direkten Vorgängern gleichauf.
 
Trolleule schrieb:
Ich sehe gerade, dort wurde DDR3 1600 Mhz verwendet, jetzt versteh ich gar nichts mehr :(
Dann müsste doch eigentlich 25,6 GB/s drin sein???

Richtig, die maximale Bandbreite von 25,6GB/s ist noch immer nutzbar. Die CPU hat aber, wie Holt schon beschrieben hat, auch noch andere Dinge zu tun als Benchmark Daten in den RAM zu pferchen und auszulesen. Und gerade in Verbindung mit AVX ist das recht unvorteilhaft.

Außerdem gibt dieser Balken ja nur an was die Benchmark Software grade an Speicherbandbreite nutzt. Das restliche System braucht ja auch hier und da was auf dem Speicher oder will was reinschreiben.
 
Zurück
Oben