Ralf555 schrieb:
Bei IPC Quervergleichen sollte aber bedacht werden, dass Visheras Kerne nicht auf Piledriver vom Trinity basiert, sondern offenbar nur ein neues Orochi Stepping darstellt.
Ich bin gespannt, wie sich das Rätsel lösen wird. Ansonsten wäre Piledriver nur ein Marketing-Name ohne technische Bedeutung.
mosesAK schrieb:
hier wird ja ständig über das modulkonzept gemeckert, es sein fake kerne oder sei es auch nur halbe. warum muss sich ein 2 moduler den immer an einem quad messen? ( bulldozer u piledriver vergleiche klammer ich da mal aus)
aufgegangen ist dieß leider nicht, da intel derzeit viel zu stark ist und es scheinbar zu schwer ist codes zu schreiben die mehrere threads "automatisch" nutzen.
mal abwarten was noch kommt. ich freu mich allerdings auf hsa! weil so weit ich das richtig verstanden hab bedeutet das, dass die apu selbst entscheidet wo was berechnet wird. das sollte eine bessere skalierbarkeit bringen.
verzeit meine rechtschreibung.
1.) Ein BD Modul ist ungefähr so groß wie ein Intel-Kern. Also ist ein 4 Moduler (8-Integer-Cores) gegen einen Intel Quadcore legitim. Leider auch nur grob, weil bei der Zählung noch der Rest der Architektur fehlt und auch die Fertigung nicht das gleiche Level hat.
Übrigens hat ein Intel-Kern auch 3 Integer-Pipelines und bei AMD hat ein Integer-Kern nur 2 Somit hat 1 Modul 4 Pipelines und bei Intel hat 1 Kern 3 Pipelines. Durch SMT wird dann die dritte Pipeline als logischer Kern definiert, wodurch man 2 Threads auf einem Integer-Kern laufen lassen kann.
Vergleichen wir 8 Integer-Kerne von Bulldozer sind das 16 Integer-Pipelines und 8 Threads, jeweils auf einem Kern, bei Intel haben wir 4 Integer-Kerne, die gemeinsam 12 Integer-Pipelines haben und 8 Threads auf diese verteilen können.
Bei Intel ist der Rest dann noch einmal ein gutes Stück besser und ebenso die Fertigung und voilà, werden AMD Prozessoren egal wo zusammengeprügelt.
2.) Bei HSA wird niemals die Hardware selber erkennen können, wo was etwas ausgeführt wird. Das werden die Tools und die Software selber erledigen müssen. Bei HSA gelten aber Pointer für die CPU und die GPU, es gibt einen gemeinsamen Adressraum und du musst die ganzen Datensätze nicht jeweils für eine Einheit kopieren und sparst viel Bandbreite, Rumkopiererei, Strom, Zeit (Latenzen) usw.