News AMD Fiji mit HBM: Hawaii profitiert nur wenig von mehr Bandbreite

Faust2011 · 13. Mai 2015

deathscythemk2 schrieb:
Was sollen das eigentlich für Nachladeruckler sein, von denen man hier zwischendurch ließt? Konnte ich mit meiner 270X noch nicht feststellen. Welche Spiele und Einstellungen muss man denn dafür nehmen?

Mir scheint, dass es einige Situationen geben kann, in denen es zu Nachladeruckler kommen kann:
1) Situation: VRAM ist voll --> Wurde nun im Rahmen der GTX970 zu Genüge diskutiert.
2) Situation: VRAM ist nicht voll
a) --> Da fällt nur das Problem ein, dass ggf. der Hauptspeicher das Nadelöhr darstellt. PCGH hatte da vor kurzem untersucht, wie sich 4/8/16GB RAM in einem Gaming-PC auswirken. 16GB dienen vor allem dem Puffern von Frametime-Ausreißern.
b) Sleep-State eines CPU-Core, der nicht schnell genug wieder aufwacht.

Mehr fällt mir gerade nicht ein...

Don Kamillentee · 13. Mai 2015

EchoeZ schrieb:
Google Fiji HBM
Anhang anzeigen 492688
Die Überschrift steht, die Balken leuchten, Suggestiv-Arbeit ist getan, Futter für die Fanboys. Geld muss verdient werden.
Die unbedeutenden Kommentare ein gerne genommenens Zubrot.

Danke. Genau so sieht es aus.

Ich habe bis Seite 5 oder 6 der Kommentare mitgelesen. Dankenswerterweise haben hier ein paar User wirklich hilfreiche Beiträge gesponsert, die sich manch ein Redakteur hoffentlich auch mal genauer ansieht.

Nach lesen des Tests dachte ich mir mit meinem Halbwissen nur: komischer Test, sagt gar nix aus, außer was man schon immer wußte. Dazu fehlen tatsächlich Bandbreite-fordernde Tests, was den Artikel fast schon überflüssig macht. Da kam ich schon allein auf die Idee, das CB hier wohl nen Klickartikel gepostet hat.

Immerhin, dank einiger Kommentare bin nun auch ich wieder etwas schlauer und GOTT SEI DANK kamen die ersten Fanboys erst so ab Seite 6 aus ihren Hüpfburgen gekrabbelt.

CB moderiert diese Kinder, diese Trolle immernoch nicht weg! (oder was haben zB Aussagen wie "AMD macht beschissene Treiber!" mit dem Artikel und der folgenden Diskussion zu tun, außer dem Fanboy eine Plattform zu verleihen?)

Es kamen schon lange nicht mehr soviele interessante Kommentare zum Thema in einer News. Normalerweise wurden in der Vergangenheit von CB die interessanten und hilfreichen Kommentare auf die Newsseite gehieft... Ist der Redaktion aktuell wohl eher zu peinlich und holt man hoffentlich die Tage nach, wenn der klick-Tsunami abgeflacht ist.

DrToxic · 13. Mai 2015

Ob der Artikel nochmal angepasst wird, falls es Hawaii-Chips mit HBM geben wird und der Leistungsanstieg doch höher als erwartet ausfällt? (Wobei es genauso gut sein könnte, dass CB schon Testkarten mit Hawaii+HBM hat und da netto wirklich wenig Steigerung bei herum kommt, aber man das wegen NDA noch nicht schreiben darf)

Ist eigentlich ein gesonderter Artikel mit Test-Parkour nur für HBM geplant, @CB? Dann könnte man die hier getätigten Vorhersagen mit der Praxis vergleichen. Interessant wäre das in jedem Fall.

eruanno · 13. Mai 2015

HBM in allen Ehren, aber allzu euphorisch sollte man nicht sein. Die ~50 Watt aus der Hynix Präsentation sind wie angeschrieben die Differenz bei gleicher Bandbreite, d.h. 8 Gbps an einem 512-Bit SI. AMD benutzt gerade einmal 5 Gbps GDDR5 Chips ggü. den gezeigten 8 Gbps (max. was momentan geht, nirgends verbaut). Auch das SI verbraucht dann bei so hohen Taktraten nochmal ordentlich mehr. Man will ja bei Hawaii gegenüber Tahiti das SI vereinfacht (und sogar verkleinert?) und effizienter gemacht haben. Bei Tahiti war es nur 384 Bit breit, musste aber mit höheren Taktraten klarkommen. Hawaii wird mit dem Speicher sicher nicht diese 80 Watt Verbrauch haben.

@DrToxic: Wenn sie ordentlich alles testen, warum sollen sie den Parkour schon wieder umbauen? Spiele-Performance bei 4k und mit AA, Frametimes, Computing (hier erwarte ich die größten Vorteile), das reicht doch.
Wenn man mehr machen will, muss man das nicht auf HBM beschränken. Man könnte auch so mal ein bisschen rumtesten, wie schon angesprochen den Speicher untertakten oder auch den Chip untertakten + das PT senken und die Effizienz ausloten (sweetspot suchen z.B.). Das wäre meiner Ansicht nach mal interessante Tests, nicht das was neuerdings so kommt. "5 Generationen blabla im Vergleich", lächerlich. Hätten sie es wenigstens beim Namen genannt (3 Generationen) und Chips gegen ihre echten Vorgänger antreten lassen, nicht gegen pseudo-Vorgänger mit ähnlichen Marketing-Bezeichnungen. Wenn ich Generationen vergleichen will, will ich wissen wie sich GF104 gg. GK104 gg. GM204 schlägt, und zwar jeweils voll aktiviert. Meinetwegen auch noch GF114. Etwa auch im Bezug auf die Effizienz. Auch der neue Testparkour ist mir fragwürdig, Ergebnisse wieder nicht mehr vergleichbar. Ich weiß nicht, was da neuerdings los ist.
Bei ht4u gab es z.B. einen Effizienztest von Hawaii gg. GM204, wobei die am PT herumgeschraubt haben. Das ist mal ein interessanter Test mit interessanten Ergebnissen.

Erwartet ihr ernsthaft einen überarbeiteten Hawaii mit HBM? Sollte Tonga XT kommen, ob mit oder ohne HBM, wäre der imho zu nahe an einer heutigen 290. Einen neuen Chip aufzulegen kostet einiges und passiert nicht von heute auf morgen. Ich fände es wichtiger, dass Pitcairn mal aktualisiert wird und Tonga XT endlich kommt und Tahiti ganz abgelöst wird. Hawaii ist eigentlich ein guter Chip, mit gesenktem PT könnte er immer noch mit der 970 konkurrieren und wird effizienter. Nach oben hin geht halt mit dem Chip aktuell nichts mehr. Vielleicht müsste dann noch eine Art Fiji LE als Lückenfüller her.

_vicious_ · 13. Mai 2015

hbm wird sicher für crossfire-lösungen enorme vorteile bieten.

eruanno · 13. Mai 2015

Und welche? Das Problem ist hier der interconnect zwischen den beiden GPUs. Von PCIe mal ganz zu schweigen. Richtig interessant wird das erst, wenn ein richtig fetter Interconnect herkommt oder gar beide GPUs auf den gesamten Speicherbereich zugreifen könnten. Oder man hat so viel Masse an Speicher, dass man problemlos AFR einsetzen kann, das ist bei HBM aber aktuell ganz und gar nicht der Fall.

PiPaPa · 13. Mai 2015

Mit Mantle und DX12 können die GPUs den Speicher gemeinsam nutzen.

eruanno · 13. Mai 2015

Das tut überhaupt nichts zur Sache. Jede GPU hat noch ihren eigenen Speicher und die Daten müssen irgendwo ausgetauscht werden

Daedal · 13. Mai 2015

Das ist noch nicht gesichert. Fiji kommt auf einem Interposer wegen HBM und daher kommen auch die Highspeed Interconnects zum Einsatz. Da besteht überhaupt keine Notwendigkeit die Speicherchips auf zwei Memorycontroller anzubinden. Das ist ja genau Nvidias Problem warum sie auf HBM 2 warten müssen. Nvilnk ist nicht fertig und daher ist ein Interposer Design mit HBM als 2.5 Stack nicht machbar. AMDs hUMA Technologie war angekündigt für diskrete GPUs und könnte hier genau das entscheidende Glied sein.

eruanno · 13. Mai 2015

Erzähl mir mehr darüber, wie du zwei 550mm² GPUs zusammen mit 8-16 HBM Stacks auf einen gemeinsamen Interposer packen willst

Oder worauf willst du denn gerade hinaus?
Und NVLink hat mit HBM mal überhaupt nichts zu tun. Der nimmt sich dem Problem an, was ich beschrieben habe. Nvidia hätte selbstverständlich auch HBM bei Maxwel nutzen können, hat sich aber wohl aus Zeit- und Kostengründen dagegen entschieden.

_vicious_ · 13. Mai 2015

eruanno schrieb:
...hat sich aber wohl aus Zeit- und Kostengründen dagegen entschieden...

this. und amd machts einfach. lass mal benches abwarten und dann sehen wir, wie der grüne laub langsam aber sicher rot anläuft

(sarkasmus/zynismus/ironie) ...

Daedal · 13. Mai 2015

Nun wahrscheinlich ganz genau so wie sie auch MCM Packages mit Magny Cours Server Chips machen konnten. Die Istanbul Dies hatten ca. 350 mm² und waren mittels HT in einer NUMA Anbindung auf dem MCM. Das ist 6 Jahre her und UNified Memory ist das Designziel gewesen mit den APUs. Diese Technologie hat Nvidia eben nicht ohne Nvlink und daher können sie HBM auch nur als 3D onChip anbinden und nicht als 2.5D auf einen Interposer.

Nvidias DevBlog dazu ausführlicher:
http://devblogs.nvidia.com/parallel...d-memory-feeding-appetite-big-data/#more-3097

Today a typical system has one or more GPUs connected to a CPU using PCI Express. Even at the fastest PCIe 3.0 speeds (8 Giga-transfers per second per lane) and with the widest supported links (16 lanes) the bandwidth provided over this link pales in comparison to the bandwidth available between the CPU and its system memory. In a multi-GPU system, the problem is compounded if a PCIe switch is used. With a switch, the limited PCIe bandwidth to the CPU memory is shared between the GPUs. The resource contention gets even worse when peer-to-peer GPU traffic is factored in.

NVLink addresses this problem by providing a more energy-efficient, high-bandwidth path between the GPU and the CPU at data rates 5 to 12 times that of the current PCIe Gen3. NVLink will provide between 80 and 200 GB/s of bandwidth, allowing the GPU full-bandwidth access to the CPU’s memory system.

Nvlink ist eine Schlüsseltechnologie um HBM in 2.5 Stacking nutzen zu können. AMD hat hier anscheinend verbesserte HT/PCIe Interconnects die sich je nach Bedarf als PCIe oder HT nutzen lassen entwickelt, doch das ist bisher nur ein Gerücht Aufgrund einer Andeutung bei den kommenden AM4 Plattformen. Das scheint derzeit das größte Geheimnis rund um Fiji zu sein: Wie wird der Speicher angebunden und was wird beim Interposer verwendet. Denn das wird auch die Technologie für die kommenden AMD APUs sein die CPU, GPU und DDR4 auf einem Interposer verbinden.

dexplus · 13. Mai 2015

eruanno schrieb:
HBM in allen Ehren, aber allzu euphorisch sollte man nicht sein. Die ~50 Watt aus der Hynix Präsentation sind wie angeschrieben die Differenz bei gleicher Bandbreite, d.h. 8 Gbps an einem 512-Bit SI. AMD benutzt gerade einmal 5 Gbps GDDR5 Chips ggü. den gezeigten 8 Gbps (max. was momentan geht, nirgends verbaut). Auch das SI verbraucht dann bei so hohen Taktraten nochmal ordentlich mehr. Man will ja bei Hawaii gegenüber Tahiti das SI vereinfacht (und sogar verkleinert?) und effizienter gemacht haben. Bei Tahiti war es nur 384 Bit breit, musste aber mit höheren Taktraten klarkommen. Hawaii wird mit dem Speicher sicher nicht diese 80 Watt Verbrauch haben.

Du vergleichst Äpfel (GDDR5 @ 320 GBps) mit Birnen (HBM @ 550 GBps).

HBM @ 320 GBps verbraucht deutlich weniger als GDDR5 @ 320 GBps.

Daedal · 13. Mai 2015

Hier der Hinweis aus der Zen Präsentation zu den Interconnects:
http://www.pcgameshardware.de/AMD-R...nalyst-Day-FAD-Livestream-Liveticker-1158292/

Kommende SoCs werden aus CPU-, GPU-, Netzwerk-, Security- und mehr Modulen bestehen, die man in neuen Designs jeweils aktualisieren können wird. Interessant ist der High-Performance-Interconnect, der den Verbund von verschiedenen Chips ermöglichen könnte.

pipip · 13. Mai 2015

http://www.google.com/patents/US20130346695

Es gibt eh schon einige Patente, die den L3 Cache als HBM Speicher sieht.

eruanno · 13. Mai 2015

Was ist denn jetzt hier los?

eruanno schrieb:
Die ~50 Watt aus der Hynix Präsentation sind wie angeschrieben die Differenz bei gleicher Bandbreite[...]

dexplus schrieb:
Du vergleichst Äpfel (GDDR5 @ 320 GBps) mit Birnen (HBM @ 550 GBps).

HBM @ 320 GBps verbraucht deutlich weniger als GDDR5 @ 320 GBps.

Lesen kannst du aber? Zur Vorsicht habe ich mich jetzt auch mal fett zitiert

Genau vor diesem 'falschen' Vergleich habe ich ja gewarnt. Es ist nicht zu erwarten, dass Fiji am Speicher 50 Watt gegenüber Hawaii einspart.

_vicious_ schrieb:
this. und amd machts einfach. lass mal benches abwarten und dann sehen wir, wie der grüne laub langsam aber sicher rot anläuft (sarkasmus/zynismus/ironie) ...

Den Zynismus kann ich jetzt nicht verstehen. Nvidia hatte schon seine Gründe, noch nicht auf HBM zu gehen. GM200 ist offensichtlich keineswegs am Verhungern und dadurch dass die FP64 Einheiten gestrichen wurden, ist genug Platz da. Das 384 Bit SI reicht und erfüllt den Zweck, wofür hätte man ein komplett neues entwerfen sollen? Für Nvidia hätte es sich einfach in keinster Weise gelohnt.
AMD hingegen braucht den Platz und jedes Watt dringender und kann möglicherweise dadurch, dass sie die Technologie mitentwickelt haben, HBM günstiger beziehen. Außerdem wurde AMD ja auch eine zeitlich beschränkte Exklusivität eingeräumt. Sie können sie auch nicht einfach FP64 Einheiten rausnehmen, wie Nvidia, um Platz zu sparen. Jedem das seine...

@Daedal: Magny Cours hatte absolut nichts mit dem zu tun, was bei Fiji mit HBM gemacht wird. Da wurden Interconnects (HyperTransport) zwischen den CPUs realisiert, aber auch da hatte jeder Chip seinen eigenen Speicher.
Der Interposer, der jetzt eingesetzt wird, ist wie ein Die nur ohne Logik. Der enthält die Verbindungen von Speicher zu GPU und die werden dort drauf gepflanzt. So ein großes Teil muss man erstmal fertigen können (nicht nur technisch, auch wirtschaftlich sinnvoll). Unified Memory hat mit HBM genauso wenig zu tun wie NVLink. Und HBM2 hat nichts mit 3D Stacking zu tun. "HBM2" ist lediglich Hynix' Bezeichnung für höhere Dichte (mehr Speicher pro Die), höhere Stacks (bis zu 8 statt 4 Dies) und höhere Taktraten (bis 1000 MHz anstatt 500) gegenüber "HBM1". Natürlich hätten sie 2.5D Stacking machen können. Pascal wird auch Interposer benutzen, kein 3D Stacking

Ich weiß gar nicht wieso du das hier überhaupt alles ineinander wirfst...

pipip · 13. Mai 2015

eruanno
Und du bist der Meinung dass ein Fijii mit GDDR5 Si und Kompression von Tonga limitiert wäre ?

Wieso heißt die nächste Generation eigentlich Pascal und nicht mehr Volta ? Was ist mit HMC aus der NV Präsentation eigentlich passiert ?

http://www.extremetech.com/computin...-between-wide-io-hbm-and-hybrid-memory-cube/2

Ich glaube das sagt alles und ist auch der Grund wieso NV zu HBM umgestiegen ist.
Also erspare dir die Geschichten, NV macht nichts, weil sie HBM Gen2 abwarten, des weitern tut das nichts zur Sache, weil auch die nächste Gen von AMD mit Gen2 kommt und laut Gerüchte bereits Fijii schon HBM Gen2 kompatibel sein sollte. Es spricht in dem Fall nicht mal gegen einen frühen 14nm Shrinke. Somit müsste AMD für die nächste Mittelklasse GPU nicht mal viel investieren, besonders weil Synopsis sich um den "Shrinke" kümmert und AMD Anpassungen nicht mal was kosten würde und bei GF sogar noch Chips herstellen lassen muss und fixe Beträge für funktionierende Chips zahlt.
Ich sehe da eher NV, die mit der nächsten Generation einiges an Technologie nachreichen müsste, aber das ist meine Meinung und die muss sicherlich nicht stimmen.

Außerdem wurde AMD ja auch eine zeitlich beschränkte Exklusivität eingeräumt. Sie können sie auch nicht einfach FP64 Einheiten rausnehmen, wie Nvidia, um Platz zu sparen. Jedem das seine...

Wieso sollte AMD das auch tuen ? Der Chip ist mit DP-Einheiten 550 m^2 groß. Ohne DP-Einheiten wäre der Chip noch kleiner. NV GM200 ist 600 mm^2 groß. Da spricht sogar einiges für HBM, weil sie so den HPC Markt weiterhin mit Kepler abdecken müssen.

Daedal · 13. Mai 2015

Ich werfe nichts durcheinander, sondern verweise auf die Vorgänger Technologie die überhaupt keine Schwierigkeiten hatte solche Interposer Größen zu bauen. Du hast das angezweifelt, daher ein Beispiel. Und HT Interconnects sind genau das was kommen bei einer Dual-GPU mit HBM. Eine Weiterentwicklung wahrscheinlich. Was NVlink mit GPU Anbindung zu tun hat steht in dem Link und dem Zitat das ich gepostet haben.

Zu deinen HBM Anmerkungen kann ich nur sagen, dass sie zwar nicht falsch aber lückenhaft sind. HBM2 ist nicht lediglich höhere Dichte, doch ich verstehe wie deine Meinung zustande kommt mit den Lücken und den fehlenden Zusammenhängen.

Ergänzung (13. Mai 2015)

pipip schrieb:
Wieso sollte AMD das auch tuen ? Der Chip ist mit DP-Einheiten 550 m^2 groß. Ohne DP-Einheiten wäre der Chip noch kleiner.

Das ist nicht richtig. AMD hat keine separaten DP Einheiten mehr, die man weg lassen könnte, seit GCN nutzen sie mixed Precision. So ist die DP immer 1/2 der SP, wenn es treiberseitig geschaltet wird (geht auch mit 1/4 oder 1/8). Lediglich neu dazu kamen kürzlich mit Tonga die FP16 in separater Hardware.

pipip · 13. Mai 2015

Daedal
Alles klar.
Aber da der Chip nur 550 mm^2 groß ist, wäre durchaus ein GDDR5 SI + Kompression möglich gewesen.
eruanno suggeriert ja quasi, als ob das bei AMD nicht "möglich" wäre, dabei sieht es eher so aus, als hätte AMD einfach schon weit aus früher auf HBM gesetzt und auch hier die Ressourcen ausgegeben.

dexplus · 13. Mai 2015

eruanno schrieb:
Lesen kannst du aber? Zur Vorsicht habe ich mich jetzt auch mal fett zitiert
Genau vor diesem 'falschen' Vergleich habe ich ja gewarnt. Es ist nicht zu erwarten, dass Fiji am Speicher 50 Watt gegenüber Hawaii einspart.

Oh Mann. Der Herr hat nicht nur unrecht, er wird auch noch rotzfrech wenn man darauf hinweist.

Das hast du geschrieben:

eruanno schrieb:
HBM in allen Ehren, aber allzu euphorisch sollte man nicht sein. Die ~50 Watt aus der Hynix Präsentation sind wie angeschrieben die Differenz bei gleicher Bandbreite, d.h. 8 Gbps an einem 512-Bit SI. [...] Hawaii wird mit dem Speicher sicher nicht diese 80 Watt Verbrauch haben.

Du vergleichst hier eindeutig Hawaii@320 GBps mit Fiji@550 GBps. Das ist ein No-Go.

Du musst Hawaii und Fiji bei gleicher Bandbreite vergleichen und nicht anders. Bei 550 GBps ist die Differenz etwa 50 Watt, bei 320 GBps wäre die Differenz etwas geringer. Alles klar?

Übrigens: So viel ich weiß hat keiner behauptet, dass Fiji gegenüber Hawaii genau 50 Watt einsparen wird. Das ist ein Produkt deiner Phantasie.

News AMD Fiji mit HBM: Hawaii profitiert nur wenig von mehr Bandbreite

HTTP 418 - I'm a teapot

Don Kamillentee

Gast

Rear Admiral

eruanno

Gast

Lt. Commander

eruanno

Gast

Banned

eruanno

Gast

Banned

eruanno

Gast

Lt. Commander

Banned

Lt. Junior Grade

Banned

Fleet Admiral

eruanno

Gast

Fleet Admiral

Banned

Fleet Admiral

Lt. Junior Grade