News AMD Fiji mit HBM: Hawaii profitiert nur wenig von mehr Bandbreite

Dass Hawaii nicht so sehr davon profitiert liegt zum einen an der älteren GCN Version des Chips und zum anderen an der Rohleistung.
Laut den Präsentationsleaks der R9 390X soll Fiji XT eine FP32 Rechenleistung von wahnsinnigen 8,6 TFLOPs haben.
140bf9ce-7f89-4c88-8c88-6830c8fee762.jpg


53% höher als bei Hawaii und etwa 40% höher als beim GM200 der Titan X. Da kann man sich schon vorstellen, dass die große Bandbreite bei der Rohleistung nicht schaden wird. Außerdem soll Fiji ja vor allem für UHD Gaming entwickelt worden sein.

Aber der eindeutig größte Vorteil von HBM ist natürlich der deutlich geringere Energie- und Flächenbedarf.
 
Interessante Info und ich bin auch schon gespannt auf die neue AMD Karte. Ich finde aber, man hätte entweder in 4K oder zumindest mit MSAA testen müssen.
 
Es ist ein Fehler das HBM nur 2 Vorteile bringt.

1. HBM braucht weniger Strom
2. HBM ist deutlich schneller in Form von höherer Bandbreite und niedrigerer Latenz
3. HBM benötigt auf der GPU weniger Platz bei der Speicheranbindung

Somit kann kann auch mehr Platz auf der GPU für Recheneinheiten genutzt werden. Zudem unterschlägt Computerbase das HBM auch geringere Latenzen aufweisen kann.
Zudem kann die GPU eben genau auf den Strom zugreifen, der durch den HBM Speicher gespart wird. Im Endeffekt steht der GPU somit mehr Platz und mehr Strom zur Verfügung.

Ansonsten bleibt zu sagen das noch keiner weiß wie groß der Vorteil durch HBM insgesamt wird. Und ein Test unter 4K hätte Computerbase auch machen können, denn da sollte der Vorteil noch größer ausfallen. 10-20% mehr Leistung alleine durch den HBM Speicher sind durchaus möglich.

Edit:

Genau genommen könnte man die bessere Latenz von HBM auch als 4. Vorteil nennen.
 
Zuletzt bearbeitet:
Das kommt doch auf die Anwendung an. FFT-Berechnungen beispielsweise würden auch mit Hawaii von einer höheren Bandbreite profitieren.
 
Möglich ist alles. Bei der Radeon HD 3870 wurde im Vergleich zur HD 2900 die Speicherbandbreite massiv reduziert - auf die Geschwindigkeit hatte das quasi keinen Einfluss.

Realistisch sind Geschwindigkeits-Vorteile zwischen 0% und 10% - man darf gespannt sein.
 
Aber zu beachten ist allerdings auch dass sich die Latenzen bei HBM wohl deutlich senken werden, weil erstens, der dicke Speicherkontroller entfällt und zweitens, der Speicher deutlich näher am DIE sitzt. Allein das kann schon einen Schub bedeuten. Klar, werden das nicht Welten Unterschied sein aber von ein paar mehr Prozenten kann man von ausgehen.
 
gähn...ganz toler test, das war die letzten 5 generetionen grafikkarten immer so, vor allem beim high end chip, der meistens ja auch die maximale speicherbandbreite bringt.

bei laptop high end chips sieht es da manchmal schon ganz anders aus, weil dort das interface manchmal absichtlich als limitierender faktor gesetzt wird.


neben den bereits von anderen lesern richtig bemerkten fehlern im test geht es bei HBM auch darum das PCB und somit die karte an sich simpler zu gestalten und somit auch wohl günstiger zu produzieren.Außerdem soll HBM ja auch einiges an strom sparen was sich sehr positiv auf die TDP auswirken dürfte, womit AMD wohl auch was die "effizienz" der "kompletten" karte angeht mit nvidia gleichziehen kann.

was nämlich witzigerweise auch nie jemand erwähnt hat bei hawai, war das 512bit interface das nunmal mehr strom verbraucht als die 384bit bei nvidia bzw 256bit oder sogar "256"bit...gtx970
aber so ist das eben, richtig tiefgehende tests von hardware gibt es kaum noch
(sieht man ja daran, dass den "hardwareseiten" die speicherlimitierung der gtx970 nichtmal aufgefallen ist... bloß schnell durch den testparcour jagen und klicks abstauben)

dass die zusätzliche bandbreite bei der aktuellen gpu leistung die maßgeblich durch den massiv veralteten 28nm prozess gebremst wird nichts bringt war von vornherein klar.
sobald aber 16nm oder 14nm oder 1xnm gpus endlich verfügbar sind und man mit einer verdopplung der aktuellen shader anzahle rechnen kann wird HBM seinen trumpf voll ausspielen, was die bandbreite angeht.
 
Zuletzt bearbeitet:
...und die Shaderanzahl ist sehr viel Höher, auch dass wird in dem Test nicht Berücksichtigt!
Die Shader werden doch auch Gefüttert vom GRAM.

mfg
 
zeedy schrieb:
53% höher als bei Hawaii und etwa 40% höher als beim GM200 der Titan X.

also, dann kannst es dir ja ausrechen...

47% mehr Shader, 53% mehr Leistung. 6% durch mehr Speicherbandbreite & Architektur.

-> etwa genau das was aufgezeigt wird.
-> CB beteiligt sich selten an reinem Spekulatius wenn die nicht wissen was letztendlich bei rauskommt ^^
->53% sind doch ordentlich.
 
Nightspider schrieb:
Es ist ein Fehler das HBM nur 2 Vorteile bringt.

1. HBM braucht weniger Strom
2. HBM ist deutlich schneller in Form von höherer Bandbreite und niedrigerer Latenz
3. HBM benötigt auf der GPU weniger Platz bei der Speicheranbindung

Das habe ich mir auch gedacht. Und diese Ersparnis dürfte wirtschaftlich sehr viel bedeutender sein.

Wer schonmal selber seine Grafikkarte bis zum Absturz übertaktet hat, um nur paar mehr Frames zu erzielen, weiß, dass Speichertakt noch nie ausschlaggebend war. Daher gab es auch keine dringenden Notwendigkeiten, bislang GDDR5 zu ersetzen wie noch damals zu DDR3 Zeiten. Auch wenns momentan von vielen im Zuge von HBM hochgejubelt wird.
Elite_Warrior schrieb:
Aber zu beachten ist allerdings auch dass sich die Latenzen bei HBM wohl deutlich senken werden, weil erstens, der dicke Speicherkontroller entfällt und zweitens, der Speicher deutlich näher am DIE sitzt. Allein das kann schon einen Schub bedeuten. Klar, werden das nicht Welten Unterschied sein aber von ein paar mehr Prozenten kann man von ausgehen.
Hast du Zahlen? Oder alles nur Vermutungen?
 
Nightspider schrieb:
Es ist ein Fehler das HBM nur 2 Vorteile bringt.

1. HBM braucht weniger Strom
2. HBM ist deutlich schneller in Form von höherer Bandbreite und niedrigerer Latenz
3. HBM benötigt auf der GPU weniger Platz bei der Speicheranbindung

Somit kann kann auch mehr Platz auf der GPU für Recheneinheiten genutzt werden. Zudem unterschlägt Computerbase das HBM auch geringere Latenzen aufweisen kann.
Zudem kann die GPU eben genau auf den Strom zugreifen, der durch den HBM Speicher gespart wird. Im Endeffekt steht der GPU somit mehr Platz und mehr Strom zur Verfügung.

Ansonsten bleibt zu sagen das noch keiner weiß wie groß der Vorteil durch HBM insgesamt wird. Und ein Test unter 4K hätte Computerbase auch machen können, denn da sollte der Vorteil noch größer ausfallen. 10-20% mehr Leistung alleine durch den HBM Speicher sind durchaus möglich.

Eben dies. Gerade die verringerten Latenzen bringen ein Leistungsplus. Die Bandbreite ist da unerheblich, die hat man mit etwas Aufwand (512bit, siehe Hawaii) bisher auch nach oben skalieren können. Dass die Bandbreite bei HBM so groß ist eliminiert nur einen etwaigen Flaschenhals, Bandbreite "bringt" keine Leistung, sie sorgt nur dafür dass die erbrachte Leistung auch ankommt.


Insofern ist der Test recht hahnebüchen, da im Endeffekt die FPS eine Kombination sämtlicher Faktoren einer Kette sind. Interessanter wäre gewesen die Auslastung der Speicherbandbreite zu messen damit man Aussagen treffen kann wie sehr diese limitiert.

P.S.: Durch die Erhöhung der Taktraten reduziert sich ja auch die cycle-time, das ist der Grund für den FPS-Gewinn. Die Bandbreite ist wie gesagt in diesem Fall nicht ausschlaggebend.
 
Stimmt, zumindest könnte man dann sehen, wie stark die Limitierung das Ergebnis einbrechen lässt.

Das würde aber noch immer voraussetzen, das Fiji massiv mehr Rechenleistung nutzt, um HBM voll auszunutzen.
Bin mal gespannt und hoffe es.
 
Krautmaster schrieb:
also, dann kannst es dir ja ausrechen...

47% mehr Shader, 53% mehr Leistung. 6% durch mehr Speicherbandbreite & Architektur.

-> etwa genau das was aufgezeigt wird.
-> CB beteiligt sich selten an reinem Spekulatius wenn die nicht wissen was letztendlich bei rauskommt ^^
->53% sind doch ordentlich.

Daher erwarte ich von Fiji eine im Durchschnitt mindestens 45% höhere Gaming Leistung, in 4K und in aktuelleren Engines auch 55-60% ;)
 
estros schrieb:
Das habe ich mir auch gedacht. Und diese Ersparnis dürfte wirtschaftlich sehr viel bedeutender sein.

vermutlich 2020 dann ja. Heute gibts GDDR5 ca 10000x so oft zu vermutlich weit besseren Yields + Standard PCBs. Bis sich HBM wirklich rechnen mag dürfte noch etwas Zeit ins Land gehen und bis dahin viele darauf setzen.
Elektroautos sind auch nicht persé günstiger ;)
 
Kann mir vorstellen, dass die neuen GPUs durch die höhere Bandbreite bei 4k Auflösung am meisten profitieren. Momentan finde ich gibt es keine GPU die wirklich ihr Geld wert ist, wenn man höher als HD spielen will! Da ist nur eine multi GPU Lösung bis jetzt sinnvoll, hoffe das ändert sich mit der neuen Gen. Schön langsam wird es wieder Zeit für einen großen Sprung im GPU Segment! Die UHD IPS 144Hz Monitore werden auch immer interessanter.
 
Zuletzt bearbeitet von einem Moderator:
Was soll das Untertakten denn bitte bringen? Es geht um den Tempounterschied zwischen viel und sehr viel Bandbreite. Dass der Unterschied zwischen wenig und etwas mehr als wenig deutlich größer ausfallen kann ist völlig logisch.
Die Frage ist ja wie viel Speicherbandbreite brauche ich um meine Rechenwerke gut auszulasten? Das kann je nach Problem unterschiedlich viel sein. Ich habe das mal im Verlauf meines Studiums bei den mehreren Pässen einer Flüssigkeitssimulation auf meiner Titan untersucht; da sieht man eigentlich recht schön wie sich so eine Skalierung verhält (Standardtakt = circa 1.5* Normierter Takt):
SKALIERUNGMULTIPROZESSORZAHL.jpgDRAM.jpg

Eben dies. Gerade die verringerten Latenzen bringen ein Leistungsplus.
DRAM-Latenzen spielen bei GPUs eigentlich wegen ihrem Latency-Hiding-Mechanismen in der Regel kaum eine Rolle.
 
Zuletzt bearbeitet:
zeedy schrieb:
Daher erwarte ich von Fiji eine im Durchschnitt mindestens 50% höhere Gaming Leistung, in 4K und in aktuelleren Engines auch 60% ;)

kommt hin ja. Etwa wie eine TITAN X. Deswegen wirds interessant was die Fiji OC macht ;)

Siehe:
https://www.computerbase.de/2015-05...ergleich/2/#abschnitt_leistungsratings_spiele

~290X -> TITAN X sind etwa 50-60% bei FHD
290X OC liegt näher an 1000Mhz (im Falle CB Test) -> da sinds ~42-50%

Die Fiji mit ~1000Mhz dürfte also recht genau auf TITAN X @ Stock Niveau landen, vllt. 5-10% darüber. (passt genau zu den Leaks)

-> entscheidend ist was OC geht, sind bei der TITAN X ja weitere 20%, PCGH bis 30%.
-> Ausgehend von der R9 290X also ~1,45*1,2 bis 1,3 = 75% bis 88% die eine GTX TITAN X vor der R9 290X @ 1000 Mhz liegt.

Wenn Fiji auch etwa 10-20% OC geht dann kann sie die TITAN X OC schlagen.
 
Zuletzt bearbeitet:
Krautmaster schrieb:
vermutlich 2020 dann ja. Heute gibts GDDR5 ca 10000x so oft zu vermutlich weit besseren Yields + Standard PCBs. Bis sich HBM wirklich rechnen mag dürfte noch etwas Zeit ins Land gehen und bis dahin viele darauf setzen.
Elektroautos sind auch nicht persé günstiger ;)
Das ist kein Sprung von GDDR3 zu 4 oder 5, sondern ein anderes Prinzip. Bei den Bisherigen gebe ich dir uneingeschränkt Recht, darum hat sich GDDR4 nie durchgesetzt. Weniger fremd Einkaufen ist ein deutliches Plus bei den Kosten, vielleicht zeigt AMD ein paar Zahlen und wir sind alle schlauer. Oder die Chips sind teurer, sodass nicht einmal deine 2020 reichen. Mir ging es aber nicht nur um die Kostenersparnis bei der Produktion der Chips.:)
 
Nightspider schrieb:
Es ist ein Fehler das HBM nur 2 Vorteile bringt.

1. HBM braucht weniger Strom
2. HBM ist deutlich schneller in Form von höherer Bandbreite und niedrigerer Latenz
3. HBM benötigt auf der GPU weniger Platz bei der Speicheranbindung
4. Single Cell Refresh
5. Seperate Speicherfrequenzen für jeden 128-bit Channel
6. Konfigurirbare ECC Kombination auch mixed in einem Stack (z.B. 4 GB normal+4 GB ECC)
7. Thermale Taktsteuerung (TDP basiertes Balancing)
8. Dual Command

Wolfgang dein Artikel ist so schlecht vorrecherchiert, so dass du mit dem gesamten Ansatz zeigst wie wenig du dich mit HBM beschäftigt hast. Solltest du dich da von anderen rein drängen lassen tut es mir Leid, doch ich bin etwas überrascht ob dieses Artikels der nichts - aber auch gar nichts - technisches aufzuweisen hat. Hohe Bandbreite ist nur das Sahnehäubchen bei HBM - die Kernfeatures und Verwendung hat mal Nvidia zusammengefasst, siehe hier:
http://www.planet3dnow.de/vbulletin...-mit-Zukunft?p=5009947&viewfull=1#post5009947
Complicated schrieb:
Ja und zwar flexibel implementierbar.
Nvidia hat auf dieser Präsentation das grob zusammengefasst:
http://www.cs.utah.edu/thememoryforum/mike.pdf
Dies führt dazu, dass selbst bei identischer RAM-Bestückung die Hersteller hier noch eine Diversifizierungsmöglichkeit haben für das Profisegment. Es wären 4GB normaler und 4GB ECC Kombinationen möglich, die lediglich über das BIOS vorkonfiguriert werden - wer weiss vielleicht wird es sogar möglich dies im BIOS selber an und aus zu schalten (etwas spekuliert, da ich nicht weiss welche sonstigen Voraussetzungen im System gegeben sein müssen. IOMMUv2 ist ja an Board bei den APUs.)

Diese Möglichkeit ist der Single Bank Refresh Eigenschaft von HBM zu verdanken, oder dem selben Arichtekturmerklmal zumindest. Im Gegensatz zu bisherigem Speicher können alle je 128-Bit Controller angebundenen Speicher-Slices unterschiedlich getaktet und refresht werden. So kann eine GPU den besten Takt für das TDP-Budget, das ihr derzeit dynamisch zugewiesen ist, auswählen, abhängig ob sie gerade viel Speicher braucht oder wenig und den dann höher takten kann. Die CPU ebenfalls. Gemeinsame Speicherbereiche takten auf dem bestmöglichen gemeinsamen Takt. So könnten 4-6 Speichertakte zeitgleich im System herrschen, je nach dem welche Recheneinheit gerade wie viel TDP Budget hat und wie lang der queue noch ist.

Dies kann bisheriger DDR Speicher nicht leisten, da immer zuvor alle Speicherkanäle möglichst voll ausgelastet sein müssen und der Gesamte Speicher im selben Takt refresht werden muss.

Hier ab Seite 14 die Latenzwerte im vergleich und ab da folgend die Details zu Single Bank refresh und die Datenbus optmierungen mit Dual Command Interface
http://www.hotchips.org/wp-content/...Bandwidth-Kim-Hynix-Hot Chips HBM 2014 v7.pdf
 
Zuletzt bearbeitet:
Meine Güte, es gibt noch nicht mal Spiele, geschweige denn die dazugehörigen Grafikkarten auf dem Markt die die neue Technik richtig ansprechen.

Man sollte durch solche Tests keine voreiligen Schlüsse ziehen.Und so revolutionär werden die neuen Karten von AMD auch gar nicht sein.Mir ist schon eine bessere Effizienz bei den High End Karten recht.

Bis die Spiele kommen, die DX 12 und das HBM richtig ausreizen wird noch einige Zeit vergehen.Wenn ich bedenke, wie lange ich meine HD 7950 schon im Rechner habe und noch sehr zufrieden bin......es ist schon lange nicht mehr so revolutionär wie vor 15 Jahren als die Sprünge von DirectX zu DirectX und Grakamodell noch krasser waren.
 
Zurück
Oben