Bericht AMD Radeon: Vega-GPU mit neuen Shadern, höherer IPC und HBM2

Jethro schrieb:
Interessantes Interview:
https://www.youtube.com/watch?v=FwcUMZLvjYw

Eine gewisse Person kann jetzt wohl seinen Zettel verbrennen, AMD hat die VRAM Ausstattung als "unwichtig" eingestuft, jetzt zählt der HBM Cache. :evillol:

naja das Video (erste 15 min) überzeugt mich wenig, so sympatisch ich den Inder auch finde :). Auf einmal ist Bandbreite so viel wichtiger -> wäre es so hätte AMD wie bei Fury 4x HBM Stacks draufgepackt und dann zb 4x2 GB verbaut, 2x Bandbreite, juhu.
Für mich hört sich das eher so an "hey, 8Gb werden schon reichen, formulieren wir es so gut wie möglich, auch wenn wir dabei mit etwas Holz argumentieren müssen".

Noch dazu vergleicht AMDs Guru das VRam Handling mit HDD -> SSD - was ein Quatsch. Das unterscheidet sich rein in der Größe, nicht wie der Anwender / Programmer damit umgehen muss. Und genau das spricht er ja bei seinem HBM Cache an, wie "hard" das ist sich als Entwickler mehr auf Bandbreite statt Buffergröße zu konzentrieren. Und dann das Argument "es gibt viele 4 GB Karten die schneller sind als 8Gb Karten". Gut kombiniert ^^ vielleicht sollte man ihm sagen dass es auch Karten mit 128Bit Bus gibt die schneller sind als welche mit 512 Bit.
Unabh davon bringt es alles nicht zu sagen "ok bauen wir eine Karte mit 4GB und 2TB/s" um später festzustellen dass kein Entwickler die 2TB ausnutzt aber den Ram zuknallt. Das wird AMD kaum ändern können. Was mich mich bei der ganzen Sache auch etwa frage sind HDR Texturen, die vielleicht ähnlich von RAWs bei Fotos schnell das vielfache an VRam brauchen werden.

Wenn man das HBM mehr als Cache sieht und der Rest aus dem Arbeitsspeicher kommt dann verschiebt sich die SI Last Richtung PCIe. Dann wiederum würden Karten mit 8x PCIe massiv gegen 16x einbrechen. Aktuell nicht der Fall, HBM hin oder her.
Und er hat recht, 4K TFTs werden erschwinglich und so langsam Massenware, das gibt der Speicherauslastung was Menge angeht auch nen schönen Schub nach oben. Verkaufen tut der Herr das aber gut, gefällt mir.

Seine Effizienzargumentation gefällt mir besser.
 
Zuletzt bearbeitet:
Hab nochmal einen schmalen Titan X P Test mit Ultra aber diesmal auch TSSAA (8TX) und Motion Blur gemacht, die beim letzten Test fehlten, man aber im Linus Video als Vega Einstellung gesehen hat und dem Level aus dem Video.
Außerdem diesmal mit Kamera aufgenommen, ohne ShadowPlay, Bild/Ton daher so lala nur 1080p.
Macht am Ende aber auch nicht so viel Unterschied wie ich gedacht hab (hatte mit weniger FPS der T X P gerechnet):

Cool ist aber das mit der aktuellen RivaTuner Beta die Anzeige bei Vulkan mit dem MSI Afterburner funktioniert, die ich dafür nutzte. T X P mit sanftem OC (Templimit und Powertarget nach oben und RAM etwas mehr Takt, Lüfter der Standardkühlung auf 100% damit der Takt halbwegs gehalten werden kann).

https://www.youtube.com/watch?v=mP8riVxMfmY

FPS meist so zwischen 80 und 100, manchmal etwas drunter, manchmal etwas drüber.

Vulkan rennt schon besser als OpenGL bei mir, zumindest habe ich bei Vulkan immer eine GPU Auslastung von ~97%, bei OpenGL sakte die schon manchmal kurzzeitig auf 60-70% runter, mit FPS Einbruch, ohne erkennbaren Grund.
 
Zuletzt bearbeitet:
Du faehrst deine Titan mit Standardkühler ? Da wuerd ich dann aber geschlossene Kopfhörer empfehlen. Mit Wasser und bischen mehr Takt lassen sich dann nochmal 4 bis 5 FPS rausquetschen aus der Titan Zitrone. Aber ja fuer 4k ist die Titan meiner Meinung nach als Single GPU derzeit die einzige Option. Hoffentlich kommt mit Vega und 1080ti da Nachschub.

Und die 8 GB hoert sich bei Vega mehr nach: Ups die HBM2 sind doch bissi teurer als erwartet, die kann sich sonst spaeter keiner Leisten an.
 
Bis ich mal dazu kommen mein Wakü Projekt zu starten schon, normalerweise aber standard mit ca. 50% Drehzahl ist die schon ok für mich... Taktraten je nach Game und Auslastung natürlich nicht maximal.
 
Zotac2012 schrieb:
Man sollte aber bedenken, das AMD bei der Vulkan API, wie auch der DX12 API immer etwas mehr zulegt, als das bei den Nvidia Grafikkarten der Fall ist. Bei der DX11 API kann das dann schon wieder ganz anders aussehen, daher sollte man mit der Einschätzung der Leistungsstärke der Vega GPU auch noch etwas vorsichtig sein. Sollte Vega sich zwischen der GTX 1080 und der Titan X[P] einordnen

Die 1080 und Titan X P haben finale Treiber und sind finale Karten.
Das hier ist ein ES, da hat der Treiber der Prozess und der Takt ne menge Zeit zu reifen.
Auch unter DX11. Da sind noch einige Prozente Leistungsplus locker drin.
 
Über 500 Seiten Spekulatius....da wird man noch ganz zuckerkrank & fett von :D

Ich bin ja nicht so drin in den neuesten gpu-Entwicklungen, aber ram auf dem gpu-die, das ist schon mal gut. Braucht man bei wakü-gpu-only Betreiber nur noch Obacht auf die Spannungswandler haben.
 
Krautmaster schrieb:
... Auf einmal ist Bandbreite so viel wichtiger -> wäre es so hätte AMD wie bei Fury 4x HBM Stacks draufgepackt und dann zb 4x2 GB verbaut, 2x Bandbreite, juhu.

Genau, AMD haette auf den schon 596 mm² grossen Fiji Chip noch eine zweites 4096Bit breites Speicherinterface draufpacken sollen.
Das was du schreibst kann man echt nicht mehr ernst nehmen.
 
@GreatEvil

Lesen bildet. Die Aussage war:
Wäre Bandbreite das wichtigste, hätte AMD bei Vega nicht zwei, sondern vier Stapel verwendet.
Damit wäre die Bandbreite immerhin doppelt so groß.
Er hat von Vega geredet, nicht von Fury.
Zitat: "wie bei Fury"
 
Ja dass die Bandbreite sehr wichtig ist sieht man gut an der GTX1078/80 und bei der R470/80.
 
@Cyberfries

Dann macht die Aussage aber noch nicht mal theoretisch Sinn, da VEGA 60% mehr Speicherbandbreite hat als die GTX 1080.
 
ODST schrieb:
Also sehen wir das fertige Produkt irgendwann im Sommer - viel Spass an die ganzen "wartenden" Kunden. Die Informationshäpchen sind einfach ungesund für die Seele. :)


Vor allem, wenn man am überlegen ist sich ein komplett neues System anzuschaffen :(..
 
@ GreatEvil

Es ging um das SI bei Vega (2 Stacks, keine 4).

Der Vorteil eines HBM SI soll ja der sein dass es deutlich kleiner und platzsparender ist als ein GDDR5 SI? 4HBM Stacks anzubinden ist kein Problem und würde die Bandbreite nochmals verdoppeln (nicht dass es Sinn machen würde).

Es ging schlicht darum dass AMD natürlich nun die Bandbreite ins Rampenlicht stellt als wäre sie wichtiger als die VRam Größe. Klar, wenn man dank HBM eigentlich Bandbreitenüberschuss hat... man wirbt eben mit dem was man hat.

Dann macht die Aussage aber noch nicht mal theoretisch Sinn, da VEGA 60% mehr Speicherbandbreite hat als die GTX 1080.

Darum gehts aber, der nette AMD Inder sagt ja dass Bandbreite wichtiger als VRam Größe. Aber dem widersprichst du offensichtlich ja genau wie ich. Warum 60% mehr haben wenn man +120% haben kann und es doch so wichtig ist...

Nebenbei hätte man mit 4 Stacks jedenfalls auch keine Probleme jetzt schon 16GB zu realisieren. Auch P100 hat 4 HBM2 stacks.
 
Zuletzt bearbeitet:
Krautmaster schrieb:
@ GreatEvil
Darum gehts aber, der nette AMD Inder sagt ja dass Bandbreite wichtiger als VRam Größe. Aber dem widersprichst du offensichtlich ja genau wie ich. Warum 60% mehr haben wenn man +120% haben kann und es doch so wichtig ist...
Nebenbei hätte man mit 4 Stacks jedenfalls auch keine Probleme jetzt schon 16GB zu realisieren. Auch P100 hat 4 HBM2 stacks.
Aber der kleine Inder / Raja Koduri der Nebenbei der Senior Vice President and Chief Architect von AMD Radeon Technologies Group ist, weiß aber bestimmt wovon er redet. Ich denke der hat sicherlich einen deutlich größeren Einblick in die Materie als Du, Sorry! Natürlich wäre auch AMD in der Lage 16GB HBM2 auf einer Vega zu realisieren, nur ist das im Moment einfach nicht möglich, weil die Zulieferer von diesem Speicher das nicht leisten können, da diese mit der Produktion deutlich hinterher hinken und außerhalb des Zeitplans liegen. Also wird man wohl erst mal 8GB HBM2 mit Vega releasen und später wenn genügend Speicher von HBM2 verfügbar ist vielleicht noch ein 16GB HBM2 Modell mit Vega nachschieben. Ist immer noch besser als gar keine Vega auf den Markt zu bringen und 8GB HBM2 sind derzeit auch völlig ausreichend. Also wo liegt Dein Problem?
 
sicher hat er das (ich weiß wer ist und mag ihn), naja.. okay, wenn ich unsere Senior Vice President fragen würde geht deren Wissen da weniger in die Tiefe, aber sie vermarkten Buzzwords gut.

Dass man aktuell mit 2 Stacks nur 8GB realisieren kann ist klar, Nvidia hat mit P100 und max 16 GB (dank 4 Stacks) dasselbe Problem.

Es ging weniger um die Größe des Speicher als um die Aussage dass Bandbreite =wichtiger als Speichergröße.... diese Argumentation würde jeder Senior Vice President bringen egal wie tief drin, schlicht weil Bandbreite genau das ist, an dem AMD mit HBM nicht fehlt - und bei der man mehr bietet als die Konkurrenz. Also argumentiert man damit und macht sie schnell wichtiger als sie ist.

Aktuell sind 16Gb VRAM mit zB 512GB/s sicher empfehlenswerter als 8GB mit 1024GB/s. Nvidias P100 würden 512GB/s auch reichen aber man hat sich der Speichergröße wegen für 4 Stacks entschieden.

Edit:
Vega hat ja genauso viel Bandbreite wie Fiji bei doppelter Rechenleistung. Das beißt ich doch etwas mit der Aussage vom Raja Koduri oder? ;)
Wie er argumentiert ist dennoch nachvollziehbar. Da gilt es Stärken hervorzuheben.

Edit2:

Angegeben ist P100 mit 720 GB/s = 180 Gb/s pro Stack. Der HBM 2 taktet hier also nicht mit vollem Takt (sondern 700 Mhz). Aktuell ist HBM2 (4Gbyte / Stack) nur mit 204.8GB/s zu bekommen angekündigt (800Mhz), deshalb muss sich da bis Release was tun damit AMD die spezifizierten 512GB/s erreicht.

Tut sich das nicht ist die Bandbreite gar niedriger als bei Fiji. Gute Kompression kann das aber wegmachen, bei Nvidia ja auch nicht anders.

Edit3. Die 204Gb/s Stacks sind nur für dieses Quartal angekündigt aber noch nicht beziehbar. Vermutlich haben also die aktuell gelieferten Stacks noch weniger als 800 Mhz und deshalb kommt der P100 auch auf weniger Bandbreite als er mit den angekündigten Stacks bringen würde. Eventuell kann AMD aber auch die Stacks "übertakten" und so auf 1000 Mhz bringen.
 
Zuletzt bearbeitet:
Zurück
Oben