Hannibal Smith
Jumbo Frame
- Registriert
- Apr. 2015
- Beiträge
- 1.191
Hast du da was konkretes was man nachlesen kann ?
Folge dem Video um zu sehen, wie unsere Website als Web-App auf dem Startbildschirm installiert werden kann.
Anmerkung: Diese Funktion ist in einigen Browsern möglicherweise nicht verfügbar.
Hannibal Smith schrieb:Weil technisch nicht mehr ging bei HBM1
Hannibal Smith schrieb:Was bei einer Gaming Karte durchaus sinn macht.
Ja, und? Ich verstehe nicht ganz was du mir damit sagen möchtest. Also ja, AMD hat ein Konkurrenzprodukt, das ist aber mehr ein Gegenspieler für die Tesla P100, also dem Voltavorgänger.Die AMD Pro WX-Serie ist die Konkurrenz zu Quadro und die Instincts gegen Tesla oder ?
AMD hat eine Karte mit 4 Stacks und 32gb in Planung als Konkurrenz für die Volta.
-Ps-Y-cO- schrieb:Vega FE ist nicht weit entfernt von Volta (FP16/FP32...)
Hannibal Smith schrieb:Hast du da was konkretes was man nachlesen kann ?
ascer schrieb:Nichts ja und - du hast die Problematik eben noch nicht verstanden.
Wenn du 2 GPUs mit 5 TFlops fp32 betreibst, dann ergibt das nur dann in der Realität <= 10 TFlops für deine Simulationen, wenn sich die Arbeitslast gleichmäßig auf beide GPUs verteilen lässt und du alle notwendigen Daten ausreichend verteilen und wieder einsammeln kannst.
Benötigen bestimmte Operationen schon vor dem Endergebnis Informationen aus dem ganzen Datensatz der aktuell bearbeitet wird, dann muss auch vor dem Endergebnis schon untereinander kommuniziert werden. D.h. VRAM1 <-> GPU1 <-> PCI-E <-> CPU/RAM <-> PCI-E <-> GPU2 <-> VRAM2.
Das wird natürlich umso schlimmer, wenn man mehr als nur 2 GPUs einsetzt. Das ist ja auch der ganze Punkt von NVLINK: da basteln die in einem DGX einen Interlink, wo jede GPU mit jeder GPU kommunizieren kann, ohne PCI-E / CPU / RAM Bottleneck.
Das typische Szenario ist ein map-reduce, wo man Datensatz D optimalerweise in D/2 aufteilt, dann das jeweils auf einer GPU berechnet und am Ende auf der CPU per reduce wieder zu einem Gesamtergebnis zusammenführt.
Wenn bei den Operationen nun viel mit dem VRAM kommuniziert werden muss, limitiert der stark, weil jede GPU ja nur 500 GB/s in deinem Beispiel hat, nicht fast das doppelte, wie die V100.
Das sind gänzlich unterschiedliche Probleme. NVLINK beseitigt das Problem, Daten schnell untereinander auszutauschen, besonders für Zwischenergebnisse. Schneller VRAM beseitigt das Bottleneck, dass Daten nicht schnell genug der GPU zur Verfügung gestellt werden können.
-Ps-Y-cO- schrieb:Wenn die Daten von 3dCenter Stimmen ist der Vega 20 Chip aber Verdammt klein mit 300-350mm²
Aber AMD hat seit HD 3850 immer wieder mit (Teilweise!) massiv kleineren Chips NV überflügelt oder kam nahe an deren Leistung ran.
Und ja Stimmt. Eine RX 590 fehlt tatsächlich... Die 580 8GB macht aber Ihren Job auch richtig gut uns als Nächst größeres ist ja dann Vega 56 da.
Preislich (UVP!!) Liegen die beiden auch nicht weit voneinander Entfernt.
Und so bleibt die Hoffnung dass die Xbox One X noch eine ganze weile die Top Konsole bleibt (GPU Technisch)
snickii schrieb:Kauf mir dann lieber einen Kleinwagen.
Was sind das denn für Preise..