News AMD CDNA: Profi-GPU mit angeblich viel Takt zum Jahresende

Colindo schrieb:
Fand die anderen zwei Folien bei AdoredTV auch sehr merkwürdig. Gut, dass hier nur auf die realistischen Daten eingegangen wird. Trotzdem ist es nach wie vor ein Gerücht.

Jo wir haben auch diskutiert. Die sehen aus wie selber was zusammenkopiert und könnten eher von Nvidia sein. Und bei AdobeTvs Historie .. die haben schon so manche Ente rausgehaun, ich trau denen ohnehin nur mit extremster Vorsicht.
 
  • Gefällt mir
Reaktionen: Onkel Föhn, Transistor 22, jemandanders und 6 andere
Flare schrieb:
Bei der MI50 stehen die 50 auch für INT8 TOPs
Soweit ich weiß, stand das bisher immer für die FP16-Leistung. Bei den alten Karten sieht man das auch gut in der Übersicht. Bei der MI50 muss sich die Definition geändert haben, wobei ich mir den minimalen Zuwachs der FP16-Rechenleistung nicht richtig erklären kann. Weiß da jemand mehr?
1596111827570.png

Ergänzung ()

@KlaraElfer Die Instinct-GPUs waren bisher immer ohne Lüfter ;). Welche Architektur in Workstations kommt, wissen wir ja nicht.
 
  • Gefällt mir
Reaktionen: fox40phil und JohnVescoya
PS828 schrieb:
Wer soll das denn jetzt schon Wissen :D aber radiallüfter sind hoffentlich gesetzt. Mit diesen axialblödsinn bei consumerkarten kann ich nix anfangen.


Also eigentlich kommen die Instinct Karten ohne Lüfter. Sind halt für Rack Server gedacht. Kaum einer wird sich die einzeln kaufen und in einen Consumer Tower schrauben ;)

Und in den Servern stecken dann auch noch diese bösen Axiallüfter.

Edit: nicht gesehen, dass @Colindo dazu schon was geschrieben hat
 
  • Gefällt mir
Reaktionen: fox40phil, JohnVescoya, PS828 und eine weitere Person
@Shoryuken94 das bezog sich auch eher auf die Desktop Modelle :D dass im Rack andere Prinzipien genutzt werden ist klar.

Wer mehr als eine GPU im Tower hat weiß es zu schätzen wenn die Karten ihre eigene Wärme selbst nach draußen Schaufeln.
 
  • Gefällt mir
Reaktionen: fox40phil
4ndroid schrieb:
Ich fürchte die RTX3900 und X6900 mit 16GB VRAM liegen bei >1k EUR, in bezahlbaren Regionen bis 700 Euro sehen wir wohl die RTX3800 gegen die X6800XT

Was lässt mich daran zweifeln das die RTX 3800 rund 700€ kosten wird? Ich denke eher das die bei 899€ angesetzt wird. Passt ins bisherige Preisschema wenn ich das richtig in Erinnerung habe. Kann mich selbstverständlich irren ;)
 
Die 2,1Ghz+ sind nicht unrealistisch, wenn ich sehe, wie hoch ich meine Radeon VII in Blender jagen konnte.
Zwar mit kräftigem OC, aber möglich ist es. 😊
Blender 2223Mhz.jpg
 
  • Gefällt mir
Reaktionen: Onkel Föhn
Selbst die iGPUs haben 1900MHz und sind quasi nur auf yield ausgerichtet. Vega wiederum ist nie fertig geworden. Entscheidende Funktionen wurden nie aktiviert.
 
Topflappen schrieb:
Ich will nur ketzerisch anmerken, dass 4x1,2TB/s nicht 4,9 sowie 8x1,2 nicht 9,8 ergibt.
Das sind auf eine Dezimalstelle gerundete Werte.
 
  • Gefällt mir
Reaktionen: medsommer
Wenn man in Betracht zieht, welche Taktraten die VEGAs im neuen Ryzen G erreichen, klingen 2GHz+ gar nicht abwegig.
 
  • Gefällt mir
Reaktionen: Cpt.Willard und bad_sign
Colindo schrieb:
Soweit ich weiß, stand das bisher immer für die FP16-Leistung. Bei den alten Karten sieht man das auch gut in der Übersicht. Bei der MI50 muss sich die Definition geändert haben, wobei ich mir den minimalen Zuwachs der FP16-Rechenleistung nicht richtig erklären kann. Weiß da jemand mehr?
Anhang anzeigen 949683
Ergänzung ()

@KlaraElfer Die Instinct-GPUs waren bisher immer ohne Lüfter ;). Welche Architektur in Workstations kommt, wissen wir ja nicht.
Und postest ein Bild wo die FP16 halb so hoch sind wie die Produktbezeichnung ???

Ich habe 100% Recht, hier Beweis
 

Anhänge

  • MI50_16GB_Specs.jpg
    MI50_16GB_Specs.jpg
    321,9 KB · Aufrufe: 413
Flare schrieb:
Und postest ein Bild wo die FP16 halb so hoch sind wie die Produktbezeichnung ???

Ich habe 100% Recht, hier Beweis

Bei der MI 25 ist die maximale FPS 16 Leistung 24.6TFLOPs, und nun?

Und bei der MI 6 sind es 5.7TFLOPs FP16/FP32, bei der MI 8 8.19TFLOPs.

Das mit INT8 scheint erst bei der MI50 so zu sein, genau wie @Colindo gesagt hat.

Bei den anderen Karten wird INT8 nichtmal angegeben, für mich sieht das einfach so aus, als habe man sich ne neue Metrik als Bezugspunkt gesucht, damit die Zahlen möglichst größer werden, obwohl die FP Leistung, nach der die vorherigen Karten benannt wurden, nur marginal zugenommen hat.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Colindo
Ich bin vorsichtig. Leaks bei denen die Hälfte der Infos Schrott sind....
 
Die Evolution ist, dass die:
MI8 FP32 und FP16 1:1 Speed hat, wenig MHz und auf Fiji GCN3 basiert
MI25 FP32 und FP16 1:2 hat und bei gleicher Kernmenge GCN5 ca. 1,5x MHz macht
Resultat FP32=12,5 und FP16=25
MI50 basiert auf der MI25 und hat "nur" die FP16 vs INT8 Speedverdopplung gebracht, was aber auch eine Marketing-Verbesserung sein könnte die die MI25 in Hardware eigentlich auch kann aber es in Software nich freigeschaltet ist.
Jetzt aber bei einer Kernvedopplung auf 8192 gleich FP16 100 TFLOPs zu erwarten ist mMn nicht haltbar, ohne Tensor-Cores, für INT8 ist das einfach machbar.
 
[wege]mini schrieb:
Dann hätten wir 26-30 Milliarden Transistoren auf unter 700mm² Fläche und das könnte man mMn auf jeden Fall jenseits der 2 Ghz betreiben, selbst wenn man nur 300 Watt im Peak verballern möchte.
1596129846660.png

1596129856015.png


Bevor ich auf die Folien eingehe, zuerst mal die Frage, wie sieht AMD Ansatz bei Epyc aus ?
Mehrere Chips im Verbund als MCM und das über Fabric Bus. "Kleben" ist das Fachwort, zu mindestens von seiten Intel.

Mein Tipp ist, CDNA ist nichts anderes. Es ist ein Verbund von Chiplets über Fabric Bus. Anders als bei Eypic sind diese aber nicht auf einem Sockel sondern jeweils auf einer Grafikkarte. Eigentlich eher mit Ryzen Gen1 zu vergleichen. Zur Erinnerung Fabric Bus geht von Core to Core, Chip to Chip und Socket to Socket.

Was könnte also hinter CDNA 1 stecken. Meiner Meinung nach, relativ kleine Chips und ich könnte mir vorstellen dass dieser Chip kaum größer ist, als Vega20, selbt wenn der doppelt so viele Shader hat. Oder besser gesagt eigentlich ALUs. Denn alles was für Video-Ausgabe in Vega 20 noch vorhanden war, ist nun weg. Das könnte eventuell auch das CU Design selbst betreffen.

Dann dürfte der eine oder andere dann Fragen, wieso dann so "kleine" Chips, wenn die Konkurrenz doppelt so große Ampere Chips hat. Naja, Produktionskosten, Ausbeute und VRAM. Ja genau VRAM.

Nehmen wir an, CDNA GPU ist halb so groß wie die NV Karte aber auch halb so teuer. Beide Karten haben gleich viel VRAM. Falls AMD Skalierung im Compute Bereich um Verbund mit Epyc super läuft, kann man am Ende zwei Karten im Verbund zum selben Preis verwenden aber mit doppelten VRAM (bsp 32 vs 64 GB VRAM).

Versteht ihr worauf ich hinaus will. Es ist übrigens nur eine mögliche Strategie von vielen. Aber meiner Meinung nach, die denkbar nachvollziehbare( Denn die nächsten Schritte geht dann doch auf mehre Chips auf einem Sockel und HBM direkt auf den jeweiligen GPU Die. )Wie einige Anmerken, kann die Karte vs Karte nicht mithalten. Aber mit dem Multi Verbund kann man zu mindestens Vorteile erzielen, wenn am Ende auch Preis/Leistung ein Faktor ist.

1596130463659.png

Man siehe diese "angebliche" Skalierung.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Onkel Föhn
4ndroid schrieb:
RDNA2 auf >2 Ghz Takt sehen wir ja schon bald bei der PS5 im Masseneinsatz, sollte also niemanden wundern, genauso wenig wie 16GB VRAM bei der "großen" Navi und dann 12GB im Mainstream und 8GB bei den kleineren Navi. Ich fürchte die RTX3900 und X6900 mit 16GB VRAM liegen bei >1k EUR, in bezahlbaren Regionen bis 700 Euro sehen wir wohl die RTX3800 gegen die X6800XT bei 12 GB und irgendwann dann die RTX3700 gegen die X6700XT bei 8 GB. Nvidia wird wieder etwas effizienter sein, dafür AMD etwas günstiger. Das zumindest ist meine Spekulation.
Was sind das für Bezeichnungen? Du meinst RTX 3080, 3070, 3060.
 
@pipip Bin mir nicht sicher, wie genau du die Multi-Chip-Grafikkarte definierst. Auf der Folie sieht man definitiv einen Epyc mit je 4 MI100-Karten kommunizieren. Es sind also 4 Karten mit entsprechenden Links untereinander.

Deswegen nehme ich mal an, du meinst, dass jede der vier Karten aus Chiplets besteht. Wahrscheinlich aus 2 Chiplets, jedes davon entspricht einer MI50 (aber in CDNA). Fände ich zum jetzigen Zeitpunkt sehr ungewöhnlich, weil man das wohl schon früher hätte launchen können. Für "kleine" Chips war der Prozess ja schon 2018 ausgereift genug.

Ich sehe bisher noch keine Anzeichen für Chiplets bei GPUs. Kann mich natürlich auch irren...
 
Colindo
Es sind bsp 4 Grafikkarten pro Epyc die durch IF so agieren, als ob sie eine GPU wären.
Aber statt dass sie wie eine GPU nur maximal 32GB führen kann, wären es bei 4 Grafikkarten eben der Vierfache VRAM. Das möchte ich damit sagen.

Und es ist eine Vorstufe zu Chiplet-Design. Das ist die andere Aussage.
Die GPU sprechen direkt per IF-Connection. Socket to Socket. Nächster Schritt wäre dann eben Chip to Chip. Durch das APU Konzept von AMD letztens, wissen wir, dass GPUs mit HBM oben drauf in Zukunft existieren könnten und das dann als Chiplet.

Zurück zu der News hier. Meiner Meinung nach, will AMD günstige Beschleuniger Karten auf den Markt bringen, die gut skalieren.

Nehmen wir an, du hast ein Budget und es gehen sich zwei Ampre GPUs aus mit insgesamt zwei 48GB VRAM, als 96 GB.
Wie könnte AMD im Vergleich attraktiv sein ? Indem man um das selbe Geld zum Bsp 4 GPUS bekommt, mit jeweils 32GB VRAM, was aber insgesamt 128 GB ergibt.

Die Zahlen sind hierbei bewusst freigewählt und klein gehalten. Es soll nur als Bsp dienen.

Aber abwarten. Es ist wie gesagt, nur meine Vermutung. Ich bin einfach gespannt, wie AMD ihren Ansatz machen wird. Ich glaube nicht, dass man das direkt wie NV mit riesen großen Chips machen wird.
Und kleine Chips in großen Verbund, nur mit den Transistoren die für ML und Co gebraucht werden, hoch getaktet könnte in der Masse dann die geforderten 8bit an Operationen bringen. Klar Nachteil, man benötigt dann mehr GPUs natürlich ^^ Vorteil wieder mehr VRAM.

1596132616028.png

Siehe das Bild, Nur weil Epyc und 4 GPUs getrennte Hardware sind, heißt das nicht, dass deren Kommunikation am Ende trotzdem keine APU darstellt. Nur eben hier noch als Vorstufe zu dem hier:

1596132696368.png

https://www.pcgameshardware.de/CPU-CPU-154106/News/EHP-Exascale-APU-Navi-Zen-1221637/
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Kaerper, Onkel Föhn und Colindo
Zurück
Oben