News AMD Radeon RX 6000: Navi 21 XT erhält große Vorschusslorbeeren

BlackRain85 schrieb:
Nun, nach diesem Diagramm (Link, Patent) sieht es für mich einfach nur so aus, als hätte man aufgrund besserer Latenzen und Annäherung zur CU ? den L1 zu L0 getauft usw.

https://www.freepatentsonline.com/20200293445.pdf
Ne - passt alles. Das ist der Aufbau wie bei RDNA. Sieh dir das Whitepaper an - dort ist recht ausführlich dargestellt. ES gibt L0, L1 und L2 cache auch schon bei RDNA1. Zusätzlich zu diesen gibt es noch den LDS, Instruction cache und ein paar andere mini-caches.
Und bei RDNA2 dürfte das ähnlich aussehen. Was sich geändert hat ist aber die Verschaltung zwischen den Caches.
Vor allem zwischen GCN und RDNA1 ist hier ein großer Schritt in der Art und Weise wie CU mit L0, L1, L2 cache communiziert.
Ergänzung ()

@Colindo:

AMD gibt im Whitepaper diverse Cache bandwidhts für RDNA und GCN5 (Vega) an. Siehe S21 Tabelle
L0 Bandwidth TB/s
9.76 vs 6.33
L1 Bandwidth TB/s
3.90 vs nA
L2 Bandwidth TB/s
1.95 vs 1.58
Total Cache Bandwidth TB/s
15.61 vs 7.91
Total Cache Bandwidth/FLOP
1.6 vs 0.625

Aber es ist nicht 100% ersichtlich wie sich diese ergeben. Man darf hier sicherlich den Takt nicht unterschlagen bei Vergleichen.
 
Colindo schrieb:
Der IC taktet übrigens mit dem GPU-Takt, steht auch auf der AMD-Seite.
Es fehlt auch noch ein Whitepaper für RDNA2.
OK das mit dem Takt hab ich mir schon gedacht, das Whitepaper erwarte ich sehnlichst ^^ :-).
 
  • Gefällt mir
Reaktionen: Colindo
Ok, also taktet er auch Dynamisch mit ? Falls ja, könnte der zu einem früheren Showstopper beim Übertakten sein/führen?!
So ne Größe an Cache benötigt dann eine eigene Spannung oder läuft über GPU Spannung ?
 
  • Gefällt mir
Reaktionen: Colindo
ich will mit dem Ding nicht minen sondern zocken. Wie schauts denn damit aus? So wie ich das sehe sind die Karten auch nicht schneller als die der Konkurrenz oder?

Leider gibt es immer noch keine geleakten Benchmarks, was meine Vermutung noch weiter untermauert.
Ich werde aber auf jeden Fall versuche eine 6800xt am Releasetag zu bekommen. Koste es was es wolle.
 
Hmmm, thema leaks...

https://www.techpowerup.com/274509/amd-radeon-rx-6800-and-rx-6800-xt-gpu-opencl-performance-leaks

https://game-debate.com/news/29774/...-3080-at-4k-but-worse-ray-tracing-performance

https://videocardz.com/newz/amd-radeon-rx-6800xt-alleged-3dmark-scores-hit-the-web

https://www.dsogaming.com/news/amd-...-ray-tracing-performance-benchmark-leaks-out/


Das schaut übrigens nach einem Interessanten Spiel aus.

Hier sieht man die Performance mit Aktiviertem VRS (min. 3:15)
 

Anhänge

  • Opera Momentaufnahme_2020-11-13_150448_www.youtube.com.png
    Opera Momentaufnahme_2020-11-13_150448_www.youtube.com.png
    615,7 KB · Aufrufe: 286
  • Gefällt mir
Reaktionen: pitu
BlackRain85 schrieb:
Das schaut übrigens nach einem Interessanten Spiel aus.
Jepp, sieht echt interessant aus.

Ich mag aber vor allem eine (eher allgemeine) Aussage:
Environment is fully dynamic and destructable. We don't use any fake Lightmaps for static objects.

Genau das ist einer der großen Vorteile von Raytracing. Man kann die Umgebung viel dynamischer gestalten, weil man Licht, Schatten und Spiegelungen nicht mehr faken muss.
 
BlackRain85 schrieb:
Hmmm, thema leaks...
ich hatte mich falsch ausgedrückt. Ich vermisse Spielebenchmarks.
Trotzdem danke für deine Mühe.

Zu der Spieledemo fällt mir nur eins ein. Der Hersteller scheint sehr viel Wert auf Feinheiten, wie diese tollen Lichteffekte zu legen - bzw. AMD hat ihn darauf angesetzt - im Grunde braucht die aber kein Mensch.

Die Animationen der Spielfigur sehen allerdings fürchterlich aus.
 
Zuletzt bearbeitet:
Der IC taktet mit der InfinityFabric, wie es aussieht. Die offiziellen Daten auf der AMD-Webseite sprechen von durchschnittlich 1900 MHz. Kann also gut sein, dass der Cache-Takt sogar mit dem GPU-Takt hochgeht. In jedem Fall verstehst du richtig, dass AMD angibt, dass die IC-Geschwindigkeit nach Bedarf gesteigert werden kann.
 
Colindo schrieb:
Der IC taktet mit der InfinityFabric, wie es aussieht. Die offiziellen Daten auf der AMD-Webseite sprechen von durchschnittlich 1900 MHz. Kann also gut sein, dass der Cache-Takt sogar mit dem GPU-Takt hochgeht. In jedem Fall verstehst du richtig, dass AMD angibt, dass die IC-Geschwindigkeit nach Bedarf gesteigert werden kann.

Gut, also um das jetzt für mich nur Glas klar zu machen. RDNA 2 besitzt eine Infinity Fabric die nun mit dem Infinity Cache Synchron ist. Diese wiederum sind unabhängig vom GPU Takt selbst aber trotzdem Verknüpft wahrscheinlich durch einen Dynamischen takt Teiler. Nur so könnte ich mir die Verknüpfung des IC an IF und GPU Takt vorstellen. Wenn das so stimmt...
 
  • Gefällt mir
Reaktionen: Colindo
Ich warte noch gespannt auf das Whitepaper, dann wird hoffentlich vieles klarer.
Ergänzung ()

@Teralios Hast du schon das CDNA-Whitepaper gesehen? Muss ich mir heute Abend mal anschauen. Oder in der Mittagspause...
Wenn doch nur das von RDNA2 schon verfügbar wäre!
 
@Colindo
ne, aktuell halt ich mal Ruhe ein. ;)

Was ich da aber interasannt finde ist, dass RDNA-Anleihen auch nach CDNA geflossen sind scheinnbar, wenn man mal auf den Aufbau der CU achtet. Nett.
 
  • Gefällt mir
Reaktionen: Colindo
Ja, CDNA hat eine IF. RDNA2 sicherlich auch.
Schön, wenn so eine Matrix SIMD Potent genug ist, dann könnte ich mir vorstellen, dass in RDNA3 (Chiplet Design?) ein paar davon mit drauf gepackt werden. zB für Super Resolution.

Ich könnte mir sogar eine eigene Produktlinie vorstellen, in kleinerem stil als die M100. Die macht dann das KI Upscaling gg Wenn die Software Entwickler das immer mehr nutzen, könnte ich mir für 100 - 200 Dollar so ne "Expansion" Card vorstellen. Voraussetzung eben, dass die dann auch für viele andere dinge Missbraucht werden kann.
 
Teralios schrieb:
Was ich da aber interasannt finde ist, dass RDNA-Anleihen auch nach CDNA geflossen sind scheinnbar, wenn man mal auf den Aufbau der CU achtet. Nett.
Also ich sehe keine Dual CU, oder was meinst du? :D

Mir ist bisher nur aufgefallen, dass AMD mit bf16 ein Format analog zu Nvidias TF32 hat. Nur mit ehrlicherem Namen.
Ergänzung ()

@BlackRain85 Ja, es scheint ein Äquivalent zu Tensor-Cores zu geben, aber wie genau das funktioniert ist noch nicht ersichtlich.

Auch halte ich Extension Cards für extrem unwahrscheinlich, da die Kommunikation mit den Shadern zu langsam wäre. Das muss direkt in die CUs integriert werden.
 
Colindo schrieb:
Also ich sehe keine Dual CU, oder was meinst du?
Ja und nein.

Ja, es sind keine Dual-CU alias WGP, aber sie haben die 4 * Vec16 anders angeordnet, wenn man nach dem Bild geht. Geh mal auf Seite 6. Dann sieh dir mal den Aufbau einer WGP an und dann vergleich das mal mit dem bisherigen Aufbau einer CU bei Vega (Seite 8).
Ich setz es mal Schematisch in der Tabelle um:

CU - CDNAWGP - RDNACU - GCN(bis Vega)
Vec16
Vec16
LDSVec16
Vec16
Vec32
Vec32
LDSVec32
Vec32
LDSVec16
Vec16
Vec16
Vec16

Auch wenn es keine Dual-CU alias WGP ist, hat man denoch die Struktur der WGP übernommen!
 
  • Gefällt mir
Reaktionen: Colindo
Mit der Kommunikation sollte eine Lösung gefunden werden. Eine Schnittstelle zur IF löst das Problem nicht oder ? So wie beim Zen, ja da ist die IF extern, klar aber irgendwie in diese richtung. Dann kann man die Tensor Äquivalente separat auf ein Package packen. Und die R&D Geschwindigkeit unabhängig von der GPU selbst halten.

Klar, ich spinn ja nur rum, wegen den Expansion Cards. Aber wenn zB es in einem Chiplet Design separiert werden würde, wäre eine Expansioncard auch nicht mehr so abwegig.
 
Colindo schrieb:
Ja, es scheint ein Äquivalent zu Tensor-Cores zu geben, aber wie genau das funktioniert ist noch nicht ersichtlich.
Man muss in dem Fall ja keinen eigenen Tensor-Core entwickeln.

AMD arbeitet ja eh mit Vec16-ALUs, einen »Tensor-Pfad« hinzufügen ist da nicht mal so schwer. AMD hat ja mit den Vector-ALUs durchaus eine recht gute Grundlage, die man erweitern kann.

Hat halt aber dann den Nachteil, dass man nur »eine« Sache auf einmal machen kann, gleichzeitig, wir beide wissen es ja: So parallel wird das alles ja nicht genutzt. ;)
 
  • Gefällt mir
Reaktionen: Colindo
Zurück
Oben