News AMD Radeon RX 6000: Navi 21 XT erhält große Vorschusslorbeeren

Iscaran · 12. November 2020

BlackRain85 schrieb:
Nun, nach diesem Diagramm (Link, Patent) sieht es für mich einfach nur so aus, als hätte man aufgrund besserer Latenzen und Annäherung zur CU ? den L1 zu L0 getauft usw.

https://www.freepatentsonline.com/20200293445.pdf

Ne - passt alles. Das ist der Aufbau wie bei RDNA. Sieh dir das Whitepaper an - dort ist recht ausführlich dargestellt. ES gibt L0, L1 und L2 cache auch schon bei RDNA1. Zusätzlich zu diesen gibt es noch den LDS, Instruction cache und ein paar andere mini-caches.
Und bei RDNA2 dürfte das ähnlich aussehen. Was sich geändert hat ist aber die Verschaltung zwischen den Caches.
Vor allem zwischen GCN und RDNA1 ist hier ein großer Schritt in der Art und Weise wie CU mit L0, L1, L2 cache communiziert.

Ergänzung (12. November 2020)

@Colindo:

AMD gibt im Whitepaper diverse Cache bandwidhts für RDNA und GCN5 (Vega) an. Siehe S21 Tabelle
L0 Bandwidth TB/s
9.76 vs 6.33
L1 Bandwidth TB/s
3.90 vs nA
L2 Bandwidth TB/s
1.95 vs 1.58
Total Cache Bandwidth TB/s
15.61 vs 7.91
Total Cache Bandwidth/FLOP
1.6 vs 0.625

Aber es ist nicht 100% ersichtlich wie sich diese ergeben. Man darf hier sicherlich den Takt nicht unterschlagen bei Vergleichen.

Colindo · 12. November 2020

Die Tabelle kenne ich. Der IC taktet übrigens mit dem GPU-Takt, steht auch auf der AMD-Seite. Wie gesagt, vielleicht gibt es demnächst noch mehr Details dazu.

Es fehlt auch noch ein Whitepaper für RDNA2.

Iscaran · 12. November 2020

Colindo schrieb:
Der IC taktet übrigens mit dem GPU-Takt, steht auch auf der AMD-Seite.
Es fehlt auch noch ein Whitepaper für RDNA2.

OK das mit dem Takt hab ich mir schon gedacht, das Whitepaper erwarte ich sehnlichst ^^ :-).

BlackRain85 · 12. November 2020

Ok, also taktet er auch Dynamisch mit ? Falls ja, könnte der zu einem früheren Showstopper beim Übertakten sein/führen?!
So ne Größe an Cache benötigt dann eine eigene Spannung oder läuft über GPU Spannung ?

foo_1337 · 13. November 2020

Die Mining Performance war wohl Fake

https://twitter.com/kopite7kimi/status/1327125321422868480

BlackRain85 · 13. November 2020

Das kommt doch auf den zu minenden coin an. monero mining sollte vom IC massiv profitieren, der rest eher nicht.

pitu · 13. November 2020

ich will mit dem Ding nicht minen sondern zocken. Wie schauts denn damit aus? So wie ich das sehe sind die Karten auch nicht schneller als die der Konkurrenz oder?

Leider gibt es immer noch keine geleakten Benchmarks, was meine Vermutung noch weiter untermauert.
Ich werde aber auf jeden Fall versuche eine 6800xt am Releasetag zu bekommen. Koste es was es wolle.

BlackRain85 · 13. November 2020

Hmmm, thema leaks...

https://www.techpowerup.com/274509/amd-radeon-rx-6800-and-rx-6800-xt-gpu-opencl-performance-leaks

https://game-debate.com/news/29774/...-3080-at-4k-but-worse-ray-tracing-performance

https://videocardz.com/newz/amd-radeon-rx-6800xt-alleged-3dmark-scores-hit-the-web

https://www.dsogaming.com/news/amd-...-ray-tracing-performance-benchmark-leaks-out/

Das schaut übrigens nach einem Interessanten Spiel aus.

Hier sieht man die Performance mit Aktiviertem VRS (min. 3:15)

Jesterfox · 13. November 2020

BlackRain85 schrieb:
Das schaut übrigens nach einem Interessanten Spiel aus.

Jepp, sieht echt interessant aus.

Ich mag aber vor allem eine (eher allgemeine) Aussage:

Environment is fully dynamic and destructable. We don't use any fake Lightmaps for static objects.

Genau das ist einer der großen Vorteile von Raytracing. Man kann die Umgebung viel dynamischer gestalten, weil man Licht, Schatten und Spiegelungen nicht mehr faken muss.

pitu · 13. November 2020

BlackRain85 schrieb:
Hmmm, thema leaks...

ich hatte mich falsch ausgedrückt. Ich vermisse Spielebenchmarks.
Trotzdem danke für deine Mühe.

Zu der Spieledemo fällt mir nur eins ein. Der Hersteller scheint sehr viel Wert auf Feinheiten, wie diese tollen Lichteffekte zu legen - bzw. AMD hat ihn darauf angesetzt - im Grunde braucht die aber kein Mensch.

Die Animationen der Spielfigur sehen allerdings fürchterlich aus.

BlackRain85 · 18. November 2020

https://videocardz.com/newz/amd-radeon-rx-6800-launch-press-deck-transcript

@Colindo

Verstehe ich das nun richtig, dass der IC geboostet werden kann bei bedarf ?

Colindo · 18. November 2020

Der IC taktet mit der InfinityFabric, wie es aussieht. Die offiziellen Daten auf der AMD-Webseite sprechen von durchschnittlich 1900 MHz. Kann also gut sein, dass der Cache-Takt sogar mit dem GPU-Takt hochgeht. In jedem Fall verstehst du richtig, dass AMD angibt, dass die IC-Geschwindigkeit nach Bedarf gesteigert werden kann.

BlackRain85 · 18. November 2020

Colindo schrieb:
Der IC taktet mit der InfinityFabric, wie es aussieht. Die offiziellen Daten auf der AMD-Webseite sprechen von durchschnittlich 1900 MHz. Kann also gut sein, dass der Cache-Takt sogar mit dem GPU-Takt hochgeht. In jedem Fall verstehst du richtig, dass AMD angibt, dass die IC-Geschwindigkeit nach Bedarf gesteigert werden kann.

Gut, also um das jetzt für mich nur Glas klar zu machen. RDNA 2 besitzt eine Infinity Fabric die nun mit dem Infinity Cache Synchron ist. Diese wiederum sind unabhängig vom GPU Takt selbst aber trotzdem Verknüpft wahrscheinlich durch einen Dynamischen takt Teiler. Nur so könnte ich mir die Verknüpfung des IC an IF und GPU Takt vorstellen. Wenn das so stimmt...

Colindo · 18. November 2020

Ich warte noch gespannt auf das Whitepaper, dann wird hoffentlich vieles klarer.

Ergänzung (18. November 2020)

@Teralios Hast du schon das CDNA-Whitepaper gesehen? Muss ich mir heute Abend mal anschauen. Oder in der Mittagspause...
Wenn doch nur das von RDNA2 schon verfügbar wäre!

Teralios · 18. November 2020

@Colindo
ne, aktuell halt ich mal Ruhe ein.

Was ich da aber interasannt finde ist, dass RDNA-Anleihen auch nach CDNA geflossen sind scheinnbar, wenn man mal auf den Aufbau der CU achtet. Nett.

BlackRain85 · 18. November 2020

Ja, CDNA hat eine IF. RDNA2 sicherlich auch.
Schön, wenn so eine Matrix SIMD Potent genug ist, dann könnte ich mir vorstellen, dass in RDNA3 (Chiplet Design?) ein paar davon mit drauf gepackt werden. zB für Super Resolution.

Ich könnte mir sogar eine eigene Produktlinie vorstellen, in kleinerem stil als die M100. Die macht dann das KI Upscaling gg Wenn die Software Entwickler das immer mehr nutzen, könnte ich mir für 100 - 200 Dollar so ne "Expansion" Card vorstellen. Voraussetzung eben, dass die dann auch für viele andere dinge Missbraucht werden kann.

Colindo · 18. November 2020

Teralios schrieb:
Was ich da aber interasannt finde ist, dass RDNA-Anleihen auch nach CDNA geflossen sind scheinnbar, wenn man mal auf den Aufbau der CU achtet. Nett.

Also ich sehe keine Dual CU, oder was meinst du?

Mir ist bisher nur aufgefallen, dass AMD mit bf16 ein Format analog zu Nvidias TF32 hat. Nur mit ehrlicherem Namen.

Ergänzung (18. November 2020)

@BlackRain85 Ja, es scheint ein Äquivalent zu Tensor-Cores zu geben, aber wie genau das funktioniert ist noch nicht ersichtlich.

Auch halte ich Extension Cards für extrem unwahrscheinlich, da die Kommunikation mit den Shadern zu langsam wäre. Das muss direkt in die CUs integriert werden.

Teralios · 18. November 2020

Colindo schrieb:
Also ich sehe keine Dual CU, oder was meinst du?

Ja und nein.

Ja, es sind keine Dual-CU alias WGP, aber sie haben die 4 * Vec16 anders angeordnet, wenn man nach dem Bild geht. Geh mal auf Seite 6. Dann sieh dir mal den Aufbau einer WGP an und dann vergleich das mal mit dem bisherigen Aufbau einer CU bei Vega (Seite 8).
Ich setz es mal Schematisch in der Tabelle um:

CU - CDNA			WGP - RDNA			CU - GCN(bis Vega)
Vec16 Vec16	LDS	Vec16 Vec16	Vec32 Vec32	LDS	Vec32 Vec32	LDS	Vec16 Vec16	Vec16 Vec16

Auch wenn es keine Dual-CU alias WGP ist, hat man denoch die Struktur der WGP übernommen!

BlackRain85 · 18. November 2020

Mit der Kommunikation sollte eine Lösung gefunden werden. Eine Schnittstelle zur IF löst das Problem nicht oder ? So wie beim Zen, ja da ist die IF extern, klar aber irgendwie in diese richtung. Dann kann man die Tensor Äquivalente separat auf ein Package packen. Und die R&D Geschwindigkeit unabhängig von der GPU selbst halten.

Klar, ich spinn ja nur rum, wegen den Expansion Cards. Aber wenn zB es in einem Chiplet Design separiert werden würde, wäre eine Expansioncard auch nicht mehr so abwegig.

Teralios · 18. November 2020

Colindo schrieb:
Ja, es scheint ein Äquivalent zu Tensor-Cores zu geben, aber wie genau das funktioniert ist noch nicht ersichtlich.

Man muss in dem Fall ja keinen eigenen Tensor-Core entwickeln.

AMD arbeitet ja eh mit Vec16-ALUs, einen »Tensor-Pfad« hinzufügen ist da nicht mal so schwer. AMD hat ja mit den Vector-ALUs durchaus eine recht gute Grundlage, die man erweitern kann.

Hat halt aber dann den Nachteil, dass man nur »eine« Sache auf einmal machen kann, gleichzeitig, wir beide wissen es ja: So parallel wird das alles ja nicht genutzt.

News AMD Radeon RX 6000: Navi 21 XT erhält große Vorschusslorbeeren

Captain

Redakteur

Captain

Ensign

foo_1337

Gast

Ensign

Fleet Admiral

Ensign

Anhänge

Legende

Fleet Admiral

Ensign

Anhänge

Redakteur

Ensign

Redakteur

Teralios

Gast

Ensign

Redakteur

Teralios

Gast

Ensign

Teralios

Gast

Ähnliche Themen