Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsXbox Series X: Technische Details zur Zen-2-CPU und RDNA-2-GPU
Das ist ja das besagte Verhältnis: Eine CU kann 4 Texturen oder 4 BVH-Abfragen senden, jede "CU" hat also für sich selbst 4 TMUs.
Was im Übrigen in der Form noch ein Überbleibsel von GCN ist. Bei GCN können pro "CU" bis zu 4 Threads gleichzeitig laufen (4*Vec16-ALUs) und alle 4 Threads können zur selben Zeit ein Texel abfragen.
@Teralios Riesen Lob für die Beiträge! Hoch interessant und sogar verständlich. Solche Infos würden diesen Artikel hier mächtig aufwerten oder einen zukünftigen wo, nach RDNA2 release beide Ansätze mal verglichen werden.
Ah genau das wollte ich gerade noch ergänzend fragen, ob die TMUs fest an eine bestimmte CU gebunden sind^^
Mein Irrtum war, dass eine CU nur eine Anfrage an eine beliebige TMU senden kann. Wenn sie aber 4 senden kann und die TMUs dafür festgelegt sind, macht das ganze Sinn.
Dann sehe ich in der Praxis wirklich auch keinen großen Nachteil, denn ob die CU nun auf das Ergebnis einer TMU wartet oder ein SM auf das Ergebnis eines RT Cores wartet, läuft aufs gleiche raus, die CU/SM kann bei AMD und bei Nvidia keine Texturen bearbeiten, während sie auf das BVH Ergebnis wartet.
Wie ich den Artikel verstehe, wären nur nicht 2 Textur und 2 BVH Anfragen an die TMU gleichzeitig möglich, was laut dir aber in der Praxis sowieso idR nicht vorkommt.
Ah ok, dann ist es in der Praxis also egal ob die CU nur an den Texturen oder am RT arbeiten kann weil es idR. ohnehin nicht beides gleichzeitig gemacht wird?
Ah ok, dann ist es in der Praxis also egal ob die CU nur an den Texturen oder am RT arbeiten kann weil es idR. ohnehin nicht beides gleichzeitig gemacht wird?
"I think nVidia treats each bounce as a new ray, so they're potentially the same...
RDNA 2's RT units can handle 2x rays per cycle... which I think means two rays tested against two boxes per cycle... which is a rather simple test in hardware (A in C? A in D? B in C? B in D?)... That gives us 4 simple box tests per cycle with two rays per cycle, fitting with the specs like a glove (52 CUs * 2 rays * 2 boxes * 1.825GHz = 379.6G/sec box tests.. which we can round to 380 as Microsoft did).
The triangle rate is 1/4 the BVH rate and is 1:1 with CU count and frequency (52CUs * 1.825Ghz = 94.9Gigarays/sec peak). This is where the magic is happening... there must be a limit as to how many triangles a given ray can be tested against in a cycle... I'm wagering that the peak value here is for when a triangle encompasses an entire box and only one triangle is tested against one ray per cycle, which is the limit of the hardware - 1 triangle test per ray per cycle per CU, so a ray being tested against a box with 3 triangles will take up to 3 cycles to be tested (no need to continue testing once a hit is found)."
Man muss also zwischen Box tests und triangle rate unterscheiden. Im Prinzip sind auch GRays/sec relativ nichtssagend, da die Anzahl der Rays von vielen Faktoren abhängt (Geometrie, Oberfläche, bounces). Viel wichtiger sind die maximal möglichen "Strahlenkreuzungen" (Ray intersections) die berechnet werden können.
@Teralios Riesen Lob für die Beiträge! Hoch interessant und sogar verständlich. Solche Infos würden diesen Artikel hier mächtig aufwerten oder einen zukünftigen wo, nach RDNA2 release beide Ansätze mal verglichen werden.
Danke! Ich programmiere zwar keine "Engines", befasse mich aber immer gerne mit den Grundlagen und wie solche Sachen funktionieren und teste dann ein wenig. Bin eben ein Spielkind!
Ich fühl mich in Datenbanken und Datenstrukturen wohler.
ich glaub du hast nicht verstanden was was wir hinaus wollten.
und dein Argument macht auch keinen Sinn, denn es wird die gleiche Berechnung mit beiden Einheiten gemacht!
Da sich inzwischen geklärt hat das es ohnehin anders abläuft da die RT Cores lediglich eine Teilaufgabe übernehmen die auch bei AMDs Variante von einer FFU bearbeitet wird und die Effekt Berechnung weiterhin auf den Shadern läuft halte ich die Diskussion für hinfällig.
Leider kein AV1 Support. Das ist sehr schade, da die Konsole für mindestens sieben Jahre am Markt sein wird und die AV1 Verbreitung damit massiv behindern wird. Bleibt zu hoffen dass es bei PS 5 und den RDNA2 Karten besser aussehen wird.
Aus den weiteren Kommentaren entnehme ich, dass die Xbox im Worst Case der Auslegung die 3fache RT Leistung einer 2080Ti erreicht.
Was völlig okay wäre, wenn man bedenkt, dass die 3080Ti die 4-5fache Leistung einer 2080Ti in Minecraft RT haben soll, wenn ich mich recht erinnere^^ Damit läge man mit der RT Performance wohl auf dem Level einer 3070 oder 3080
Überschlägt man das dann noch auf die spekulierten 80 CUs des big Navi dürften sich beide Hersteller auf dem Gebiet nicht sonderlich viel nehmen. Da bin ich ja mal gespannt. ^^
Wobei dort auch vorgerechnet wurde, dass der Wert der Xbox durch spezielle HW Zusätze von Microsoft erreicht wurde und somit vmtl die 80CU RDNA2 die gleiche RT Leistung erreichen könnte.
Spieleentwicklungen sind so teuer geworden, dass für alle Plattformen gleichzeitig entwickelt wird. Der kleinste gemeinsame Nenner ist maßgebend. Der PC-User kann aufrüsten. Die Konsole nunmal nicht. Die HW ist also grob das was man als PC-User für die nächsten Jahre benötigt. Ein bischen Overhead für Windows kommt noch oben drauf.
Der größte Irrtum, der hier - aber auch im Internet - verbreitet ist, dass die "RT-Effekte" bei NVIDIA auf den RT-Cores berechnet wird, das ist aber falsch. Die Effekte an sich werden auch bei NVIDIA in der SM berechnet, das hat NVIDIA auch selbst recht klar kommuniziert.
Quelle? Ich sehe zum Beispiel bei der Erklärung zu Quake RTX folgendes.
YouTube
An dieser Stelle steht ein externer Inhalt von YouTube, der den Forumbeitrag ergänzt. Er kann mit einem Klick geladen und auch wieder ausgeblendet werden.
Wobei dort auch vorgerechnet wurde, dass der Wert der Xbox durch spezielle HW Zusätze von Microsoft erreicht wurde und somit vmtl die 80CU RDNA2 die gleiche RT Leistung erreichen könnte.
Und was kann man da ablesen?
Wenn ich raten müßte läuft die Strahlenverfolgung bei Pascal auf den normalen Shadern ab, bei Turing ohne RT Cores auf den Tensor Cores und mit RT Cores auf den FFUs.