Colindo schrieb:
Es müssen also auf allen Shadern einer Wave64er-Gruppe mit der gleichen Berechnung ausgeführt werden.
Die Wavefront kann Intel im Treiber - ähnlich NVIDIA - ja selbst bestimmen. AMD hat von Wave64 auf Wave32 umgestellt.
Bei RDNA war die Umstellung aber nicht der Hauptgrund, warum man plötzlich schneller war - der Umbau war ja damals beim Erscheinen noch in der Umsetzung, was ja auch die massiven Treiberprobleme damals erklärt.
Die Probleme GCN war eher, dass innerhalb einer CU nicht die vier Vec16 an einem Wave64-Befehl arbeiten konnten, sondern nur eine, wodurch man 4 Takte benötigte und ebenso, dass wirklich immer 4 Takte benötigt wurden. RDNA hat mit Vec32 die Zeit halbiert und gleichzeitig auch noch, dass ein Wave64 sogar in einem Takt läuft, sollten nur maximal 32 Werte kommen.
Aber, wo du mich daran erinnerst: Der Xe-Core hat 128 Shader, die sich auf 16 EU verteilt (256-Bit-SIMD). Frage ist, ob Intel es vorsieht, dass mehrere EUs an einem Thread arbeiten und wenn nicht, mit welcher Wavefront Intel wirklich im Treiber fährt. Sollte Intel ein ähnliches Problem wie AMD mit GCN haben, dann ist die Frage, was Intel in den nächsten Versionen macht.
Ich würde Intel noch nicht abschreiben. Intel hat sich in den letzten 2 Jahren einige gute Köpfe geholt für die GPU Entwicklung - neben Koduri. Der ist jetzt auch auf einem anderen Posten, in dem er mehr Verantwortung hat und gleichzeitig weniger direkt in die Entwicklung eingreifen kann.
Xe Alchemist wird nicht wirklich gut werden, aber wenn Intel dabei bleibt und sie die Architektur anpassen und verbessern, kann es durchaus was werden.