bhg1991 schrieb:
Also der mittlere Abschnitt der News hat bei mir schon die nötige Verwirrung ausgelöst
Meinst du den 1.1 Teil?
Die PS4 nutzt ebenfalls GCN 1.1. Mit effektiverem GPU Computing ist dabei eine deutlich höhere Zahl an sogenannten Asnchronous Compute Engines mit jeweils bis zu acht parallelen Compute Queues gemeint. Die PS4 besitzt 8 ACEs mit insgesamt 64 Queues, ein Kaveri besitzt 4 ACEs mit 32 Queues. Eventuell darf man annehmen, dass sich die Anzahl der ACEs zumindest in den HSA Prozessoren an der Anzahl der x86 Kerne orientiert.
Der Vorteil dieser ACEs ist, dass sie GPU Computing ermöglichen, ohne dabei die Compute Pipeline im Command Processor zu beanspruchen. Dieser kann nämlich entweder nur Rendern oder Computen. Mit solchen ACEs kann man beides. Je mehr ACEs in der GPU verbaut sind, desto mehr Compute Jobs können gleichzeitig ausgeführt werden. Eine PS4 wird dementsprechend acht Jobs gleichzeitig erledigen können, ein Kaveri vier Jobs. Eine HD7970 mit GCN 1.0 ISA wird beispielsweise nur zwei Jobs gleichzeitig erledigen. Die Anzahl der Compute Queues soll sich dabei positiv auf den Auslastungsgrad der GPU auswirken: Je mehr Queues verfügbar sind, desto mehr Compute Kernel können gleichzeitig auf ihren Einsatz warten.
PS4 Systemarchitekt Mark Cerny beschreibt diese Art des GPU Computings als "asynchronous fine-grain compute" und beansprucht, dass dieses Konzept der Zusammenarbeit von Sony und AMD entstammt. Er behauptet sogar, dass dadurch GPGPU in Videospielen auf einer einzigen GPU möglich sei, ohne das dabei die Rendering Performance negativ beeinflusst werden wird, da die ACEs mit den bis zu 64 wartenden Kerneln immer nur die "Löcher stopfen", die beim Rendering entstehen.
Man kann sich das stark abstrahiert ein wenig so vorstellen wie beim Mobile Game "Bubble Totem": Die Kanone ist so eine ACE und hat insgesamt zwei Queues (zwei Bubbles [= Compute Kernel] die man wechseln kann). Ziel ist es, diese Compute Kernel in die GPU zu verschießen, ohne dabei eine unnötige Last für die Grafikleistung zu erzeugen. Im Falle von GCN 1.1 hat man aber wie bei der PS4 acht dieser Kanonen gleichzeitig zur Verfügung und jede der acht Kanonen kann aus acht verschiedenen Bubbles wählen. Dementsprechend kann eine PS4 mit viel höherer Effizienz vorgehen, nicht nur weil sie viel mehr Bubbles gleichzeitig verschießen kann, sondern auch weil sie aus ihren Queues immer die passende Bubble auswählen kann.
pmkrefeld schrieb:
Könnte ja sein, dass AMD dann die gleiche Schiene fährt wie nVIDIA mit der Titan.
Bei Nvidia nennt sich dieses System übrigens Hyper-Q. Eine Geforce Titan verfügt über 32 Compute Queues (die Hälfte einer PS4). Wie viele ACEs die hat weiß ich aber nicht.