hab aus spass mal kurz die leistungsfähigkeit der ALUs bei Single-Precision verglichen:
Eine RX 580 schafft mit 2304 ALUs @ 1340 MHz (Boost) eine Rechenleistung von 6175 GFLOPS
=> (6175e9 FLOP) / (2304 * 1340e6) = 2
=> eine ALU schafft pro Taktzyklus 2 FLOP
Eine X1950 XTX schafft mit 48 ALUs @ 650 MHz eine Rechenleistung von 375 GFLOPS
=> (375e9 FLOP) / (48 * 650e6) = 12
=> eine ALU schafft pro Taktzyklus 12 FLOP
Oder anders gesagt: wenn man damals im Jahr 2006 einen Chip mit der Architektur einer X 1950 XTX bauen hätte wollen, der die SP-Rechenleistung einer RX 580 hat, dann hätte man statt 48 ALUs ganze 792 ALUs verbauen müssen, wenn man den Takt der X1950 XTX von 650 MHz zugrunde legt. Der ALU-bereich dieses hypothetischen chips wäre dann gut 16 mal so groß wie der ALU-bereich des historischen X1950 XTX chips.
laut wikipedia hat der RV580+ chip der X1950XTX eine Fläche von 352mm², was im quadratfall knapp 1,9 cm seitenlänge entspricht. ich habe keine ahnung, wie viel von den 352mm² von den ALUs belegt werden, aber wenn wir mal davon ausgehen, dass abzüglich speichercontroller, cache, video-decoder usw. usf. noch 200mm² übrig bleiben, die auf die ALUs entfallen, dann hat eine ALU dieser architektur in diesem fertigungsprozess eine Größe von ca. 4mm². Mit 792 ALUs kommt man dann auf eine Chipgröße von mehr als 3200mm², was wiederum im quadratfall einer seitenlänge von mehr als 5,6cm entspricht.
zum vergleich: der Polaris 20 chip der RX580 kommt auf 232mm²
nur mal so als vergleich