Intel Arc A380 („Alchemist“): Erste Benchmarks im Vergleich mit Ampere, Turing und Navi

Sven Bauduin
117 Kommentare
Intel Arc A380 („Alchemist“): Erste Benchmarks im Vergleich mit Ampere, Turing und Navi
Bild: Intel

Das Softwarehaus SiSoftware hat erste GP-GPU- und OpenCL-Benchmarks einer Intel Arc A380 im Vergleich mit Ampere, Turing und Navi veröffentlicht. In den Bereichen Vektorisierung, Kryptographie, Hashfunktionen, Bildverarbeitung und wissenschaftlicher Analyse musste sich die kleine Alchemist dabei beweisen.

Intel Arc vs. RDNA 2 vs. Ampere vs. Turing

Dem voraussichtlich kleinsten Ableger auf Basis der neuen Alchemist-Architektur mit Xe-Cores, der Intel Arc A380 mit 128 Execution Units und 1.024 ALUs sowie einem mit 96-Bit (192 GB/s) angebundenen 6 GB großen GDDR6-Grafikspeicher, standen dabei eine Nvidia GeForce RTX 3050 und Nvidia GeForce GTX 1660 Ti aus der Generation Ampere und Turing sowie eine AMD Radeon RX 6500 XT mit Navi 24 gegenüber.

Intel Arc A380* AMD Radeon RX 6500 XT Nvidia GeForce RTX 3050 Nvidia GeForce GTX 1660 Ti
Node TSMC N6 TSMC N6 Samsung 8 nm TSMC 12 nm
Architektur Alchemist RDNA 2 Ampere Turing
Grafikprozessor DG2-128EU Navi 24 GA106 TU116
FP32-ALUs 1.024 1.024 1.280 1.536
Speicher 6 GB GDDR6
@96-Bit (192 GB/s)
4 GB GDDR6
@64-Bit (144 GB/s)
8 GB GDDR6
@128-Bit (224 GB/s)
6 GB GDDR6
@192-Bit (288 GB/s)
TDP/TBP 75 Watt 107 Watt 130 Watt 120 Watt
*) Quelle: SiSoftware

Intel geht also mit der Grafikkarte mit der geringsten Leistungsaufnahme von 75 Watt in die insgesamt sieben Benchmarks von SiSoftware.

SiSoftware – GPGPU-/OpenCL-Benchmarks
  • Hashing GPGPU
  • Vectorised GPGPU
  • Cryptography GPGPU
  • Financial Analysis GPGPU
  • Memory Bandwidth GPGPU
  • Scientific Analysis GPGPU
  • Image Processing GPGPU

Die Benchmarks wurden auf einem System mit Windows 10 x64 und dem neuesten Intel-Grafiktreiber v30.0.101.1340 vom 8. Februar durchgeführt.

Vectorised GPGPU
Vectorised GPGPU (Bild: SiSoftware)

Insbesondere im emulierten FP128 weiß die Intel Arc A380 zu überzeugen und erreicht beinahe die dreifache Leistung der Gegenspieler auf Basis von Ampere und Turing. Während Alchemist mit FP16 einen Rückstand von rund 17 Prozent auf Ampere aufweist, kann sie diese mit FP64 deutlich auf Distanz halten (+22 Prozent).

Cryptography GPGPU
Cryptography GPGPU (Bild: SiSoftware)

In Sachen Berechnung von Kryptographie mittels AES-128 und AES-256 zeichnet Alchemist aktuell noch ein sehr düsteres Bild und landet weit abgeschlagen auf dem letzten Platz. Ampere ist in dieser Disziplin bis zu fünfmal schneller unterwegs und auch die Radeon RX 6500 XT ist hier um den Faktor 4 schneller.

Hashing GPGPU
Hashing GPGPU (Bild: SiSoftware)

In Sachen Hashfunktionen mittels GPGPU und SHA1 sowie SHA2 zeigt sich die Intel Arc A380 absolut konkurrenzfähig und liegt auf Augenhöhe mit dem AMD Navi 24 und dem GA106-Grafikprozessor von Nvidia. Die mit Abstand schnellste Grafikkarte in diesem Benchmark ist die GeForce GTX 1660 Ti.

Financial Analysis GPGPU
Financial Analysis GPGPU (Bild: SiSoftware)

Im Bereich der Finanzanalyse mit FP16 und FP32 beträgt der Rückstand der Intel Arc A380 auf die Ampere-Grafikkarte an Spitze zwischen 32 und 48 Prozent. Der Radeon RX 6500 XT kann Alchemist in diesem Bereich allerdings durchaus das Wasser reichen.

Scientifiy Analysis GPGPU
Scientifiy Analysis GPGPU (Bild: SiSoftware)

Während die Intel Arc A380 in Sachen wissenschaftlicher Analyse mit FP16 ein sehr gutes Ergebnis gegenüber Ampere, Turing und Navi erzielt, muss sie sich mit FP32 gemeinsam mit Navi die hinteren Plätze teilen. Hier können Intels XMX-Kerne, die das Pendant zu Nvidias Tensor-Kernen sind, bei entsprechender Optimierung aber noch einiges an Leistung herausholen, wie SiSoftware anmerkt.

Image Processing GPGPU
Image Processing GPGPU (Bild: SiSoftware)

In Sachen Bildverarbeitung mittels OpenCL kann es die Alchemist-Architektur durchaus mit RDNA 2 aufnehmen und schlägt die Radeon RX 6500 XT in den meisten Benchmarks sogar. Nvidia bleibt aber mit Ampere und Turing außer Reichweite.

Memory Bandwidth GPGPU
Memory Bandwidth GPGPU (Bild: SiSoftware)

Auch im Bereich der Speicherbandbreite positioniert sich die Intel Arc A380 im Mittelfeld und kann die Radeon RX 6500 XT hinter sich lassen, während sowohl die GeForce RTX 3050 als auch die GeForce GTX 1660 Ti durch ihr breiteres Speicherinterface in diesem Bereich klar dominieren.

CUDA schlägt OpenCL in allen Bereichen

Wie die Tester von SiSoftware abschließend feststellen, ist es insbesondere im GPGPU-Bereich für Nvidia dank CUDA problemlos möglich, die Konkurrenz von AMD und Intel in den Schatten zu stellen.

Nvidia has nothing to worry about – here we’ve tested low-end – and despite being more expensive it is definitely worth it. CUDA performance is the most consistent and even the “old” Turing has no problem dispatching both Intel ARC and AMD Navi competition.

SiSoftware

Der Intel Arc A380 stellen die Tester ein ordentliches Zeugnis für deren OpenCL-Leistung in den GPGPU-Benchmarks aus, die sich durch eine entsprechende Treiber-Optimierung und eine bessere Ausnutzung der XMX-Kerne noch verbessern dürfte. Ein Nvidia- oder AMD-Killer sei die Alchemist-Architektur mit ihren Xe-Kernen indes nicht.

Still the A380 is competitive and should improve with drivers and optimisations. Tensor (matrix multiplier) support should improve performance. Perhaps it was too much to expect a nVidia/AMD killer – but all in all it is a decent effort.

SiSoftware
Spekulierte Spezifikationen zu Intels diskreten Xe-Grafiklösungen
Intel DG2
Node TSMC N6
Architektur Intel Gen 12 alias Xe („Alchemist“)
Grafikprozessor DG2-128EU DG2-384EU DG2-512EU
Execution Units (EU) 96 128* 192 256 384* 512*
ALUs (EU × 8) 768 1.024 1.536 2.048 3.072 4.096
Speicher 4 GB 6 GB 6/12 GB 8/16 GB
Speicherinterface 64 Bit 96 Bit 128 Bit 192 Bit 256 Bit
*inzwischen von Intel bestätigt
Mehr zum Thema