GTC 2021

Nvidia A30 und A10: Neue Beschleuniger mit Ampere-Architektur für Server

12.4.2021 19:00 Uhr

Bild: Nvidia

Nvidia erweitert zur GTC das Aufgebot an KI-Beschleunigern um den A30 und A10 auf Basis der Ampere-Architektur. Die passiv gekühlten Karten sind für Server vorgesehen und sollen demnächst von namhaften Anbietern zur Auswahl stehen. Bei Nvidia selbst können Interessenten den DGX A100 mit vier A100-GPUs künftig monatlich mieten.

Das Ampere-Portfolio für Datacenter, Server und Workstations nimmt zur GTC eine neue Form an und besteht künftig aus zwei weiteren Beschleunigern für die Mittelklasse und Einsteiger. Während die A100-GPU in gleich vierfacher Ausführung in den Modulen fürs Datacenter sowie in Workstations wie der DGX A100 von Nvidia die Speerspitze markiert, gab es bislang zusätzlich die A40 als passive Karte für Server und die RTX A6000 als aktiv gekühlte Lösung für Workstations jeweils mit GA102-GPU.

Ebenfalls auf der Ampere-Architektur basierend kommen jetzt die A30 und A10 als kleinere passive Lösungen für Server hinzu, die später im Jahr von entsprechenden Anbietern in ihren Servern zur Auswahl stehen werden. Zur GTC hat Nvidia noch keinen konkreten Termin für die beiden Karten genannt.

A30 kommt mit 24 GB HBM2

Auf welchen GPUs A30 und A10 basieren, geht aus den bisher veröffentlichten Unterlagen nicht direkt hervor, jedoch lässt sich anhand des verwendeten Speichers eine Zugehörigkeit zu grundsätzlich zwei verschiedenen Klassen erkennen. A30 nutzt 24 GB HBM2 und ist damit eher der Liga einer A100 zuzuordnen, wenngleich weniger Leistung vorliegt, genauer gesagt etwa die Hälfte. Die A100 kommt zudem mit 40 GB HBM2 und eine Variante mit 80 GB HBM2e wird ebenfalls angeboten. Die A30 liefert laut Nvidia 10,3 TFLOPS an FP32-Leistung, während die A100 auf 19,5 TFLOPS kommt. FP64 wird weiterhin unterstützt und kommt auf 5,2 TFLOPS statt 9,7 TFLOPS.

Nvidia A30 (l.) und A10 (r.) im Vergleich (Bild: Nvidia)

A10 nutzt GDDR6

Bei der A10 sind hingegen 24 GB GDDR6 verbaut, die auch bei der A40 zum Einsatz kommen, dort allerdings mit 48 GB. Die Leistungsangaben für die A10 fallen allgemein niedriger aus, wenngleich für FP32 hohe 31,2 TFLOPS genannt werden. Die Angaben sind vermutlich nicht direkt miteinander vergleichbar, zumal Nvidia für beide Varianten bisher nur unvollständige Details nennt. Für die A10 liegt zum Beispiel die Angabe von 72 RT-Cores vor, bei der A30 fehlt diese hingegen. Ersichtlich wird aus den Spezifikationen aber, dass die A30 NVLink für die Multi-GPU-Kommunikation unterstützt, die A10 jedoch nicht. Und auch Multi-GPU-Instanzen auf nur einer GPU sind nur mit der A30 möglich, wobei bis zu vier Instanzen mit jeweils 6 GB HBM2 möglich sind.

Nvidia bietet DGX A100 zur Miete an

Mit den neuen Beschleunigern will Nvidia das EGX-Ökosystem ausbauen. Unter EGX laufen die Systeme der Partner, während Nvidias eigene Produkte unter DGX laufen. Die Workstation DGX A100, die mit vier A100-GPUs (à 80 GB HMB2e), AMD Epyc 7742, bis zu 512 GB Arbeitsspeicher, einer 1,92 TB großen NVMe-SSD für das Betriebssystem und bis zu 7,68 TB SSD-Speicher mit U.2-Anbindung als Datencache ausgerüstet ist, lässt sich jetzt auch für monatlich 9.000 US-Dollar bei Nvidia mieten. Bisher wurde das System nur zum Kauf oder mit Leasingvertrag angeboten. Der offizielle Verkaufspreis einer DGX A100 Workstation liegt bei 149.000 US-Dollar, sodass sich das Mietmodell potenziell bei einer kürzeren Nutzungszeit lohnt. Im DGX SuperPod bietet Nvidia neuerdings ebenfalls die A100-GPU mit 80 GB HBM2e statt 40 GB HBM2 an und hat die Data Processing Unit (DPU) auf BlueField-2 umgestellt.

ComputerBase hat Informationen zu diesem Artikel von Nvidia unter NDA erhalten. Die einzige Vorgabe war der frühest mögliche Veröffentlichungszeitpunkt.

CB-Funk Podcast #101: Der Test zur GeForce RTX 5090 aus Fabians und Jans Mund mit Fabian und Jan-Frederik