News AMD Alveo MA35D: Beschleuniger mit ASIC für AV1, H.265, H.264 und VP9

Kaito Kariheddo

Redakteur
Teammitglied
Registriert
Dez. 2021
Beiträge
653
Videos encodieren können Consumer-Grafikkarten schon lange. Seit der neusten Generation wird sogar der AV1-Codec unterstützt. Die Ausgabe eines Streams mag für Endverbraucher ausreichend sein, doch für Betreiber von Streaming-Plattformen und Server sind andere Kaliber nötig. AMD hat dafür mit der Alveo MA35D eine Lösung.

Zur News: AMD Alveo MA35D: Beschleuniger mit ASIC für AV1, H.265, H.264 und VP9
 
  • Gefällt mir
Reaktionen: Charminbaer, C4rp3di3m, ComputerJunge und 19 andere
Im Video selbst erklärt EposVox doch selber ganz klar, dass er hinter dem AMF Resultat einen Software-Bug vermutet. Aussagekräftig ist das Bild nicht.
 
  • Gefällt mir
Reaktionen: Deinorius, Termy, Santa Clause und 3 andere
Das "Problem" am Asic ist, dass er sehr speziell ausgerichtet ist und nur "diese eine Funktion" beherrscht. Das aber natürlich sehr gut und effektiv.
Wenn es da im Codec ein Update gibt, könnte die Karte nutzlos werden (oder nicht den angepassten Codec verarbeiten).
Ob das jemas passieren wird/kann, kann ich nicht beurteilen.

Ich frage mich, ob ein Server nicht mit einem "Universalbeschleuniger" besser und flexibler ausgestattet wird.

AMD wird da schon Marktforschung betrieben haben, bevor sie sich an die Entwicklung gemacht haben. 😎
 
  • Gefällt mir
Reaktionen: NMA, Tanzmusikus und Mcr-King
CM286 schrieb:
Ich frage mich, ob ein Server nicht mit einem "Universalbeschleuniger" besser und flexibler ausgestattet wird.

AMD wird da schon Marktforschung betrieben haben, bevor sie sich an die Entwicklung gemacht haben. 😎
Genau da erhoffe ich mir, dass man mittels FPGA Basis eine updatefähige Version herausbringt.
Das würde das beste von beiden Welten vereinen.

Und für irgendwas muss die Xilinx Übernahme ja gut gewesen sein :D
 
  • Gefällt mir
Reaktionen: Charminbaer, nazgul77, Deinorius und 7 andere
Hab ich auch gesehen das Video :D da dachte ich schon, ob da nicht ne kleine Version die vielleicht 2 streams codieren kann für die Radeons abfärbt :-)
 
  • Gefällt mir
Reaktionen: Compatiblewith, Tanzmusikus und -> m1 <-
CM286 schrieb:
Wenn es da im Codec ein Update gibt, könnte die Karte nutzlos werden (oder nicht den angepassten Codec verarbeiten).
Wenn es so ein massives Update gäbe, wäre das ein Todesstoß für jeden Codec. Die Implementation in Smartphones, GPUs, Fernsehern und allem sonst ist schließlich auch fest verdrahtet.

CM286 schrieb:
Ich frage mich, ob ein Server nicht mit einem "Universalbeschleuniger" besser und flexibler ausgestattet wird.
Meinst du eine CPU? Ansonsten ist es immer spezialisiert. Und wenn man hundert(e) AV1 Stream encodieren will, baust du dir entweder ein paar solche Karten ein oder ein paar Höheneinheiten an CPUs. Die Wahl dürfte den meisten leicht fallen.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: berkeley, Deinorius, JohnVescoya und 11 andere
Kaito Kariheddo schrieb:
ist die ASIC in der Lage, bis zu 32 parallele 1080p60-AV1-Streams zu verarbeiten.
Mhm..

Klingt irgendwie nicht viel. So gar nicht viel..
Hätte wesentlich mehr geschätzt, hätte man mich im Vorfeld um eine Schätzung gebeten.
 
32 Streams in der Auflösung und Framerate nur ein einziges mal aus dem Speicher auszulesen sind schon 12GB/s. Dazu die recht rechenintensiven Algorithmen mit der Tatsache dass die Karte nur ca. 1 Watt pro Stream braucht ist beeindruckend.

@CM286 Der Bitstream von AV1 ist eingefroren, da ändert sich nichts mehr dran.
 
  • Gefällt mir
Reaktionen: Charminbaer, berkeley, JohnVescoya und 9 andere
Skudrinka schrieb:
Klingt irgendwie nicht viel.
Dachte ich auch erst aber dann habe ich weils mich interssiert hat den nVidia Blogeintrag gesucht mit den Daten der neuesten Ada RTX Quadro oder wie auch immer sie mittlerweile heißen.

Grob zusammengefasst packt die neue Quadro RTX ca. 500 FPS in 1080p aber wir haben hier keine Verbrauchsdaten. Ein Teil wird ja über Cuda gerechnet also dürfte die Karte schon gut Saft dafür benötigen.
Die Xilinx/AMD Karte hingegen wäre bei 32x1080p60=1920 FPS bei 35W. Wenn man dann noch bedenkt, dass die Xilinx/AMD Karte ein single slot design ist, passen in den Platz einer Quadro 2 Xilinx/AMD Karten, damit wären wir bei 64 Streams in 1080p60 wenn man es in Durchsatz pro Platzbedarf einer GPU rechnet. (Und das natürlich dann bei insgesamt 70W.)

Wie die Rechnung aus Kostensicht aussieht weiß ich nicht. Es kann ja sein, dass die kleinste und größte GPU gleich schnell sind beim Encodieren... oder auch nicht.
 
  • Gefällt mir
Reaktionen: nazgul77, berkeley, JohnVescoya und 9 andere
ABC bzw. Youtube hat eigene ASICs fürs Encoding entwickelt:
https://arstechnica.com/gadgets/2021/04/youtube-is-now-building-its-own-video-transcoding-chips/

Jede Plattform, bei der ein paar Computenodes dauerhaft mit Encoding beschäftigt sind, kann hier auf einen Schlag ernsthaft Geld sparen. Wenn die Karten in größeren Mengen günstig genug sind, könnte das gar für Youtube interessant werden.
Unter der Voraussetzung, dass AMDs größtes Sorgenkind nicht wieder alles kaputt macht. Normalerweise krankt der coole Kram von AMD ja immer an der Softwareunterstützung :(
 
  • Gefällt mir
Reaktionen: Charminbaer, Tanzmusikus und ChowTan
CM286 schrieb:
Wenn es da im Codec ein Update gibt, könnte die Karte nutzlos werden (oder nicht den angepassten Codec verarbeiten).
Ob das jemas passieren wird/kann, kann ich nicht beurteilen.
Wie bereits gesagt wurde ist der Bitstream eingefroren und wird nicht mehr geändert. Es kann zwar noch Updates geben, diese müssen dann aber rückwärts-kompatibel sein.

CM286 schrieb:
Ich frage mich, ob ein Server nicht mit einem "Universalbeschleuniger" besser und flexibler ausgestattet wird.
Es gibt bereits FPGA-basierte Encoder. Diese sind bereits eine ganze Weile auf dem Markt. Der Haken daran ist, dass diese zwar sehr viel effizienter als CPUs oder die Compute Units von GPUs sind, aber im Vergleich zu ASICs immer noch eine ganze Größenordnung mehr Strom verbrauchen.

Piktogramm schrieb:
Unter der Voraussetzung, dass AMDs größtes Sorgenkind nicht wieder alles kaputt macht. Normalerweise krankt der coole Kram von AMD ja immer an der Softwareunterstützung :(
Glücklicherweise brauchen solche Karten nicht viel Software-Unterstützung. Zudem ist das eher ein Xillinx-Chip als einer von AMD. Schön wäre es, wenn sie die IP in zukünftige GPUs mit einfließen ließen, denn die Qualität scheint ja besser zu sein als die derzeitge IP in den GPUs.
 
  • Gefällt mir
Reaktionen: Charminbaer, Tanzmusikus, Icke-ffm und 2 andere
Limit schrieb:
Schön wäre es, wenn sie die IP in zukünftige GPUs mit einfließen ließen, denn die Qualität scheint ja besser zu sein als die derzeitge IP in den GPUs.
Also quasi der ASIC als abgespeckte Version mir nur 2 parallelen Streams neben der GPU auf der Grafikkarte, der dann vielleich 5W verbraucht?
 
AMD ist "nur" bei H.264 De und Encoding so weit abgeschlagen. Bei H.265 sieht es anders aus und bei AV1 wird es durch die Bank noch besser, wenn das in Software und auf den Plattformen mal ankommt.
 
  • Gefällt mir
Reaktionen: Kadett_Pirx
Tenferenzu schrieb:
Es kann ja sein, dass die kleinste und größte GPU gleich schnell sind beim Encodieren... oder auch nicht.
Doch, dem ist so. Also mit ein paar Ausnahmen wie immer, aber die De-/Encoder sind innerhalb einer Generation im Normalfall gleich. Man könnte also auch zu einer RTX 4070 Ti als aktuell günstigste Lösung greifen. Oder einer RTX 4000 SFF als stromsparendste Lösung mit maximal 70 Watt. Für gleiche Encode-Leistung ist am Ende aber beides immer noch teurer und deutlich ineffizienter.
 
  • Gefällt mir
Reaktionen: Tzk
Interessant ist ja auch der RISC-V Ansatz, Xilinx zeigt dadurch auch Kompetenz und ein Einsatzszenario für diesen Instruktionssatz. Es ist spannend!
 
  • Gefällt mir
Reaktionen: nazgul77, Tanzmusikus und ChowTan
Piktogramm schrieb:
ABC bzw. Youtube hat eigene ASICs fürs Encoding entwickelt
Deine genannte Karte von Google wurde kurz im Video erwähnt.
Diese sollen aber größer sein (2 Slot) und mehr Strom verbrauchen.

Conqi schrieb:
De-/Encoder sind innerhalb einer Generation im Normalfall gleich. Man könnte also auch zu einer RTX 4070 Ti als aktuell günstigste Lösung greifen.
Oder einfach eine Intel ARC A380 kaufen, die gibts bereits ab ca. 140€.
Diese hat ebenfalls einen AV1 De-/Encoder und ist zum jetzigen Zeitpunkt der einzige Hardware-Encoder der in HandBrake unterstützt wird.
HandBrake 1.6.0: Unterstützung von AV1-Encoding auf CPUs und Intel-GPUs
 
Limit schrieb:
Glücklicherweise brauchen solche Karten nicht viel Software-Unterstützung.
Sagt sich AMD auch immer und verkackt es..
Unter Windows geht es noch halbwegs, unter Linux/BSD wird es aber schnell ungemütlich und das ist der Bereich wo man die Netflixes, Youtubes, Twitches dieser Welt als Kunden gewinnt..

Stand derzeit: Mit AMD GPUs
* AMDs Advanced Media Framework (AMF) und ffmpeg wollen nur unter Windows zusammenkommen. Unter Linux geht es offiziell gar nicht (sagt die ffmpeg Dokumentation).
** AMF kann derzeit kein AV1 (Featurerequest auf Github ist noch offen, obwohl RDNA3 verfügbar ist..)
* AMD GPU mit ffmpeg über VAAPI ermöglicht mehr, aber auch da scheint AV1 noch nicht verfügbar zu sein

Das ist ein typisches AMD Ding, sie werfen ihre tendenziell gute Hardware auf den Markt, der Softwaresupport hängt aber Monate bis Jahre hinterher. Manchmal sogar in einem Maße, dass die Software die Features einer Hardwaregeneration nie voll exponiert und dennoch die Hardwaregenerationen aus dem Softwaresupport fallen.

Wenn AMD nicht anfängt Patches in Richtung Linux/BSD Kernel bzw. Mesa zu werfen, ffmpeg zu patchen und neue Versionen von AMF zu veröffentlichen, dann wird das wieder ein Rohrkrepierer.
 
  • Gefällt mir
Reaktionen: Tanzmusikus, QShambler und KlaasKersting
Vergesst mal das Elend mit den AMD-GPUs, das hier ist eine Lösung von Xilinx, die unter einem Xilinx-Produktnamen (Alveo) läuft, und wo genau mit der Zielgruppe für diese Karte Erfahrung vorhanden ist.

Mit den Consumer-GPUs hat das hier halt nicht das geringste zu tun.
 
  • Gefällt mir
Reaktionen: Charminbaer, JohnVescoya, stevefrogs und 7 andere
Anakin Solo schrieb:
Deine genannte Karte von Google wurde kurz im Video erwähnt.
Diese sollen aber größer sein (2 Slot) und mehr Strom verbrauchen.
Das was Google verrät ist auch eine Vorstellung aus Q2 2021, also zwei Jahre her. Das neuere Hardware effizienter arbeitet überrascht wenig. Das Google ihre ASICs weiterentwickelt wird auch angekündigt.
 
stefan92x schrieb:
Vergesst mal das Elend mit den AMD-GPUs, das hier ist eine Lösung von Xilinx, die unter einem Xilinx-Produktnamen (Alveo) läuft, und wo genau mit der Zielgruppe für diese Karte Erfahrung vorhanden ist.

Mit den Consumer-GPUs hat das hier halt nicht das geringste zu tun.
Durchaus korrekt, wobei sich seit dem Xilinx-Kauf die Frage auftut, wieso AMD 2 Encoder-Teams hat und ob sie zukünftig ausschließlich auf das Xilinx-Team setzen werden.

AMDs eigenes Team lag bisher bei x264, x265 und AV1 deutlich hinter Nvidias und Intels Bitrateneffizienz, während Xilinx hier konkurrenzfähig bis führend wäre.

Man kann keine 32 Streams wie bei dieser Encoder-Karte erwarten, dafür belegt die Hardware viel zu viel Die-Fläche, aber eine zurechtgestutzte Version mit 4-8 Streams wäre noch immer attraktiv.
 
  • Gefällt mir
Reaktionen: Charminbaer, Tanzmusikus und SVΞN
Zurück
Oben