Google Lyra: Effizienter Sprachcodec ist jetzt Open Source
Google hat seinen extrem effizienten Sprachcodec „Lyra“, mit dessen Hilfe sich Sprache mit einer Datenrate von gerade einmal 3 kbit/s kodieren lässt, offengelegt und für jedermann als Open Source freigegeben. Der speziell für ARM64-Plattformen optimierte Codec setzt außerdem auf Künstliche Intelligenz und maschinelles Lernen.
Effizienz trifft auf Open Source
Wie das Unternehmen auf seinem Google Open Source Blog bekanntgegeben hat, steht der Quellcode des „revolutionären neuen Audio-Codec“ ab sofort jedem offen zur Verfügung.
Googles „Lyra“ ist komplett in C++ geschrieben und greift sowohl auf den freien Ableger „Bazel“ des Build-Tools „Blaze“ als auch die C++-Bibliothek „Abseil“ zurück. Die API von „Lyra“ erlaubt sowohl die Kodierung ganzer Dateien als auch von einzelnen Paketen mit einer Datenrate bis hinab auf sehr effiziente 3 kbit pro Sekunde.
Bei der Verarbeitung von Sprache greift der Codec auf unterschiedliche Spektrogramme zurück, die das natürliche Hörempfinden von Menschen berücksichtigen. Hierzu wurde „Lyra“ in insgesamt 70 Sprachen „angelernt“.
Der Codec bietet darüber hinaus auch diverse Filter und Transformationsfunktionen zur Signalverarbeitung und soll laut Google zukünftig als effizienter „Sprach-Codec“ für die mobile Telefonie von morgen eingesetzt werden.
Auch eine erste App, welche die Effizient von Googles „Lyra“ in Verbindung mit dem Toolkit Android NDK demonstriert, ist ebenfalls bereits verfügbar. Auch für die Videotelefonie mit Google Duo kommt der Codec bereits zum Einsatz.
Quellcode fast vollständig auf GitHub
Der Quellcode ist mit Ausnahme eines kleinen Teils für mathematische Funktionen jetzt auf der Entwicklerplattform GitHub verfügbar. Bereits im Februar hatte Google Audioaufnahmen und Vergleichsvideos zu „Lyra“ veröffentlicht.
Die Redaktion dankt Community-Mitglied „Thomaswww“ für den Hinweis zu dieser Meldung.