Text to speech: Audio-Aufnahme (dt.) in Text umwandeln?

mtemp

Lt. Commander
Registriert
Okt. 2008
Beiträge
1.274
Hallo,

möchte eine "deutsche" Audioaufnahme eines Sprechers (mp3-Datei) autom. in Text umwandeln lassen.

Suchmaschine ergab zB bei "text to speech" dieses leider zB nur für englische Texte gedachte Online-Tool: https://speech-to-text-demo.ng.bluemix.net/

Transkriptionssoftware bzw. Fußschalter steht zwar auch zur Verfügung – doch eine Stunde Audiomaterial zu transkribieren dauert mir zu lang ;-)
Muss zudem nicht perfekt sein, nur verständlich...
Apps für Smartphones sind ja zumeist für die direkte Spracheingabe und vielleicht auch nicht für längere Eingaben gedacht

Kennt jemand ein solches Tool? Am besten dem obigen ähnlich.

Danke!
mtemp
 
Windows-Sprachausgabe? :)

In Microsoft Edge liest die dir auch direkt vor: Rechtsklick -> Laut vorlesen.
 
@FranzvonAssisi
Falsche Richtung, es geht um vorhandenes Audiomaterial welches in Text umgewandelt werden muss.
Also z.B. die klassische Interviewtranskription.

Habe mich nicht groß damit beschäftigt, aber es muss etwas geben.
Hey, Google transkribiert Texte in YouTube-Videos, dann wird man es zuhause wohl auch irgendwie schaffen^^

Notfalls Mechanical Turk^^
 
Du suchst falsch. Ist ja kein Text to speech, sondern genau anders rum. Schau mal nach "Spracherkennung Software". Microsoft bietet z.B. ein Tool an (Microsoft Dictate), soll auch für deutsche Texte funktionieren. Auf der Arbeit haben wir ein Dragon Natural Speaking Derivat, das funktioniert super, kostet aber.

PS
Windows bringt auch eine eigene Spracherkennung mit. Vielleicht reicht die ja schon.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: mtemp
Kurze 1. Rückmeldung: Danke für Eure Rückmeldungen! :)

Und, ja klar, meinte "Speech to text", also keine Sprachausgabe eines vorhandenen Textes. Mein Fehler.

Windows Spracherkennung kannte ich bis vorhin auch nicht, bisher noch nicht ausprobiert, nur zB in diesem "Erklärvideo" reingeschaut: https://www.youtube.com/watch?v=6VLBZ_9nr2s

Statt dessen diese interessante Online-Anwendung ausprobiert: https://dictation.io/speech – benutzt die Google Engine. Direkt eingesprochen via Mikro funktionierts in meinem kurzen Text gar nicht mal so schlecht. Doch schlechter bis unbrauchbar bei meinem Mitschnitt der Sprecher einer Hauptversammlung... Diese sind zwar sehr gut zu verstehen (da auch kaum Stör-/Hintergrundgeräusche), jedoch nur für ein menschliches Gehör – das weiß, worauf es zu hören hat...
Allerdings musste ich die Aufzeichnung über Lautsprecher ausgeben und per Mikro wieder einlesen. Ob Erkennung besser wäre, wenn ichs direkt hätte einspielen können, glaube eher nicht.

Bzgl. Dragon Software: wir hatten, glaub ich, mal eine ganz frühere Version. Mal schauen, ob ich die noch vorfinde und falls ob, ob sie überhaupt noch lauffähig ist.

Immerhin, erste Ansätze sind da – zur weiteren Recherche. Oder ich fang lieber gleich an, "händisch" zu transkribieren ;-)

Nochmals: Danke bis hierhin!

Ach so, Adobe Premiere, ich glaub bis zu CS6, verfügt auch über eine Spracherkennung. Doch früher mal ausprobiert: äußerst fehlerhaft und somit unbrauchbar. Wobei darin das geschickte gewesen wäre, mit Klick auf ein Wort wäre ich zugleich zu der Stelle der Audio- bzw. Video-Datei gelangt.
 
matraj63 schrieb:
Du suchst falsch. Ist ja kein Text to speech, sondern genau anders rum. Schau mal nach "Spracherkennung Software". Microsoft bietet z.B. ein Tool an (Microsoft Dictate),

nun endlich mal ausprobiert
https://www.microsoft.com/en-us/garage/profiles/dictate/
bzw.
https://dictate.ms/

Tatsächlich auch von "Deutsch zu Deutsch" auswählbar. Bei einem Podcast mit "freier Rede zweier Personen" hatte ich das Mikro (eines Headsets) vor den Lautsprecher gelegt.


Und gerade erstmals spaßeshalber ausprobiert, die »Real time translation to 60 languages« – na, nur eine:

Meine Spracheingabe: »ComputerBase berichtet unabhängig und verkauft deshalb keine Inhalte, sondern Werbebanner.«
Autom. Erkennung Deutsch: »Computerbase berichtet unabhängig und verkauft deshalb keine Inhalte, sondern Werbebanner.«
Autom. Übersetzung Englisch: »ComputerBase reported independently and therefore sold advertising banner, not content.«

Deutsch also perfekt. Übersetzung mit Abstrichen...

Danke für den Tipp! Alias: »Thanks fort he tip.« ;)
 
  • Gefällt mir
Reaktionen: matraj63
Zurück
Oben