Gesprochenen Text in schriftlichen Text umwandeln?

so_la_la

Lt. Commander
Registriert
Feb. 2014
Beiträge
1.347
Hallo,
ich suche ein Programm, dass Audiodateien (gesprochener Text) in schriftlichen Text umwandelt. Es soll so funktionieren, wie die Spracherkennung in MS Word. Ich dachte eigentlich, es ginge mit MS Word. Aber das ist doch alles extrem rudimentär umgesetzt in der Office 365 Version. Ich weiß gar nicht, wie man das machen soll, dass Word sich eine Datei anhört und dann als Text ausgibt.
Also wie gesagt, ich suche weniger was zum live Reinsprechen (dann kann ichs auch gleich tippen) sondern etwas, mit dem ich Audiodateien abspielen kann, deren Text dann erkannt wird.
Ich dachte, das wäre mittlerweile eine Art Selbstläufer wegen Siri und Alexa usw. Aber jetzt sehe ich, dass es einfach überhaupt nichts gibt. Ich bin bei der Recherche über Nuance Dragon gestolpert, aber das kostet Eur 199 und das ist mir zuviel.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: SI Sun
Dragon ist da mit die Standardlösung. Und Knowhow kostet eben.
 
  • Gefällt mir
Reaktionen: PHuV und SI Sun
Ich meine, der Marktführer ist und bleibt Dragon Naturally Speaking
https://www.dragon-naturally-speaking.com/

Das letzte Mal als ich Tests darüber gelesen habe (vor ca. 2 Jahren), war die Software gegenüber Google, Apple, Microsoft, Amazon, etc. so weit voraus, dass man für eine ernsthafte Nutzung von "Text zu Speech" an Dragon Naturally Speaking nicht vorbeikam.
Besonders positiv haben Behinderte darüber gesprochen, welche auf solche Software angewiesen sind und entsprechende Erfahrungen mit allen Konkurrenten sammeln konnten.
 
  • Gefällt mir
Reaktionen: PHuV und madmax2010
SI Sun schrieb:
Software gegenüber Google, Apple, Microsoft,
Nuance ist MS :D
hast aber denoch recht.
SI Sun schrieb:
Besonders positiv haben Behinderte darüber gesprochen, welche auf solche Software angewiesen sind und entsprechende Erfahrungen mit allen Konkurrenten sammeln konnten.
vor allem da. Kann sogar genutzt werden um sprechfehler zu analysieren und weg zu trainieren. Die machen das halt schon ein paar Jahrzehnte länger als der Rest am Markt.

Alleine schon ein gutes Trainingsset aufbauen, zu transkribieren, zu lablen, zu bereinigen ist ein unglaublicher Aufwand, den auch neue VoiceTech Startups immer wieder unterschätzen.
 
  • Gefällt mir
Reaktionen: SI Sun
@madmax2010

Ich könnte schwören, dass man dort Microsofts Lösung in Word gegen die von Nuance getestet hat.
Vielleicht war das auch nur der Unterschied zwischen einer (kostenlosen?) Version von Microsoft und einer kostenpflichtigen, deutlich besseren Version von Nuance.
 
Dass Nuance richtig geil ist, kann ich bestätigen.
Aber kann es auch das was der TE will?
Er möchte ja für Transkription nutzen und nicht zum Reinquatschen^^

Oder kann man dann einfach ne Voiceline als Mikrofon angeben? Ggf mit Software wie Voicemeter oder so ein Schabernack
 
Dragon setzen auch viele Anwälte ein. Da kannst von den Diktiergerättippsen (o-ton vom Anwalt) zwei Drittel einsparen. Da muss nur noch korrekturgelesen werden.
Wenn du sowas willst, dann ne gute Lösung und Geld in die Hand nehmen, oder gleich bleiben lassen.
 
Warum sollte es nicht gehen?
Ob man nun selbst ins Mikrofon spricht oder ein Lautsprecher, welche eine Datei abspielt, ins Mikrofon spricht oder eine Audiospur wählt, müsste doch egal sein.

Bei Tools wie Google Spracheingabe hat es bei YouTube Audiobooks nicht funktioniert. Ich schätze, weil es einfach daran liegt, dass alles, was gesprochen wird, immer über Googles Server geschickt und damit geprüft wird. Offline-Programme dürften dieses Problem nicht haben.
Bei Apple und Amazon wird es wahrscheinlich nicht anders sein. Das ist einer der großen Nachteile von diesen Cloud-Lösungen. Nicht, was man sagt, ist geheim und würde ich entsprechend niemals im professionellen Bereich einsetzen. (was bei uns sowieso verboten ist)
 
Auf dem Handy ne Notizen App öffnen.
Bei der Tastatur auf Spracheingabe wechseln.
Handy vor den Lautsprecher legen.
...
Profit.
 
Ja, ich habe gar kein Google-Konto, insofern ist das keine Lösung für mich. Aber die vielen Rückmeldungen haben mir gezeigt, dass ich es wohl doch einfach besser abtippe.
Ich finde echt gute Lösungen in dieser Hinsicht super interessant, aber ich brauche es nicht extrem dringend, deswegen habe ich keine Lust, dafür Geld auszugeben.
Es ist nur lustig, dass ständig über Sprachkontrolle, Assistenten usw gesprochen wird, aber die Entwicklung dann wohl doch noch nicht so weit ist.
Wahrscheinlich ist das auch wirklich schwierig als Open-Source Projekt zu entwickeln, weil die Leute die die Software dann trainieren sollen ,darauf keinen Bock haben.
Danke für Antworten allerseits!
 
Zurück
Oben