Gesprochene Audiodatei zu Textdatei

matman · Beitrag von **matman** » 17.09.2022 19:03:43

Eine gesprochene Audiodatei zu einer Textdatei umwandeln. Gibt es da bei Linux schon Tools die das können?

tobo · Beitrag von **tobo** » 17.09.2022 19:42:31

matman hat geschrieben:
17.09.2022 19:03:43
Eine gesprochene Audiodatei zu einer Textdatei umwandeln. Gibt es da bei Linux schon Tools die das können?

Gute Frage. Wenn nichts Konkretes kommt, dann würde ich mal hier ansetzen:
https://en.wikipedia.org/wiki/Speech_re ... _for_Linux

tonerzeuger · Beitrag von **tonerzeuger** » 17.09.2022 22:24:05

Es gibt zumindest einen Ansatz für ein freies, nichtkommerzielles System: Mozilla Common Voice.

Darauf basiert die Spracherkennung Deep Speech, und dazu gibt es sogar ein Tutorial bei Heise:
https://www.heise.de/hintergrund/Mozill ... 48698.html

Vielleicht hilft das weiter? Es scheint aber noch in der Entwicklung zu sein, und jede(r) kann eigene Sprachaufnahmen einsenden, um zur Verbesserung beizutragen.

https://commonvoice.mozilla.org/de/datasets

tobo · Beitrag von **tobo** » 17.09.2022 22:46:58

tonerzeuger hat geschrieben:
17.09.2022 22:24:05
Es scheint aber noch in der Entwicklung zu sein, [...]

Laut Referenz [4] aus dem Wikipedia-Link scheint das schon wieder tot zu sein:
https://discourse.mozilla.org/t/why-you ... i-ai/82798

tonerzeuger · Beitrag von **tonerzeuger** » 17.09.2022 22:56:40

Das hab ich auch gerade gelesen - immerhin ist es geforked worden.

In diesem zwei Jahre alten Artikel werden weitere Projekte vorgestellt:
https://gnulinux.ch/open-source-spracherkennung

tonerzeuger · Beitrag von **tonerzeuger** » 01.11.2022 11:09:27

Berichte doch Mal, was Du probiert hast und was dabei rauskam - das wäre sicher nicht nur für mich interessant!

matman · Beitrag von **matman** » 19.02.2023 12:55:49

Ich habe da bis jetzt noch nicht viel gemacht. Und im Moment wichtigeres zu tun. In den Debian Repos, das man mal schnell installieren und testen könnte, gibt es wohl nichts?

GregorS · Beitrag von **GregorS** » 19.02.2023 14:08:54

matman hat geschrieben:
19.02.2023 12:55:49
Ich habe da bis jetzt noch nicht viel gemacht. Und im Moment wichtigeres zu tun. In den Debian Repos, das man mal schnell installieren und testen könnte, gibt es wohl nichts?

Dann guck Dir doch wenigstens mal kurz die zwei Postings weiter oben verlinkte Seite an. Es scheint einiges zu geben.

Gruß

Gregor

rjh · Beitrag von **rjh** » 20.02.2023 20:30:42

matman hat geschrieben:
19.02.2023 12:55:49
In den Debian Repos, das man mal schnell installieren und testen könnte, gibt es wohl nichts?

Zum schnellen installieren und testen:

pocketsphinx_continuous

Code: Alles auswählen

pocketsphinx_continuous -infile test-enc.wav

wave-Datei muss ne Samplerate von 16000 haben. Der Text sollte Englisch sein (gibt aber soweit ich weiß auch schon Erweiterungen für Deutsch).

speefak · Beitrag von **speefak** » 24.07.2023 13:31:36

Das würde mich auch interessieren. Es wäre wünschenswert ein ChatGPT/Alexa/Siri usw. System ohne "ET Faktor (nach Hause telefonieren)" zu bekommen, was völlig ohne Onlinefunktionen auskommt. MyCroft hatte ich einmal getestet. Gibt aber keine Server/Client Betrieb, sprich alles muss auf einem System laufen.

reox · Beitrag von **reox** » 24.07.2023 13:36:13

Hier findet man einige modelle: https://github.com/topics/speech-to-text
Whisper wird mittlerweile auch in HomeAssistant angeboten aber die Qualität ist oftmals sehr schlecht. Allerdings teilweise überraschend gut. Also muss man sich anschauen ob es funktioniert.
Ob die Modelle komplett offen (=auch alle trainingsdaten vorhanden) sind weiß ich nicht, muss man vermutlich im Einzelfall ansehen.

debianforum.de

Gesprochene Audiodatei zu Textdatei

Gesprochene Audiodatei zu Textdatei

Re: Gesprochene Audiodatei zu Textdatei

Re: Gesprochene Audiodatei zu Textdatei

Re: Gesprochene Audiodatei zu Textdatei

Re: Gesprochene Audiodatei zu Textdatei

Re: Gesprochene Audiodatei zu Textdatei

Re: Gesprochene Audiodatei zu Textdatei

Re: Gesprochene Audiodatei zu Textdatei

Re: Gesprochene Audiodatei zu Textdatei

Re: Gesprochene Audiodatei zu Textdatei

Re: Gesprochene Audiodatei zu Textdatei