Autosub - Befehlszeilenwerkzeug für automatische Untertitelgenerierung
Autosub ist ein praktisches Tool für die automatische Spracherkennung und Untertitelgenerierung. Es nimmt eine Video- oder Audiodatei als Eingabe und führt eine Sprachaktivitätserkennung durch, um Sprachbereiche zu finden. Anschließend sendet es parallele Anfragen an die Google Web Speech API, um Transkriptionen für diese Bereiche zu erzeugen. Optional können diese Transkriptionen in eine andere Sprache übersetzt und schließlich die resultierenden Untertitel auf der Festplatte gespeichert werden.
Das Tool unterstützt eine Vielzahl von Eingabe- und Ausgabe-Sprachen. Um zu sehen, welche genau, kann man das Werkzeug mit dem Argument --list-languages
ausführen. Zudem kann es derzeit Untertitel entweder im SRT-Format oder im einfachen JSON-Format erzeugen.
Installation: Installieren Sie zuerst ffmpeg. Danach führen Sie pip install autosub
aus.
Verwendung: $ autosub -h
zeigt die Hilfe-Nachricht und die verfügbaren Optionen. Beispielsweise kann man mit -C CONCURRENCY
die Anzahl der gleichzeitigen API-Anfragen festlegen, mit -o OUTPUT
den Ausgabepfad für die Untertitel angeben und mit -F FORMAT
das gewünschte Untertitelformat auswählen. Die Sprache der Quelldatei kann mit -S SRC_LANGUAGE
und die gewünschte Sprache für die Untertitel mit -D DST_LANGUAGE
festgelegt werden. Für die Übersetzung der Untertitel ist mit -K API_KEY
der Google Translate API-Schlüssel erforderlich. Mit --list-formats
können alle verfügbaren Untertitelformate und mit --list-languages
alle verfügbaren Quell-/Zielsprachen aufgelistet werden.