Autosub: Automatische Untertitel für Videos mit Befehlszeile

agermanidis/autosub

Autosub ist ein nicht mehr gepflegtes Befehlszeilenwerkzeug, das Untertitel für jedes Video automatisch erzeugt und unterstützt verschiedene Sprachen und Formate.
Autosub: Automatische Untertitel für Videos mit Befehlszeile

Autosub - Befehlszeilenwerkzeug für automatische Untertitelgenerierung

Autosub ist ein praktisches Tool für die automatische Spracherkennung und Untertitelgenerierung. Es nimmt eine Video- oder Audiodatei als Eingabe und führt eine Sprachaktivitätserkennung durch, um Sprachbereiche zu finden. Anschließend sendet es parallele Anfragen an die Google Web Speech API, um Transkriptionen für diese Bereiche zu erzeugen. Optional können diese Transkriptionen in eine andere Sprache übersetzt und schließlich die resultierenden Untertitel auf der Festplatte gespeichert werden.

Das Tool unterstützt eine Vielzahl von Eingabe- und Ausgabe-Sprachen. Um zu sehen, welche genau, kann man das Werkzeug mit dem Argument --list-languages ausführen. Zudem kann es derzeit Untertitel entweder im SRT-Format oder im einfachen JSON-Format erzeugen.

Installation: Installieren Sie zuerst ffmpeg. Danach führen Sie pip install autosub aus.

Verwendung: $ autosub -h zeigt die Hilfe-Nachricht und die verfügbaren Optionen. Beispielsweise kann man mit -C CONCURRENCY die Anzahl der gleichzeitigen API-Anfragen festlegen, mit -o OUTPUT den Ausgabepfad für die Untertitel angeben und mit -F FORMAT das gewünschte Untertitelformat auswählen. Die Sprache der Quelldatei kann mit -S SRC_LANGUAGE und die gewünschte Sprache für die Untertitel mit -D DST_LANGUAGE festgelegt werden. Für die Übersetzung der Untertitel ist mit -K API_KEY der Google Translate API-Schlüssel erforderlich. Mit --list-formats können alle verfügbaren Untertitelformate und mit --list-languages alle verfügbaren Quell-/Zielsprachen aufgelistet werden.

Ausgewählte KI-Tools

SpeechText.AI

SpeechText.AI

SpeechText.AI ist eine KI-basierte Software, die Audio in Text umwandelt und präzise Transkriptionen bietet.

Trint

Trint

Trint ist eine AI-basierte Transkriptionssoftware, die Zeit spart und die Qualität erhöht.

Amazon Transcribe

Amazon Transcribe

Amazon Transcribe ist ein ASR-Service, der Sprache in Text umwandelt und vielfältige Vorteile bietet.

Swiftink

Swiftink

Swiftink ist eine fortschrittliche AI, die Medien in Text umwandelt und persönliche Ausgaben erzeugt.

Speechmatics

Speechmatics

Speechmatics bietet fortschrittliche AI-Sprachtechnologie für präzise Interaktionen

Transcribear

Transcribear

Transcribear ist ein Transkriptionswerkzeug, das Audio- und Videodateien automatisch oder manuell transkribiert.

openai/whisper

openai/whisper

openai/whisper ist ein vielseitiges Spracherkennungsmodell, das vielfältige Aufgaben erfüllt.

Rev

Rev

Rev ist ein Sprach-zu-Text-Dienst, der die Arbeit smarter macht

TranscribeToText.AI

TranscribeToText.AI ist ein leistungsstarkes Tool, das Audio und Video schnell in Text umwandelt.

Happy Scribe

Happy Scribe

Happy Scribe ist eine All-in-One-Plattform für Transkription und Untertitel, die mit KI und Experten arbeitet.

ListenRobo

ListenRobo

ListenRobo ist ein hammermäßiges AI-gestütztes Transkriptionswerkzeug mit vielen coolen Features.

Legal Intern AI

Legal Intern AI

Legal Intern AI ist eine sichere App für Rechtsberufe, die Zeit und Geld spart.

YouTube Transcript Generator

YouTube Transcript Generator

YouTube Transcript Generator war ein Tool, das nun nicht mehr verfügbar ist.

Audiotype

Audiotype

Audiotype ist eine automatische Transkriptionssoftware, die schnelle und präzise Transkriptionen ermöglicht.

Voxpad

Voxpad

Voxpad ist ein AI-gestützter Notizentaker, der die Notizenerstellung beschleunigt.

VoicePen

VoicePen

VoicePen ist ein AI-gestützter Notizentfänger, der Sprache in gut geschriebenen Text verwandelt.

TakeNote.ai

TakeNote.ai

TakeNote.ai ist eine KI-gestützte Sprach-zu-Text-Lösung, die die Produktivität steigert.

CaptionCreator

CaptionCreator

CaptionCreator ist ein KI-betriebenes Tool, das automatisch Untertitel erzeugt und in über 50 Sprachen übersetzt.

Transkriptor

Transkriptor

Transkriptor ist ein leistungsstarkes AI-Tool, das Audio und Video in Text umwandelt und viele Funktionen bietet.

Lugs.ai

Lugs.ai

Lugs.ai ist ein KI-betriebenes Tool, das Audio präzise transkribiert und beschriftet.