OpenNMT - Open-Source Neural Machine Translation
OpenNMT ist ein quelloffenes Ökosystem für neuronale Maschinenübersetzung und neuronales Sequenzlernen. Es wurde im Dezember 2016 von der Harvard NLP-Gruppe und SYSTRAN gestartet und wird seitdem in mehreren Forschungs- und Industrieanwendungen eingesetzt. Derzeit wird es von SYSTRAN und Ubiqus gepflegt.
OpenNMT bietet Implementierungen in zwei beliebten Deep-Learning-Frameworks: OpenNMT-py, das benutzerfreundlich und multimodal ist und von der einfachen Nutzung von PyTorch profitiert, sowie OpenNMT-tf, das modular und stabil ist und von dem TensorFlow-Ökosystem angetrieben wird. Beide Implementierungen verfügen über eigene einzigartige Merkmale, teilen aber ähnliche Ziele: hochkonfigurierbare Modellarchitekturen und Trainingsverfahren, effiziente Modell-Serving-Fähigkeiten für die Anwendung in der realen Welt sowie Erweiterungen, um andere Aufgaben wie Textgenerierung, Tagging, Zusammenfassung, Bild-zu-Text und Sprache-zu-Text zu ermöglichen.
Das OpenNMT-Ökosystem umfasst auch Projekte, um den gesamten NMT-Workflow abzudecken: CTranslate2, ein effizienter Inferenz-Engine für Transformer-Modelle auf CPU und GPU, und Tokenizer, eine schnelle und anpassbare Text-Tokenisierungsbibliothek mit BPE- und SentencePiece-Unterstützung.