OpenNMT : Un système de traduction innovant
OpenNMT est un écosystème open source pour la traduction automatique neuronale et l'apprentissage de séquences neuronales. Lancé en décembre 2016 par le groupe Harvard NLP et SYSTRAN, ce projet a depuis été utilisé dans plusieurs applications de recherche et d'industrie. Il est actuellement maintenu par SYSTRAN et Ubiqus.
OpenNMT propose des implémentations dans deux frameworks d'apprentissage profond populaires : OpenNMT-py, qui est convivial et multimodal, profitant de la facilité d'utilisation de PyTorch, et OpenNMT-tf, qui est modulaire et stable, alimenté par l'écosystème TensorFlow. Chaque implémentation a ses propres caractéristiques uniques, mais partage des objectifs similaires : des architectures de modèles hautement configurables et des procédures d'entraînement, des capacités de service de modèle efficaces pour une utilisation dans des applications du monde réel, ainsi que des extensions pour permettre d'autres tâches telles que la génération de texte, le marquage, la synthèse, la conversion d'image en texte et la conversion de parole en texte.
L'écosystème OpenNMT comprend également des projets pour couvrir l'ensemble du flux de travail de la TAN : CTranslate2, un moteur d'inférence efficace pour les modèles Transformer sur CPU et GPU, et Tokenizer, une bibliothèque de tokenisation de texte rapide et personnalisable avec le support BPE et SentencePiece.