OpenNMT - Sistema de Tradução Automática Neural de Código Aberto
OpenNMT é um ecossistema de código aberto para tradução automática neural e aprendizado de sequência neural. Iniciado em dezembro de 2016 pelo grupo Harvard NLP e SYSTRAN, o projeto tem sido utilizado em várias aplicações de pesquisa e indústria. Atualmente, é mantido pela SYSTRAN e Ubiqus.
OpenNMT fornece implementações em dois frameworks de aprendizado profundo populares:
- OpenNMT-py: Amigável e multimodal, beneficiando-se da facilidade de uso do PyTorch. Com documentação e modelos pré-treinados.
- OpenNMT-tf: Modular e estável, impulsionado pelo ecossistema do TensorFlow. Também possui documentação e modelos pré-treinados.
Cada implementação tem seu próprio conjunto de características únicas, mas compartilha objetivos semelhantes:
- Arquiteturas de modelo altamente configuráveis e procedimentos de treinamento.
- Capacidades eficientes de fornecimento de modelo para uso em aplicações do mundo real.
- Extensões para permitir outras tarefas, como geração de texto, marcação, sumarização, imagem para texto e fala para texto.
O ecossistema OpenNMT também inclui projetos para cobrir o fluxo de trabalho completo de NMT:
- CTranslate2: Motor de inferência eficiente para modelos Transformer em CPU e GPU. Com documentação.
- Tokenizer: Biblioteca de tokenização de texto rápida e personalizável com suporte a BPE e SentencePiece. Com documentação.