Conformer-2: Um Modelo Avançado de Reconhecimento de Fala
O Conformer-2 é o mais recente modelo de reconhecimento de fala automático da nossa empresa. Ele é treinado com 1,1 milhão de horas de dados de áudio em inglês, expandindo o Conformer-1 e trazendo melhorias em nomes próprios, alfanuméricos e robustez ao ruído.
Visão Geral: O Conformer-2 se baseia na versão original do Conformer-1, mas melhora o desempenho do modelo e a velocidade. Ele alcançou resultados de ponta (resultados anteriores) e demonstrou forte robustez ao ruído, tornando-o adequado para as condições de áudio do mundo real que nossos clientes enfrentam regularmente.
Principais Características:
- Melhora de 31,7% em alfanuméricos.
- Melhora de 6,8% na Taxa de Erro de Nomes Próprios.
- Melhora de 12,0% na robustez ao ruído.
Uso Básico: Para construir aplicações de IA gerativa que utilizam dados falados, as equipes de produto e desenvolvimento precisam de uma transcrição de fala para texto precisa como um componente crítico de seu pipeline de IA. O Conformer-2 oferece melhorias significativas nessa área. Os usuários podem experimentar o Conformer-2 através do nosso Playground, onde podem fazer upload de um arquivo ou inserir um link do YouTube para ver uma transcrição em apenas alguns cliques. Além disso, o Conformer-2 está disponível através da nossa API como o modelo padrão. Os usuários atuais da nossa API serão automaticamente migrados para o Conformer-2 e começarão a ver um desempenho melhor sem precisar fazer alterações.