BLOOM: Um Modelo de Línguagem Multilingue Avançado
Os modelos de linguagem de grande porte (LLMs) têm tido um impacto significativo na pesquisa de IA. No entanto, criar, estudar ou mesmo utilizar LLMs tem sido difícil para a academia, ONGs e laboratórios de pesquisa de pequenas empresas, pois apenas alguns laboratórios industriais com recursos e direitos exclusivos têm acesso total a eles. É aí que entra o BLOOM. BLOOM é o primeiro LLM multilingue treinado com total transparência. Com 176 bilhões de parâmetros, ele é capaz de gerar texto em 46 línguas naturais e 13 linguagens de programação. Isso é o resultado de um ano de trabalho envolvendo mais de 1000 pesquisadores de mais de 70 países e 250 instituições. Os pesquisadores podem agora baixar, executar e estudar o BLOOM para investigar o desempenho e o comportamento dos modelos de linguagem de grande porte. Além disso, qualquer indivíduo ou instituição que concorde com os termos da Licença de IA Responsável do modelo pode usá-lo e se basear nele em uma máquina local ou em um provedor de nuvem, graças à sua integração no ecossistema Hugging Face. O BLOOM não é apenas um modelo único, mas o começo de uma família de modelos que pretendemos expandir. Estamos trabalhando para torná-lo tão instrutível quanto nosso esforço anterior T0++ e planejamos adicionar mais línguas, comprimir o modelo em uma versão mais utilizável com o mesmo nível de desempenho e usá-lo como ponto de partida para arquiteturas mais complexas.