CodeGen : Un Modèle Open-Source de Synthèse de Programmes
CodeGen est une famille de modèles open-source pour la synthèse de programmes. Entraîné sur TPU-v4, il est en compétition avec OpenAI Codex. Il offre des fonctionnalités avancées pour la création de code.
Fonctionnalités clés :
- Programmation assistée : Aide les développeurs à générer du code de manière plus efficace.
- Compétitivité : Se compare favorablement à des modèles de référence tels que OpenAI Codex.
Utilisation de base : Pour utiliser CodeGen, les utilisateurs peuvent importer les modules nécessaires et configurer le modèle en fonction de leurs besoins. Par exemple, pour CodeGen1.0 :
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("Salesforce/codegen-2B-mono")
model = AutoModelForCausalLM.from_pretrained("Salesforce/codegen-2B-mono")
inputs = tokenizer("# this function prints hello world", return_tensors="pt")
sample = model.generate(**inputs, max_length=128)
print(tokenizer.decode(sample[0], truncate_before_pattern=[r"\n\n^#", "^'''", "\n\n\n"]))
CodeGen continue de s'améliorer avec des versions successives, telles que CodeGen2.0 et CodeGen2.5, offrant des performances et des capacités accrues.