Alignement avancé des modèles VLM dans TRL : innovations récentes
Optimisez vos modèles VLM avec MPO et GRPO pour une meilleure performance multimodale. Découvrez les nouvelles techniques d'alignement de TRL.
·
3 min