Au-delà de LoRA : Explorer les techniques de fine-tuning PEFT
LoRA domine le fine-tuning, mais est-ce vraiment le meilleur choix ? Découvre des alternatives et des benchmarks concrets pour faire un choix éclairé.
Sur les 20 834 cartes de modèles sur le Hub de Hugging Face mentionnant une technique de PEFT, 98,4 % mentionnent LoRA. Cela ne prouve-t-il pas que LoRA est le meilleur pour le fine-tuning ? Pourtant, d’autres techniques pourraient être tout aussi, voire plus efficaces, mais largement sous-estimées.
Pourquoi LoRA domine le paysage
LoRA, ou Low Rank Adaptation, est presque devenu synonyme de fine-tuning PEFT. En ajoutant seulement quelques paramètres au-dessus du modèle de base et en gardant les poids du modèle gelés, LoRA permet un fine-tuning efficace avec un faible coût mémoire. Parmi 10 000 checkpoints d’image, 95 % sont des LoRAs, chiffre impressionnant s’il en est, mais cela indique-t-il une supériorité technique ou simplement une adoption massive par habitude ?
Les limites de se baser uniquement sur les papiers
Nombreux sont les papiers académiques affirmant que leurs techniques surpassent LoRA. Pourtant, l’influence des biais expérimentaux demeure forte, souvent étayée par le manque de temps de réglage alloué aux alternatives. Parfois, ajuster juste le taux d’apprentissage suffit pour que LoRA atteigne les performances d’autres techniques soit-disant meilleures.
Les benchmarks de Hugging Face comme référence
Pour lever le voile sur ce débat, Hugging Face a développé des benchmarks solides. Testant tantôt un modèle de langage sur des raisonnements mathématiques, tantôt un générateur d’images sur des peluches de chats, tous évaluent les méthodes PEFT dans des conditions identiques : même base de modèle, dataset, code, et matériel. Ce cadre robuste révèle que plusieurs techniques restent compétitives contre LoRA, mais nécessitent une analyse plus nuancée.
LoRA domine de par sa visibilité et son adoption précoce, mais des alternatives performantes existent. Utilise des benchmarks pour évaluer la meilleure solution pour tes besoins spécifiques.
« LoRA’s popularity might be self-reinforcing, driven more by visibility than by unequivocal superiority. »
Observations sur l’usage de LoRA
Conclusion directe : LoRA n’est pas l’unique voie à suivre. Les benchmarks et évaluations objectives suggèrent que les décideurs doivent dépasser leur zone de confort et explorer les nouvelles avenues du fine-tuning. Penser qu’une technique reste la meilleure simplement par défaut pourrait coûter en performance non obtenue.