CFM utilise LLM pour affiner NER en finance : efficacité renforcée, coûts réduits jusqu’à 80 fois.
Réduire drastiquement les coûts d’analyse tout en augmentant la précision : c’est ce que Capital Fund Management (CFM) a réussi en collaborant avec Hugging Face pour optimiser la reconnaissance des entités nommées (NER) dans les données financières. En utilisant des modèles de langage ouverts, CFM a amélioré la précision jusqu’à 6,4% et a réduit les coûts d’opération par un facteur de 80.
Amélioration des annotations avec les LLMs
CFM a adopté l’approche innovante de l’assistance par LLM pour l’étiquetage de données grâce aux modèles Llama de Meta. Ces modèles ont généré des annotations auto-assistées qui ont ensuite été validées manuellement via Argilla, un outil d’annotation open-source. Cette méthodologie a permis à la fois un traitement rapide et précis des données critiques.
Economies substantielles grâce à l’infrastructure Hugging Face
En déployant des modèles comme Llama 3.1 sur les endpoints d’inférence de Hugging Face, CFM a pu s’affranchir des tracas liés à la gestion de l’infrastructure. Les coûts sont passés de 8,00 $ pour un large modèle à seulement 0.10 $ pour les plus compacts, tout en préservant la qualité des résultats obtenus.
CFM démontre qu’avec les bons outils open-source, on peut non seulement booster la performance mais également réduire significativement les coûts opérationnels. Une leçon précieuse pour toute entreprise technophile.
Performance accrue des modèles compacts
La fine-tune de modèles compacts sur des datasets rigoureusement étiquetés a transformé des résultats initialement médiocres en véritables outils précis pour la finance. Par exemple, le modèle GLiNER a vu son score F1 passer de 87,0% à 93,4%.
« Cette approche de fine-tuning allie l’efficacité et la performance à un coût réduit – une aubaine pour les fonds d’investissement quantitatifs. »
CFM Engineering Team
Adoption stratégique pour la finance
Pour un acteur comme CFM, utiliser LLM signifie plus que suivre la tendance. Cela leur permet d’exploiter des données textuelles de manière autonome et précise, créant ainsi un avantage significatif par rapport aux méthodes traditionnelles.