Hugging Face dévoile DeepResearch open source pour booster les capacités des agents de recherche web autonomes.
Hier, OpenAI a lancé DeepResearch, un système qui parcourt le web pour résumer du contenu et répondre à des questions sur cette base. Ce lancement a marqué un tournant, obtenant 67 % de réponses correctes sur le benchmark GAIA, une prouesse notamment sur les questions de niveau 3 qui nécessitent une série de raisonnements et l’utilisation d’outils en chaîne.
Comprendre les frameworks agents pour optimiser les LLM
Les frameworks agents ajoutent une couche supplémentaire aux LLM pour exécuter des actions comme naviguer sur le web. Un exemple frappant : l’intégration d’un agentic framework peut augmenter jusqu’à 60 points la performance des LLM. C’est là que la magie opère, transformant les LLM en véritables machines de compréhension et d’exécution de tâches complexes.
GAIA : un benchmark redoutable pour les systèmes IA
Le benchmark GAIA est l’un des plus exigeants, testant les limites des LLM à travers des questions complexes. Par exemple, réussir à identifier des fruits dans un tableau de 2008 et les lier à un menu de 1949 démontre l’énorme défi que représente ce benchmark pour un système d’agents.
« Intégrer nos LLM actuels dans un framework agentique représente un pas en avant significatif pour réaliser un DeepResearch ouvert. »
Blog de OpenAI
Open sourcing : une nouvelle ère avec CodeAgent
L’utilisation de CodeAgent, où les actions sont exprimées en code plutôt qu’en JSON, réduit le nombre de pas nécessaires de 30 %, ce qui se traduit par des systèmes d’agents plus économiques et plus efficaces. La possibilité de réutiliser des outils à partir de bibliothèques partagées et la meilleure gestion des états sont des atouts indéniables.
DeepResearch open source libère la puissance des agents de recherche grâce à l’intégration de frameworks agentiques performants, promettant des améliorations majeures dans la manière dont nous interagissons avec les LLM.
En conclusion, le projet de OpenAI et Hugging Face de rendre DeepResearch open source n’est pas seulement ambitieux, il redéfinit ce que nous pouvons attendre des agents de recherche sur le web. Cette initiative promet de démocratiser l’accès à des technologies auparavant restreintes, en ouvrant la voie à des innovations encore plus impressionnantes.