SAIR : Transformer la R&D pharmaceutique avec l'intelligence structurelle

SAIR : Transformer la R&D pharmaceutique avec l’intelligence structurelle

🗓 19 Mar 2026 · ⏱ 8 min de lecture · 🤖 Généré par IA

SAIR transforme la R&D pharmaceutique avec plus de 5 millions de structures 3D IA générées, accélérant la découverte de médicaments.

Cette année, SandboxAQ a publié le Structurally Augmented IC50 Repository (SAIR), le plus grand ensemble de données de structures 3D de protéines-ligands co-repliées, avec plus de 5 millions de structures disponibles. Le tout gratuitement sur Hugging Face, offrant aux chercheurs un accès inédit à des données de puissance de liaison validées empiriquement.

SAIR : une nouvelle dynamique dans la R&D pharmaceutique

SAIR, en reliant directement la structure moléculaire à la puissance des médicaments, révolutionne la conception de médicaments assistée par IA. Ce dataset, librement accessible, n’est pas simplement un catalogue de données ; c’est un levier stratégique pour accélérer la recherche et développement dans l’industrie pharma et biotech, notamment en réduisant le temps de découverte et en améliorant l’optimisation des médicaments grâce à l’IA.

« SAIR permet d’éclairer les zones d’ombre du proteome, ouvrant des opportunités pour cibler des protéines jusqu’ici inexplorées. »

Research Team de SandboxAQ

IA et modélisation moléculaire : un tournant essentiel

L’IA et le design assisté par ordinateur promettent de réduire drastiquement les délais de découverte de nouveaux médicaments. Cependant, ces ambitions sont souvent freinées par le manque de prédiction précise des propriétés clés des médicaments. SAIR change la donne en fournissant des structures 3D dynamiques, là où AlphaFold ne donnait que des instantanés statiques. L’intégration de 5,24 millions de complexes 3D dans SAIR souligne cette avancée, facilitant des modèles d’affinité qui accélèrent les prédictions jusqu’à 1 000 fois par rapport aux méthodes traditionnelles.

Une infrastructure IA optimisée pour des résultats exponentiels

La création de SAIR représente un exploit de calcul en IA de haute performance, nécessitant plus de 130 000 heures de GPU sur un cluster de processurs NVIDIA H100. En optimisant pleinement l’infrastructure et en collaborant étroitement pour maximiser l’utilisation à 95% des capacités de calcul, il a été possible de générer le dataset en trois semaines au lieu de trois mois initialement prévus.

💡 À retenir

SAIR révolutionne la R&D pharmaceutique avec des données en open source, comblant une lacune critique et ouvrant la voie à des découvertes plus rapides et plus fiables.

Aborder l’inconnu : le potentiel de SAIR pour explorer de nouvelles cibles

Une des ambitions de SAIR est d’éclairer le « dark proteome », ces protéines pour lesquelles il n’existe pas de structures expérimentales. Plus de 40% des protéines dans SAIR n’ont aucune structure dans le Protein Data Bank, avec ou sans ligand. Cela permet aux chercheurs de s’aventurer vers des cibles considérées jusque-là comme « indruggables », en utilisant des hypothèses structurelles basées sur la puissance prédictive de l’IA.

En conclusion, SAIR n’offre pas seulement des données, mais un paradigme renouvelé pour la recherche pharmaceutique. Pour quiconque s’intéresse à l’innovation dans le domaine de la santé, ignorer une telle ressource serait une erreur monumentale. L’accès à SAIR via Hugging Face présente une opportunité unique que toute structure engagée dans la R&D ne peut se permettre de négliger.

🔗 Source originaleLire l’article source
Partager : LinkedIn