Biohub dévoile un « modèle du monde » de la biologie des protéines

REDWOOD CITY, Californie — Biohub, une organisation de recherche biomédicale, a annoncé la publication d'un « modèle du monde » de la biologie des protéines. Ce nouvel ensemble d'outils, basé sur l'intelligence artificielle, permet de prédire la structure des protéines, d'en concevoir de nouvelles et de cartographier l'univers des protéines à travers l'ensemble du vivant.

L'annonce, faite le 27 mai 2026, repose sur trois piliers technologiques : ESMC, ESMFold2 et ESM Atlas. Ces modèles sont librement mis à disposition de la communauté scientifique mondiale.

Un moteur de découverte fondé sur l'évolution

Le cœur du système, ESMC, est un modèle de langage de pointe entraîné sur environ 2,8 milliards de séquences de protéines issues de l'ensemble du vivant. L'hypothèse scientifique centrale est qu'en s'entraînant sur les séquences de toutes les formes de vie, le modèle internalise les propriétés fondamentales qui régissent la biologie des protéines : les règles selon lesquelles elles se replient, interagissent et fonctionnent.

ESMFold2 est le moteur de conception qui transforme les représentations de séquences d'ESMC en structures tridimensionnelles à résolution atomique de complexes biomoléculaires. Il est capable de prédire les configurations structurales les plus susceptibles d'atteindre une haute affinité pour une cible donnée.

Des résultats concrets en laboratoire

Dans des expériences décrites dans une prépublication publiée le même jour, les chercheurs de Biohub ont utilisé ESMFold2 pour concevoir des protéines capables de se lier à cinq cibles majeures dans la recherche sur le cancer et l'immunologie : EGFR, PDGFRβ, PD-L1, CTLA-4 et CD45. Ces cibles sont impliquées dans la croissance tumorale ou les mécanismes d'évasion immunitaire.

Résultat : les conceptions ont atteint des taux de réussite allant de 36 % à 88 % pour les mini-liants et de 15 % à 29 % pour les formats dérivés d'anticorps. Tous les liants conçus ont été validés en laboratoire comme capables de se lier à leurs cibles. L'une des conceptions, dirigée contre PD-L1, a même restauré la signalisation des cellules T dans des tests en laboratoire, bloquant la même voie que les thérapies par points de contrôle immunitaire déjà approuvées.

Les chercheurs soulignent que ces liants conçus présentent une haute affinité, spécificité et stabilité — des propriétés essentielles pour une utilité clinique. Ils montrent une similarité minimale avec les séquences des bases de données publiques, ce qui suggère que le modèle produit des solutions de novo, plutôt que de simplement récupérer des liants connus.

La recherche computationnelle, qui aurait pris plusieurs mois ou années par les méthodes traditionnelles, a été réalisée en quelques jours.

ESM Atlas : cartographier l'inconnu

Le troisième outil, ESM Atlas, rend les représentations d'ESMC navigables à travers 6,8 milliards de séquences de protéines et 1,1 milliard de structures prédites — ce qui constitue la plus grande application de l'IA à la biologie des protéines à ce jour. Il organise les protéines selon les relations apprises par le modèle, mettant en lumière des connexions que les bases de données existantes n'avaient pas capturées, notamment des liens évolutifs entre des enzymes d'édition de gènes dispersées dans des branches éloignées du vivant.

« Une grande partie de cette biologie n'a jamais été annotée », indique Biohub. Pour les chercheurs travaillant sur des maladies dont la biologie est mal comprise, cet outil rend possible la recherche dans des domaines biologiques non caractérisés.

Un modèle du monde comme fondation ouverte

Alex Rives, responsable scientifique de Biohub, a déclaré : « Concevoir les interactions entre les protéines est un problème fondamental en biochimie, et essentiel pour la conception de médicaments. Ce que nous avons montré, c'est que ces modèles ont appris un modèle du monde de la biologie d'une fidélité telle que vous pouvez concevoir des interfaces protéiques de manière computationnelle, les emmener en laboratoire, et elles fonctionnent comme prédit. »

Le Dr Priscilla Chan, cofondatrice de Biohub, a ajouté : « Biohub a été fondé sur la conviction que la science ouverte accélère la découverte. Rendre ces outils librement accessibles signifie que les chercheurs du monde entier peuvent aller plus vite vers des remèdes personnalisés qui fonctionnent pour chaque patient. »

Un changement de paradigme pour la découverte de médicaments

Les thérapies à base d'anticorps représentent environ un quart des nouvelles approbations de médicaments par la FDA, couvrant les cancers, les maladies auto-immunes et d'autres pathologies. Trouver un candidat thérapeutique viable prend généralement trois à quatre ans de développement préclinique. ESMFold2 peut déplacer une grande partie de la recherche initiale vers le computationnel, produisant des conceptions testables en quelques jours.

Biohub se présente comme une organisation de recherche biomédicale à but non lucratif (501(c)(3)), construisant une initiative de grande envergure combinant l'IA de pointe et la biologie de pointe pour résoudre les maladies. L'ensemble des outils est accessible sur la plateforme Biohub.