Un développeur a présenté BioPetals, une adaptation d'un projet existant permettant de faire fonctionner un grand modèle de langage (LLM) ajusté pour des tâches de biologie en utilisant un réseau d'ordinateurs distribué. L'initiative s'inspire directement du système Petals, une bibliothèque qui répartit les poids d'un LLM sur plusieurs machines connectées en réseau.

Origine du projet L'auteur raconte avoir dû attendre près de deux heures pour obtenir un résultat après avoir soumis une séquence à un serveur de repliement de protéines basé sur l'intelligence artificielle. Cette expérience l'a conduit à chercher un moyen de réduire les temps d'attente en mutualisant les ressources de calcul. Le projet Petals, qui permet d'exécuter des LLM de grande taille sur des cartes graphiques grand public ou même via Google Colab en répartissant l'inférence entre les participants, lui a semblé une base prometteuse.

Adaptation pour la biologie Plutôt que de réécrire entièrement Petals pour différents types de modèles biologiques (modèles de langage génomique ou protéique), l'auteur a choisi de commencer par une adaptation plus simple : un modèle de type Llama (Large Language Model Meta AI) spécialisé pour la biologie. BioPetals reprend ainsi l'architecture de Petals mais avec des poids ajustés pour des applications biologiques.

Fonctionnement technique Le système repose sur un réseau pair-à-pair où chaque participant héberge une partie des poids du modèle. Lorsqu'un utilisateur soumet une requête d'inférence, le calcul est réparti dynamiquement entre les machines disponibles. Cela permet de faire fonctionner des modèles qui nécessiteraient autrement des serveurs très puissants, avec du matériel plus modeste. Un Google Colab entièrement configuré est fourni dans le fichier README du projet pour faciliter les tests.

Limites et perspectives L'auteur prévient que le bon fonctionnement de BioPetals dépend du nombre de participants connectés au réseau. Sans un nombre suffisant d'ordinateurs partageant leurs ressources, l'inférence peut ne pas aboutir. Le projet en est à un stade précoce, mais vise à démontrer qu'une approche décentralisée peut accélérer l'accès aux modèles de biologie computationnelle, notamment pour des tâches comme le repliement de protéines ou l'analyse de séquences génomiques.