Le laboratoire national d'Argonne, rattaché au département américain de l'Énergie (DoE), a dévoilé un nouveau service d'inférence pour l'intelligence artificielle, construit à partir de la puissance de calcul excédentaire de ses supercalculateurs. L'initiative, présentée mardi, vise à permettre aux chercheurs du DoE et à ceux travaillant sur la mission Genesis de faire progresser la découverte scientifique dans divers domaines.

Des clusters dédiés à l'inférence

Le service exploite actuellement deux clusters de calcul. Le premier, nommé Sophia, est équipé de 192 GPU Nvidia A100, dont la plupart disposent de 40 Go de mémoire. Le second, Metis, utilise 32 accélérateurs SambaNova SN40L, une configuration jugée plus remarquable. À l'avenir, le service d'inférence sera étendu aux systèmes Tara (basé sur Nvidia GH200) et Minerva (basé sur Nvidia B200).

Argonne abrite certains des plus grands clusters de supercalculateurs au monde, notamment le supercalculateur Aurora, classé troisième. Sa capacité de calcul comprend également plusieurs systèmes plus petits optimisés pour l'IA.

Un portail chatbot pour les modèles de langage

Le service offre aux chercheurs un accès à une gamme de grands modèles de langage (LLM) via une interface de type chatbot. Parmi les modèles disponibles figurent GPT-OSS d'OpenAI, la famille Gemma de Google, la collection Llama de Meta, ainsi que divers modèles spécialisés et personnalisés comme AuroraGPT. Pour certains de ses services, Argonne utilise Open WebUI, un service de chatbot auto-hébergé.

« En proposant l'inférence IA comme une ressource partagée, nous permettons aux chercheurs d'appliquer l'IA à grande échelle à leurs données, leurs simulations et leurs expériences, sans avoir à construire et maintenir leur propre infrastructure », a déclaré Michael Papka, directeur de l'ALCF (Argonne Leadership Computing Facility), dans un communiqué.

Sécurité des données et applications concrètes

Un aspect crucial du service est qu'il permet aux chercheurs du DoE d'expérimenter avec des chatbots de manière sécurisée, sans exposer leurs données à des services publics comme ChatGPT. Selon Argonne, des chercheurs utilisent déjà le service pour analyser des données expérimentales en temps réel, par exemple pour prédire les perturbations du plasma dans la recherche sur la fusion nucléaire. D'autres scientifiques l'emploient pour trier de grandes quantités de données générées par des accélérateurs de particules et des télescopes, afin de réduire le champ des candidats les plus prometteurs.

Ce service représente une nouvelle étape dans l'utilisation de l'IA pour la recherche scientifique, en offrant une capacité de calcul massive sans nécessiter d'investissement supplémentaire en infrastructure.