Quatre jours après son entrée en Bourse, le spécialiste américain des accélérateurs d’IA Cerebras a détaillé sa stratégie et ses alliances industrielles. Son directeur général, Andrew Feldman, a souligné que l’entreprise compte désormais deux clients majeurs dans le domaine de l’inférence, c’est-à-dire l’exécution de modèles d’intelligence artificielle déjà entraînés : OpenAI et Amazon Web Services (AWS). Il a indiqué qu’OpenAI ne dispose aujourd’hui que de deux fournisseurs d’accélérateurs pour l’IA en production : Cerebras et Nvidia, le leader du marché.
Une approche centrée sur l’inférence « désagrégée »
Le partenariat stratégique avec AWS porte sur une architecture dite « d’inférence désagrégée », qui consiste à séparer physiquement les ressources de calcul et de mémoire pour optimiser la latence. Selon Andrew Feldman, cette approche permet d’atteindre des vitesses de réponse très élevées, un avantage décisif alors que les applications d’IA générative exigent un traitement en temps réel. Cerebras mise sur ses puces à grande surface de silicium, capables de traiter des lots d’informations en parallèle, pour offrir une alternative aux GPU de Nvidia.
Un secteur en pleine recomposition
L’introduction en Bourse de Cerebras intervient dans un contexte de forte demande d’infrastructure pour l’IA. Les grandes entreprises technologiques cherchent à diversifier leurs sources d’approvisionnement en puces et à réduire leur dépendance à l’égard de Nvidia, dont les GPU dominent le marché. Andrew Feldman a estimé que l’inférence rapide devient le principal terrain de concurrence dans l’industrie, car les clients exigent des réponses quasi instantanées de la part des modèles déployés.
Les déclarations du dirigeant ont été faites lors d’un entretien avec un analyste du secteur. Le contenu précis des contrats avec OpenAI et AWS n’a pas été détaillé, mais leur existence confirme l’ancrage de Cerebras dans l’écosystème des grands acteurs de l’IA. Pour OpenAI, qui développe des modèles comme GPT, disposer d’une alternative à Nvidia pour l’inférence permet de réduire les goulots d’étranglement et de négocier les conditions d’approvisionnement.