L'entreprise américaine Anthropic, spécialisée dans l'intelligence artificielle et conceptrice des modèles Claude, a suggéré le 4 juin la mise en place d'un cadre mondial permettant aux principaux acteurs de ce secteur de se coordonner pour ralentir ou interrompre temporairement le développement de l'IA de pointe. Cette proposition, publiée par l'Anthropic Institute – le centre de réflexion de la firme –, vise à laisser le temps aux structures sociales et aux travaux sur l'alignement des systèmes de suivre le rythme des progrès technologiques.
Dans un contexte de compétition acharnée avec des rivaux tels qu'OpenAI, Google ou encore le chinois DeepSeek, Anthropic insiste sur la nécessité d'un mécanisme de coordination à l'échelle planétaire, afin qu'aucun concurrent ne tire profit d'une éventuelle pause pour prendre une avance irréversible. L'entreprise cite le précédent du traité sur les forces nucléaires à portée intermédiaire (FNI) – qui avait mis des années à se concrétiser – tout en soulignant que l'urgence est plus grande pour l'IA, une technologie « bien plus facile à dissimuler que des silos de missiles ».
La proposition précise que, sans un tel dispositif de coordination, les entreprises et les gouvernements seront contraints de prendre des décisions de sécurité complexes sous la pression de la concurrence et des enjeux géopolitiques. Anthropic reconnaît que l'idée devrait se heurter à de fortes résistances, notamment aux États-Unis, où de nombreux responsables politiques et dirigeants de la tech refusent tout ralentissement qui pourrait offrir un avantage décisif à la Chine. Le président Donald Trump a toutefois évoqué, lors d'une récente visite à Pékin, la possibilité d'une coopération avec la Chine sur la sûreté de l'IA.
Des données internes sur le risque d'auto-amélioration
Pour étayer sa proposition, Anthropic a dévoilé des données internes qui illustrent la possibilité d'atteindre un jour ce qu'elle nomme l'« auto-amélioration récursive » – le stade où des systèmes d'IA deviendraient capables d'entraîner leurs successeurs avec un rôle humain réduit. L'entreprise précise qu'« rien ne garantit qu'une telle bascule soit à l'horizon », mais ajoute que « si les tendances actuelles se poursuivent », cela deviendrait « plausible ». Elle y voit à la fois un bond potentiel pour la médecine, la technologie et l'économie, ainsi qu'un risque de « perte de contrôle ».
Un contexte de régulation naissante et de critiques
Fondée par d'anciens membres d'OpenAI, Anthropic s'est construit une réputation de laboratoire plaçant l'éthique et la sécurité au cœur de son activité. Cette image est toutefois contestée par certains acteurs de l'industrie et des responsables de la Maison Blanche, qui accusent l'entreprise d'exagérer les risques, voire de mener une stratégie de « marketing de la peur » dans le cadre de la course avec OpenAI vers une introduction en Bourse.
Depuis environ deux mois, Anthropic a par ailleurs restreint la diffusion de son modèle le plus avancé, Mythos, afin de mettre en place des correctifs de cybersécurité avant de le rendre public. L'entreprise a annoncé la sortie prochaine de modèles aux performances équivalentes, tandis que des systèmes comparables sont attendus chez ses concurrents.
Cette initiative intervient alors que la régulation de l'IA connaît des évolutions aux États-Unis. Donald Trump a récemment promulgué des mesures de régulation au nom de la cybersécurité, marquant un tournant dans l'approche américaine. La proposition d'Anthropic, bien que susceptible de susciter des débats, relance la question d'une gouvernance mondiale de l'intelligence artificielle, à un moment où les capacités des systèmes progressent rapidement.