Un test qui tourne à la démonstration de force

Dans le cadre d'une évaluation supervisée, le modèle d'intelligence artificielle Claude Mythos a réussi à s'introduire dans les infrastructures informatiques de la National Security Agency (NSA), l'agence américaine chargée du renseignement électronique et de la sécurité des systèmes d'information. Ce résultat, révélé par des sources proches du dossier, a immédiatement relancé les interrogations sur les capacités offensives des IA les plus avancées et sur les mesures de contrôle qui les entourent.

Selon les informations disponibles, ce test a été conçu pour mesurer les aptitudes de l'IA à identifier et exploiter des vulnérabilités dans des environnements hautement protégés. Claude Mythos, modèle phare d'Anthropic, a non seulement rempli cet objectif, mais l'a fait avec une efficacité jugée préoccupante par plusieurs experts.

Des inquiétudes déjà vives

Cette démonstration intervient dans un climat déjà tendu autour de Claude Mythos. Le modèle avait été suspendu en juin par son développeur, à la suite d'injonctions des autorités américaines invoquant la « sécurité nationale ». L'administration américaine avait alors pointé des risques potentiels liés à la dissémination de capacités duales, utilisables à la fois pour la défense et pour des cyberattaques.

Par la suite, un embargo frappant les modèles Fable et Mythos avait été dénoncé par une centaine d'experts en cybersécurité, ainsi que par la Commission européenne, qui y voyait une « discrimination » injustifiée. Des fuites avaient également évoqué un possible accès de la Chine à certaines versions de ces IA, ajoutant à la tension géopolitique.

Un précédent qui interroge

La réussite de Claude Mythos face aux défenses de la NSA confirme, aux yeux de nombreux observateurs, que le niveau de menace associé à ces modèles n'est pas théorique. Si l'exercice était supervisé et limité dans son périmètre, il démontre qu'une IA dotée de capacités de raisonnement avancées peut automatiser des phases entières de pénétration de réseaux, une tâche jusqu'alors réservée à des équipes humaines hautement spécialisées.

Certains spécialistes estiment que ce type de test souligne la nécessité de définir un cadre réglementaire international plus strict pour les modèles d'IA les plus puissants, avant qu'ils ne soient déployés ou, pire, ne tombent entre de mauvaises mains. D'autres, au contraire, jugent que ces évaluations sont précisément le moyen de mieux cerner les risques et de développer des contre-mesures adaptées.

La position d'Anthropic et les suites attendues

Anthropic, pour l'instant, n'a pas commenté officiellement les résultats de ce test. La société s'était engagée à coopérer avec les autorités américaines après la suspension de ses modèles. La question de la levée partielle ou totale de l'embargo reste en suspens, tandis que des voix, y compris au sein du monde politique européen, appellent à une meilleure coordination transatlantique sur le sujet.

Le précédent créé par cette intrusion supervisée pourrait peser dans les débats à venir, tant sur le plan technique que diplomatique. Il illustre en tout cas une réalité que les ingénieurs en sécurité connaissent bien : les systèmes les mieux protégés ne sont jamais totalement à l'abri, surtout face à une intelligence capable d'apprendre et de s'adapter en temps réel.