Le groupe californien Anthropic a annoncé avoir suspendu vendredi l'accès à ses modèles d'intelligence artificielle Fable 5 et Mythos 5 pour se conformer à une directive de contrôle des exportations émise par le gouvernement des États-Unis. L'ordre, reçu à 17 h 21 (heure de la côte Est), cite des « autorités de sécurité nationale » et exige que tout accès aux modèles par un ressortissant étranger, qu'il se trouve à l'intérieur ou à l'extérieur du territoire américain, soit interrompu, ce qui inclut les employés d'Anthropic de nationalité étrangère. Pour garantir le respect de cette injonction, l'entreprise a dû désactiver brusquement les deux systèmes pour l'ensemble de ses utilisateurs. Les autres modèles d'Anthropic ne sont pas concernés par cette mesure.
Selon le communiqué officiel d'Anthropic, la lettre de l'exécutif américain n'a pas précisé la nature exacte du motif de sécurité nationale invoqué. L'entreprise comprend que les autorités estiment avoir identifié une méthode permettant de contourner, ou « jailbreaker », Fable 5. Anthropic indique avoir examiné une démonstration de cette technique spécifique, utilisée pour repérer un petit nombre de vulnérabilités mineures déjà connues. L'entreprise affirme que ces failles sont « relativement simples » et que d'autres modèles disponibles sur le marché parviennent à les détecter sans nécessiter un tel contournement.
Une divergence technique entre l'entreprise et l'administration
Anthropic a détaillé sa position concernant les systèmes de protection de Fable 5, rappelant avoir mis en place des garde-fous « solides » réduisant fortement la probabilité d'un usage malveillant, notamment dans le domaine de la cybersécurité. L'entreprise souligne avoir collaboré avec le gouvernement américain, l'Institut de sécurité de l'intelligence artificielle du Royaume-Uni (UK AISI), plusieurs organisations privées et ses propres équipes pour tester ces systèmes de protection pendant des milliers d'heures avant le lancement. Ces tests auraient démontré que les garde-fous de Fable étaient « sensiblement plus efficaces » que ceux de tout modèle précédemment déployé. Anthropic précise qu'aucun testeur n'est parvenu à trouver un « jailbreak universel » – une méthode capable de contourner largement les protections du modèle pour débloquer une vaste gamme de capacités cybernétiques.
L'entreprise reconnaît qu'une résistance parfaite au jailbreak n'est probablement pas réalisable pour aucun fournisseur de modèles à l'heure actuelle. Elle avait adopté une stratégie de « défense en profondeur » avec Fable 5, visant à rendre les contournements soit étroits, soit très coûteux à produire, combinée à une surveillance poussée pour détecter et neutraliser rapidement toute attaque réussie. Ce dispositif incluait également une conservation des données clients sur trente jours, une modification que l'entreprise assume malgré son coût commercial. Anthropic affirme n'avoir même pas reçu la divulgation d'un potentiel jailbreak non universel ayant conduit à un résultat nuisible. Les contournements signalés seraient soit des réponses « entièrement bénignes », soit des découvertes mineures n'offrant aucun avantage spécifique à Mythos.
Des précédents et des interrogations sur la procédure
La décision de l'administration américaine intervient quelques jours seulement après qu'Anthropic a présenté Fable 5 et Mythos 5 comme des modèles à la pointe de la technologie, surpassant plusieurs références du secteur. Fable 5 constituait la première fois que l'entreprise mettait à disposition du public une offre aussi avancée, grâce à des garde-fous renforcés. Ces modèles faisaient suite au lancement de Claude Mythos Preview en avril, qui avait suscité l'intérêt de Wall Street et des responsables gouvernementaux pour ses capacités avancées en cybersécurité. Anthropic avait alors limité son déploiement à un groupe restreint d'entreprises dans le cadre d'une initiative nommée Project Glasswing.
Anthropic a exprimé son désaccord avec la mesure prise par le gouvernement. L'entreprise estime que la découverte d'un potentiel jailbreak étroit ne devrait pas justifier le retrait d'un modèle commercial déployé auprès de centaines de millions de personnes. Elle prévient que si cette norme était appliquée à l'ensemble du secteur, elle « stopperait essentiellement tous les nouveaux déploiements de modèles pour tous les fournisseurs de modèles de pointe ». Anthropic a déclaré qu'elle continue de penser que le gouvernement devrait avoir la capacité de bloquer des déploiements non sûrs, mais dans le cadre d'un processus statutaire « transparent, équitable, clair et fondé sur des faits techniques », estimant que cette action ne respecte pas ces principes.
L'entreprise a présenté ses excuses à ses clients pour la perturbation et affirme travailler à rétablir l'accès « dès que possible », en considérant qu'il s'agit d'un malentendu.