Une promesse de sécurité mise à l’épreuve
Anthropic avait présenté Claude Fable 5 comme son modèle d’intelligence artificielle le plus sûr, doté de multiples barrières censées empêcher tout usage détourné ou dangereux. Lancée début juin 2026, cette version bridée de son IA phare Mythos devait rassurer les régulateurs et le public en limitant drastiquement les possibilités de génération de contenus sensibles. Pourtant, des chercheurs en cybersécurité ont réussi à percer ces défenses en seulement 48 heures après la mise à disposition du modèle.
Des failles exploitées par des attaques ciblées
Les tests réalisés par plusieurs équipes indépendantes ont montré que les garde-fous techniques mis en place par Anthropic pouvaient être contournés par des méthodes de « jailbreak » sophistiquées. En utilisant des formulations spécifiques ou en enchaînant des requêtes complexes, les pirates ont réussi à faire générer à l’IA des contenus interdits, notamment des instructions pour fabriquer des explosifs ou des discours haineux. Les experts soulignent que la rapidité de ce contournement – à peine deux jours – remet en cause l’efficacité de l’approche « safety by design » revendiquée par l’entreprise.
Des réactions politiques immédiates
Cette nouvelle a provoqué des réactions vives dans la classe politique. Plusieurs élus français ont dénoncé ce qu’ils considèrent comme un échec de la part d’Anthropic, qui avait pourtant promis une transparence totale sur ses tests de sécurité. Certains appellent à un renforcement des contrôles européens sur les modèles d’IA commercialisés sur le marché, tandis que d’autres estiment que la priorité doit être de financer des acteurs européens capables de rivaliser avec les géants américains. « On n’a qu’à favoriser le capital pour financer nos propres champions », a résumé un dirigeant politique, jugeant la dépendance technologique trop risquée.
Un débat sur la régulation de l’IA relancé
Au-delà de l’incident technique, cet épisode alimente les discussions autour du cadre réglementaire applicable aux intelligences artificielles. L’Union européenne travaille depuis plusieurs années sur un règlement censé encadrer les usages à risques, mais le contournement rapide de Fable 5 montre, selon des experts, que les mesures actuelles restent insuffisantes. Les promoteurs d’une régulation plus stricte réclament des tests obligatoires par des organismes indépendants avant toute mise sur le marché, ainsi que des sanctions en cas de manquement. Les opposants à cette approche rétorquent qu’une trop grande rigidité freinerait l’innovation et profiterait aux concurrents non européens.
Vers une remise en cause des promesses des entreprises ?
Pour de nombreux observateurs, l’affaire Claude Fable 5 illustre les limites des engagements volontaires des entreprises en matière de sécurité. Anthropic s’était engagée à déployer des mécanismes de contrôle « les plus avancés » pour éviter les dérives de son IA. Le fait que des chercheurs aient pu les neutraliser en moins de deux jours soulève des questions sur la crédibilité des discours commerciaux. L’entreprise n’a pas encore communiqué officiellement sur les modalités exactes du contournement, mais des experts estiment que des correctifs seront nécessaires rapidement pour restaurer la confiance.
Des implications pour l’ensemble du secteur
Ce cas pourrait avoir des répercussions au-delà d’Anthropic. D’autres acteurs comme OpenAI ou Google, qui proposent également des versions bridées de leurs IA avancées, surveillent de près la situation. Si des failles similaires étaient découvertes dans leurs propres systèmes, la pression réglementaire pourrait s’accentuer sur l’ensemble de l’industrie. En attendant, le débat sur l’équilibre entre innovation et sécurité reste plus que jamais d’actualité.