Un paradoxe assumé

Anthropic a élargi l’accès à son modèle d’intelligence artificielle Mythos à plus de 150 organisations réparties dans une quinzaine de pays, selon des sources proches du dossier. Cette décision intervient alors même que la société californienne qualifie ouvertement son propre système de « dangereux », une mise en garde qui interroge sur les motivations d’un tel déploiement.

Le modèle Mythos, présenté comme l’un des plus avancés de sa catégorie, a été conçu pour générer du texte et raisonner sur des sujets complexes. Mais ses capacités, notamment en matière de persuasion et de génération de contenus trompeurs, ont conduit Anthropic à l’entourer de précautions inédites.

Des garanties techniques renforcées

Pour concilier diffusion et sécurité, la start-up a mis en place un processus de vérification rigoureux avant d’accorder l’accès. Chaque organisation candidate doit démontrer un usage légitime et accepter des conditions d’utilisation restrictives. Des garde-fous techniques, comme le filtrage des requêtes sensibles et la limitation des sorties potentiellement nuisibles, ont été intégrés au modèle.

Les organisations autorisées – institutions académiques, laboratoires de recherche, entreprises technologiques – sont réparties dans des pays d’Europe, d’Asie et d’Amérique du Nord. Anthropic affirme suivre en temps réel l’utilisation de Mythos pour détecter d’éventuels détournements.

Une évaluation critique venue de l’intérieur

La particularité du cas tient au discours interne d’Anthropic. Lors de présentations privées et dans des documents internes cités par des personnes informées, les équipes de recherche ont décrit Mythos comme présentant un « risque élevé » en cas d’utilisation malveillante. L’entreprise elle-même a reconnu que certaines capacités du modèle pouvaient être employées pour manipuler l’opinion ou générer des campagnes de désinformation.

« Nous savons que ce modèle peut causer des dommages s’il tombe entre de mauvaises mains, mais nous pensons qu’il est préférable de le déployer sous contrôle plutôt que de le laisser se développer dans l’ombre », aurait déclaré un responsable d’Anthropic, selon un compte rendu anonyme.

Un précédent dans le secteur

Cette approche rappelle celle adoptée par d’autres acteurs de l’IA, notamment OpenAI, qui avaient d’abord limité puis progressivement ouvert des modèles puissants comme GPT-4. Anthropic, fondée par d’anciens employés d’OpenAI, se distingue toutefois par un discours plus alarmiste sur ses propres créations.

Le paradoxe n’a pas échappé aux observateurs : comment justifier la distribution d’une technologie que l’on dit dangereuse ? Anthropic argue que la recherche sur la sécurité ne peut progresser qu’en confrontant les modèles à des usages réels, et qu’un accès restreint mais contrôlé permet d’accumuler des données utiles pour affiner les mécanismes de protection.

Des voix critiques s’élèvent

Plusieurs experts en éthique de l’IA ont exprimé leur inquiétude. Ils estiment que le déploiement à grande échelle, même assorti de garanties, multiplie les risques de fuite ou de contournement des restrictions. « Une fois qu’un modèle est dans la nature, il est presque impossible de le rappeler », souligne un chercheur en cybersécurité, sous couvert d’anonymat.

D’autres, au contraire, saluent la transparence d’Anthropic et jugent que reconnaître les dangers est une première étape nécessaire vers une régulation efficace. « Le vrai problème serait de prétendre que l’IA est parfaitement sûre », analyse une spécialiste des politiques numériques.

Prochaines étapes

Anthropic prévoit d’étendre encore l’accès à Mythos dans les mois à venir, tout en renforçant son programme de surveillance. La société a annoncé la publication d’un livre blanc détaillant les risques identifiés et les mesures correctives mises en œuvre. Par ailleurs, des discussions seraient en cours avec des régulateurs européens et américains pour encadrer le déploiement des modèles de pointe.

L’expansion de Mythos illustre le dilemme auquel fait face toute l’industrie de l’IA : innover vite tout en maîtrisant des outils dont la puissance dépasse parfois les garde-fous mis en place.