Anthropic, l'entreprise à l'origine de l'assistant conversationnel Claude, a franchi une étape significative dans le déploiement de son intelligence artificielle. La version la plus puissante de sa technologie, désignée sous le nom de code Mythos, a été rendue accessible à un large public. Cette mise à disposition s'accompagne toutefois de restrictions volontaires inédites, conçues pour empêcher l'utilisation du modèle dans des domaines jugés particulièrement sensibles.

Un accès élargi avec des garde-fous techniques

La décision d'Anthropic, officialisée ce mardi 9 juin, concerne la première version publique de la gamme Mythos. Baptisé Fable 5, ce modèle représente le summum des capacités de la firme. L'ouverture à tous contraste avec la prudence qui a longtemps prévalu au sein de l'industrie, où les modèles les plus performants étaient souvent réservés à des partenaires de confiance ou à des environnements contrôlés.

Pour concilier ambition technologique et impératifs de sécurité, Anthropic a intégré des mécanismes de bride dès la conception du modèle. Ces limitations, activées par défaut, empêchent l'IA de générer des réponses détaillées dans les domaines de la cybersécurité offensive et des agents biologiques dangereux. Un porte-parole de la société a justifié cette approche par la nécessité d'« éviter tout usage malveillant à grande échelle », tout en reconnaissant que ces restrictions pourraient être levées pour des organismes de recherche agréés.

Des capacités retirées pour prévenir les mésusages

Les analyses techniques post-lancement indiquent que le modèle Fable 5 possède des compétences remarquables en matière de raisonnement et de génération de code, mais qu'il a été délibérément affaibli sur des tâches spécifiques. Par exemple, il refuse de fournir des instructions précises pour la conception de virus informatiques ou la synthèse de toxines biologiques. Les testeurs ont observé que le système répond par des refus catégoriques ou par des informations générales et non exploitables lorsqu'il est sollicité sur ces sujets.

Cette stratégie de « bridage » distingue Anthropic de certains concurrents qui misent sur une ouverture totale de leurs modèles, laissant aux utilisateurs la responsabilité de leur usage. L'entreprise justifie son choix par une évaluation interne des risques, qui a conclu qu'un accès non filtré à son IA la plus avancée pourrait faciliter des actes de cybercriminalité ou de bioterrorisme.

Implications pour le secteur

L'initiative d'Anthropic relance le débat sur la régulation des intelligences artificielles. En proposant un modèle puissant mais volontairement limité, la start-up californienne cherche à anticiper des réglementations qui pourraient être imposées par les autorités. Des discussions auraient eu lieu avec des représentants de l'Union européenne, où la législation sur l'IA est en phase finale d'adoption. Bruxelles a montré un intérêt particulier pour les mécanismes de contrôle proposés par Anthropic, y voyant une piste pour encadrer les futurs déploiements.

Pour les organisations qui souhaitent utiliser Mythos dans des contextes de recherche en sécurité, Anthropic prévoit un processus de demande d'accès dérogatoire. Ce dispositif, soumis à validation, permettrait de débloquer certaines fonctionnalités restreintes pour des études légitimes, sous supervision. La question de l'équilibre entre innovation et précaution reste au cœur des préoccupations, alors que les capacités des modèles d'IA progressent plus vite que le cadre juridique qui les régit.