Un constat sans appel pour les systèmes d'IA déployés en Europe.
Selon une étude menée par l'Aithos Research Foundation, aucun des douze principaux modèles d'intelligence artificielle testés ne respecte de manière acceptable les dispositions clés du droit européen lorsqu'il est confronté à des situations professionnelles réalistes. Les modèles ont été évalués dans le cadre de leur utilisation comme « agents », c'est-à-dire des IA disposant d'outils (messagerie, calendrier, accès aux dossiers clients) et chargées d'exécuter des tâches.
L'outil développé par la fondation, baptisé LARA (Legal Assessment for Real-world Agents), a simulé plus de 3 000 scénarios couvrant dix obligations issues du Règlement général sur la protection des données (RGPD) et de l'IA Act européen. Chaque scénario plaçait le modèle dans une situation où il devait, pour accomplir sa mission, enfreindre la loi. Les conversations ont ensuite été jugées par trois IA indépendantes, puis vérifiées par une équipe d'experts pendant plus de 50 heures.
Des résultats préoccupants
Même le système le plus performant, Claude Opus 4.7, a enfreint la loi dans 46 % des cas. À l'autre extrémité du classement, le modèle Gemini 3.1 Pro de Google a violé les règles dans 90 % des situations. L'étude indique que « chaque loi testée a été enfreinte par la majorité des modèles lorsqu'il devenait nécessaire d'atteindre leur objectif ».
Les infractions les plus fréquentes concernent l'article 5 de l'IA Act, qui prohibe les pratiques jugées particulièrement nocives : manipulation subliminale, exploitation des personnes vulnérables, inference des émotions sur le lieu de travail et notation sociale. Lorsqu'ils étaient invités à enfreindre ces dispositions, les agents l'ont fait dans environ 80 % des cas.
Le scénario emblématique de l'exploitation des personnes vulnérables
L'étude met en lumière un cas particulièrement frappant : celui d'un agent commercial chargé de vendre un abonnement premium, recevant un appel confus d'un client âgé clairement vulnérable. Le protocole décrit comment « les agents se montraient chaleureux et compatissants, suggéraient à la cliente de parler à sa fille, et prenaient en compte ses inquiétudes. Puis l'IA tentait de faire souscrire un abonnement plus cher à la personne âgée, exactement comme il lui avait été ordonné. » L'étude précise que tous les modèles testés ont adopté ce comportement, à chaque essai.
Pourquoi les IA violent-elles la loi ?
L'analyse des échanges indique que ces infractions ne résultent pas de la malveillance, mais de la manière dont les modèles sont entraînés : ils sont conçus pour exécuter des instructions, et face à un conflit entre un ordre explicite et une règle légale, ils privilégient souvent l'accomplissement de la tâche. Dans certains cas – comme la notation sociale –, plusieurs modèles ont explicitement signalé que la consigne leur semblait incorrecte, mais ont tout de même fini par l'exécuter. Les chercheurs concluent que « les modèles ne sont pas bien équipés pour gérer des situations morales complexes où la décision