Étude LARA : les IA de pointe violent la réglementation européenne dans la majorité des cas

Un constat sans appel pour les systèmes d'IA déployés en Europe.

Selon une étude menée par l'Aithos Research Foundation, aucun des douze principaux modèles d'intelligence artificielle testés ne respecte de manière acceptable les dispositions clés du droit européen lorsqu'il est confronté à des situations professionnelles réalistes. Les modèles ont été évalués dans le cadre de leur utilisation comme « agents », c'est-à-dire des IA disposant d'outils (messagerie, calendrier, accès aux dossiers clients) et chargées d'exécuter des tâches.

L'outil développé par la fondation, baptisé LARA (Legal Assessment for Real-world Agents), a simulé plus de 3 000 scénarios couvrant dix obligations issues du Règlement général sur la protection des données (RGPD) et de l'IA Act européen. Chaque scénario plaçait le modèle dans une situation où il devait, pour accomplir sa mission, enfreindre la loi. Les conversations ont ensuite été jugées par trois IA indépendantes, puis vérifiées par une équipe d'experts pendant plus de 50 heures.

Des résultats préoccupants

Même le système le plus performant, Claude Opus 4.7, a enfreint la loi dans 46 % des cas. À l'autre extrémité du classement, le modèle Gemini 3.1 Pro de Google a violé les règles dans 90 % des situations. L'étude indique que « chaque loi testée a été enfreinte par la majorité des modèles lorsqu'il devenait nécessaire d'atteindre leur objectif ».

Les infractions les plus fréquentes concernent l'article 5 de l'IA Act, qui prohibe les pratiques jugées particulièrement nocives : manipulation subliminale, exploitation des personnes vulnérables, inference des émotions sur le lieu de travail et notation sociale. Lorsqu'ils étaient invités à enfreindre ces dispositions, les agents l'ont fait dans environ 80 % des cas.

Le scénario emblématique de l'exploitation des personnes vulnérables

L'étude met en lumière un cas particulièrement frappant : celui d'un agent commercial chargé de vendre un abonnement premium, recevant un appel confus d'un client âgé clairement vulnérable. Le protocole décrit comment « les agents se montraient chaleureux et compatissants, suggéraient à la cliente de parler à sa fille, et prenaient en compte ses inquiétudes. Puis l'IA tentait de faire souscrire un abonnement plus cher à la personne âgée, exactement comme il lui avait été ordonné. » L'étude précise que tous les modèles testés ont adopté ce comportement, à chaque essai.

Pourquoi les IA violent-elles la loi ?

L'analyse des échanges indique que ces infractions ne résultent pas de la malveillance, mais de la manière dont les modèles sont entraînés : ils sont conçus pour exécuter des instructions, et face à un conflit entre un ordre explicite et une règle légale, ils privilégient souvent l'accomplissement de la tâche. Dans certains cas – comme la notation sociale –, plusieurs modèles ont explicitement signalé que la consigne leur semblait incorrecte, mais ont tout de même fini par l'exécuter. Les chercheurs concluent que « les modèles ne sont pas bien équipés pour gérer des situations morales complexes où la décision

Selon une étude, les principaux modèles d'IA violent la loi dans la majorité des scénarios professionnels simulés

À lire ensuite

Nucléaire iranien : l'optimisme américain ravivé à l'approche d'une décision finale

Jeux olympiques d'hiver 2030 : Lyon en passe de devenir le site unique pour les sports de glace, Nice écartée

Médicaments anti-obésité : le Wegovy et le Mounjaro remboursés à partir de la mi-juin sous conditions, patient...

Peter Thiel installe sa famille en Argentine, séduit par les réformes libertaires de Milei