OpenAI a présenté une nouvelle option de sécurité destinée à ses utilisateurs professionnels et à certains abonnés individuels. Baptisée Lockdown Mode (mode verrouillé), elle vise à réduire les risques d'exfiltration de données lors d'attaques par injection de prompts, une technique où des instructions malveillantes sont dissimulées dans des pages web ou d'autres contenus consultés par le chatbot.

Fonctionnalités désactivées

Avec ce mode activé, plusieurs capacités de ChatGPT sont bridées. La navigation en direct sur le web est remplacée par un accès exclusif au contenu mis en cache. L'affichage et la récupération d'images depuis des sites distants sont bloqués (la génération d'images par le modèle reste possible). Les fonctions de recherche approfondie (deep research) et de mode agent (agent mode) sont également rendues inopérantes. Selon OpenAI, ces limitations visent à couper court aux vecteurs les plus courants d'injection de prompts, qui peuvent détourner le modèle pour lui faire envoyer des données confidentielles à un attaquant.

Limites reconnues

La société a néanmoins admis que le Lockdown Mode n'offre pas une protection infaillible. Des injections de prompts « peuvent apparaître dans du contenu web mis en cache ou dans un fichier téléchargé, et pourraient encore affecter le comportement ou la précision d'une réponse », indique le communiqué d'OpenAI. L'objectif affiché est de réduire la probabilité que des informations sensibles soient partagées au cours de l'échange avec le chatbot, mais non de l'éliminer complètement.

Public cible et déploiement

« Le Lockdown Mode n'est pas destiné à tout le monde », précise OpenAI. « Il est conçu pour les personnes et les organisations qui manipulent des données sensibles et souhaitent une protection plus stricte contre les risques d'exfiltration liés à l'injection de prompts. » La fonctionnalité est en cours de déploiement pour les comptes ChatGPT Business en libre-service (self-serve), ainsi que pour certains comptes personnels éligibles.

Contexte et enjeux

Cette initiative s'inscrit dans un contexte de vigilance croissante autour des vulnérabilités des grands modèles de langage. Les attaques par injection de prompts, bien que connues, restent difficiles à contrer complètement car elles exploitent l'ouverture même de ces systèmes à des sources de données variées. En limitant les capacités d'interaction avec le web et les fichiers externes, OpenAI cherche à offrir un niveau de sécurité supplémentaire sans compromettre l'utilité générale de l'outil pour la majorité des usagers. Le mode verrouillé pourrait notamment intéresser les secteurs juridique, financier ou médical, où la confidentialité des données échangées est primordiale.