Une analogie avec la photocopie défaillante

L'écrivain et essayiste Ted Chiang, connu pour ses réflexions sur la technologie et l'intelligence artificielle, a proposé une analogie frappante pour décrire le fonctionnement de ChatGPT et des grands modèles de langage. Dans un texte publié en février 2023, Chiang compare ces systèmes à une version floue et compressée de l'ensemble du Web, une sorte de « JPEG flou du Web ». Selon lui, ChatGPT ne restitue pas des informations textuelles exactes, mais des approximations grammaticalement correctes, semblables à des images fortement compressées.

Pour illustrer son propos, Chiang prend l'exemple d'un incident survenu en 2013 dans une entreprise de construction allemande. Un photocopieur Xerox avait reproduit un plan d'étage en modifiant les surfaces des pièces : les trois pièces, dont les surfaces réelles étaient de 14,13, 21,11 et 17,42 mètres carrés, étaient toutes indiquées comme mesurant 14,13 mètres carrés. L'appareil utilisait un format de compression avec perte nommé JBIG 2, conçu pour réduire la taille des fichiers en identifiant les zones similaires. En jugeant les étiquettes de surface trop proches, il avait stocké une seule valeur pour toutes, créant une erreur plausible mais fausse. Le problème ne venait pas de la compression elle-même, mais du fait que l'erreur n'était pas immédiatement détectable : les copies semblaient exactes alors qu'elles ne l'étaient pas.

ChatGPT comme une archive compressée du Web

Ted Chiang transpose cette situation aux grands modèles de langage. Il imagine un scénario où un utilisateur souhaiterait sauvegarder l'intégralité du texte du Web avant de perdre définitivement l'accès à Internet. Ne disposant que d'un espace de stockage équivalent à un pour cent du volume total, il serait contraint d'utiliser un algorithme de compression avec perte très poussé. Grâce à une puissance de calcul quasi illimitée, cet algorithme pourrait identifier des régularités statistiques extrêmement fines dans le texte et les stocker dans un format spécialisé, atteignant un taux de compression de cent pour un.

Le résultat ne permettrait plus de rechercher une citation exacte, mais uniquement d'obtenir des réponses qui « donnent l'essentiel » du contenu stocké. C'est exactement, selon Chiang, ce que fait ChatGPT. Le chatbot n'offre pas des citations littérales, contrairement à un moteur de recherche comme Google, mais des paraphrases qui en captent le sens général. Cette analogie explique à la fois l'aisance de ChatGPT à reformuler l'information et ses limites fondamentales : il ne s'agit jamais d'une copie exacte, mais d'une reconstruction approximative.

Hallucinations : des artéfacts de compression

L'essai aborde ensuite la question des « hallucinations », ces réponses absurdes ou factuellement incorrectes que produisent parfois les grands modèles de langage. Pour Chiang, ces hallucinations ne sont pas surprenantes : elles constituent des « artéfacts de compression », analogues aux étiquettes erronées du photocopieur Xerox. Si un algorithme est conçu pour reconstruire du texte après avoir éliminé 99 % du contenu original, il est inévitable qu'une grande partie de ce qu'il génère soit entièrement fabriquée, mais d'une manière qui paraît plausible.

Le problème majeur, souligne l'auteur, est que ces erreurs ne sont pas immédiatement reconnaissables comme telles. Comme le photocopieur qui produisait des nombres lisibles mais incorrects, ChatGPT génère des phrases grammaticalement correctes et cohérentes en apparence, rendant la détection des inexactitudes difficile sans recourir à la source originale (le Web) ou aux connaissances du monde de l'utilisateur. La fiabilité des réponses est ainsi compromise de manière subtile.

Paraphrase contre citation : un choix de société

La comparaison entre ChatGPT et un JPEG flou du Web met en lumière un choix fondamental pour les utilisateurs et la société dans son ensemble. D'un côté, les modèles de langage offrent une synthèse rapide et une reformulation fluide de l'information, utiles pour obtenir un aperçu général ou générer du contenu créatif. De l'autre côté, un moteur de recherche comme Google fournit des citations littérales, des documents source et une traçabilité de l'information.

Ted Chiang invite ainsi à réfléchir à ce que l'on recherche réellement : une paraphrase approximative mais pratique, ou une citation exacte et vérifiable ? L'analogie avec la compression avec perte, conclut-il, suggère que les grands modèles de langage ne doivent pas être considérés comme des outils de recherche fiables, mais comme des générateurs de contenu dont la précision factuelle est intrinsèquement limitée par leur mode de fonctionnement.