Des fautes d’orthographe grossières, même sur le nom de l’entreprise
Les derniers résumés génératifs de Google, déployés dans le cadre d’une refonte majeure du moteur de recherche, continuent de produire des erreurs d’orthographe frappantes. Interrogé sur le nombre de lettres « P » dans le mot « Google », le système a répondu « deux », confirmant ainsi une incapacité à épeler correctement le nom même de l’entreprise qui le développe. Une capture d’écran largement partagée montre également que l’IA affirme qu’il y a « exactement un 'r' dans le mot 'poop' », puis épelle ce mot sans la lettre attendue. De même, le système a indiqué deux lettres « d » dans le mot « journalism », avant d’en donner l’orthographe fautive « j-o-u-r-n-a-d-i-s-m ». Interrogé sur le nom du président des États-Unis, le résumé a reconnu la présence d’un « P » dans le nom, mais l’a orthographié « t-r-p-u-m ».
Une faiblesse structurelle des grands modèles de langage
Cette difficulté n’est pas nouvelle. Comme l’expliquent des chercheurs spécialisés dans l’intelligence artificielle, les grands modèles de langage – la technologie qui sous-tend les chatbots et les générateurs de texte – ne sont pas conçus pour comprendre l’orthographe au sens traditionnel du terme. Ils fonctionnent par prédiction probabiliste de séquences de « tokens » (fragments de mots ou de caractères), et non par comptage précis de lettres. Depuis plusieurs années, un test informel consiste à demander à ces modèles combien de « R » compte le mot « strawberry », un exercice qu’ils échouent régulièrement.
Un correctif difficile à trouver
Interrogé sur ces anomalies, un porte-parole de Google a déclaré que « le comptage au sein des mots est un défi connu pour les grands modèles de langage, et nous travaillons à résoudre ce problème particulier ». L’entreprise n’a pas précisé de calendrier pour un correctif. Ces erreurs surviennent alors que Google vient de déployer une refonte profonde de son moteur de recherche, plaçant les résumés génératifs au cœur de l’expérience utilisateur. La firme avait déjà dû corriger un bug précédent, où la recherche du mot « disregard » affichait non pas une définition mais la réponse générique « Compris. Faites-moi savoir quand vous avez une nouvelle requête ou question ! ».
Un précédent embarrassant
Ce n’est pas la première fois que Google se trouve confronté aux limites de son IA. Lors d’un précédent déploiement de résumés génératifs en 2024, le système avait cité des articles satiriques comme des sources factuelles, conseillant par exemple de manger des pierres ou d’ajouter de la colle sur une pizza. Les mêmes causes produisant les mêmes effets, la nouvelle version, pourtant conçue pour être plus robuste, reproduit des erreurs d’un autre ordre mais tout aussi frappantes. Le contraste est saisissant : ces modèles, capables de générer du code informatique en quelques secondes ou de résoudre des problèmes mathématiques complexes, peinent à accomplir une tâche aussi élémentaire que le comptage de lettres.