Pourquoi l’IA de Google ne sait pas épeler « Google » (ni quoi que ce soit d’autre)

Des fautes d’orthographe grossières, même sur le nom de l’entreprise

Les derniers résumés génératifs de Google, déployés dans le cadre d’une refonte majeure du moteur de recherche, continuent de produire des erreurs d’orthographe frappantes. Interrogé sur le nombre de lettres « P » dans le mot « Google », le système a répondu « deux », confirmant ainsi une incapacité à épeler correctement le nom même de l’entreprise qui le développe. Une capture d’écran largement partagée montre également que l’IA affirme qu’il y a « exactement un 'r' dans le mot 'poop' », puis épelle ce mot sans la lettre attendue. De même, le système a indiqué deux lettres « d » dans le mot « journalism », avant d’en donner l’orthographe fautive « j-o-u-r-n-a-d-i-s-m ». Interrogé sur le nom du président des États-Unis, le résumé a reconnu la présence d’un « P » dans le nom, mais l’a orthographié « t-r-p-u-m ».

Une faiblesse structurelle des grands modèles de langage

Cette difficulté n’est pas nouvelle. Comme l’expliquent des chercheurs spécialisés dans l’intelligence artificielle, les grands modèles de langage – la technologie qui sous-tend les chatbots et les générateurs de texte – ne sont pas conçus pour comprendre l’orthographe au sens traditionnel du terme. Ils fonctionnent par prédiction probabiliste de séquences de « tokens » (fragments de mots ou de caractères), et non par comptage précis de lettres. Depuis plusieurs années, un test informel consiste à demander à ces modèles combien de « R » compte le mot « strawberry », un exercice qu’ils échouent régulièrement.

Un correctif difficile à trouver

Interrogé sur ces anomalies, un porte-parole de Google a déclaré que « le comptage au sein des mots est un défi connu pour les grands modèles de langage, et nous travaillons à résoudre ce problème particulier ». L’entreprise n’a pas précisé de calendrier pour un correctif. Ces erreurs surviennent alors que Google vient de déployer une refonte profonde de son moteur de recherche, plaçant les résumés génératifs au cœur de l’expérience utilisateur. La firme avait déjà dû corriger un bug précédent, où la recherche du mot « disregard » affichait non pas une définition mais la réponse générique « Compris. Faites-moi savoir quand vous avez une nouvelle requête ou question ! ».

Un précédent embarrassant

Ce n’est pas la première fois que Google se trouve confronté aux limites de son IA. Lors d’un précédent déploiement de résumés génératifs en 2024, le système avait cité des articles satiriques comme des sources factuelles, conseillant par exemple de manger des pierres ou d’ajouter de la colle sur une pizza. Les mêmes causes produisant les mêmes effets, la nouvelle version, pourtant conçue pour être plus robuste, reproduit des erreurs d’un autre ordre mais tout aussi frappantes. Le contraste est saisissant : ces modèles, capables de générer du code informatique en quelques secondes ou de résoudre des problèmes mathématiques complexes, peinent à accomplir une tâche aussi élémentaire que le comptage de lettres.

Pourquoi l’IA de Google ne sait pas épeler « Google » (ni quoi que ce soit d’autre)

À lire ensuite

Médicaments anti-obésité : le Wegovy et le Mounjaro remboursés à partir de la mi-juin sous conditions, patient...

Peter Thiel installe sa famille en Argentine, séduit par les réformes libertaires de Milei

Piratage téléphonique : le Parti travailliste britannique saisit la police après les allégations visant Nigel...

« Nous envoyons un signal fort » : la France entend faire de la protection des mineurs en ligne une cause mond...