Un retour d'expérience sur les chatbots d'avant l'IA générative

En 1997, alors qu'il apprenait Python, un développeur aujourd'hui connu sous le pseudonyme Darren Mckeeman a créé un chatbot nommé Vladimir. Le programme était basé sur MegaHal, un logiciel en C qui découpait des textes en chaînes de Markov et les réassemblait selon une matrice de probabilités. L'auteur raconte cette expérience dans un article publié sur sa newsletter Long Wharf.

Une génération spontanée de propos orduriers

Le bot, opérant sur le canal IRC #gothic, ingérait en temps réel tout ce qui se disait sur le salon. Il produisait des réponses qui amalgamaient les phrases des participants, donnant parfois une illusion de lucidité. L'auteur a conservé les échanges les plus marquants, qui se caractérisent par une obscénité constante et des non-séquiturs. Par exemple, à un utilisateur demandant s'il était un dieu, le bot répondait : « Parce que tu n'es pas un dieu. » À un autre affirmant que son foie était « une mère rebelle » lui disant qu'il était privé de sortie, Vladimir répliquait : « Ta mère aime baiser. »

Un arrêt forcé par la désocialisation

L'expérience a duré deux ans. L'auteur a finalement débranché le bot parce que les utilisateurs du canal parlaient davantage à la machine qu'entre eux. « Ça devenait extrêmement agaçant », écrit-il. Il précise que jusqu'à récemment, il n'avait aucune envie de renouveler l'expérience, mais qu'il travaille aujourd'hui sur un système vocal basé sur OpenVoice OS. Sa première règle : « Rester dans le domaine professionnel. Pas de bavardage. »

Un parallèle avec l'IA contemporaine

L'auteur note que le principe de « training » de MegaHal, qui consiste à ingérer un corpus et à générer des phrases probables, est très similaire à celui des grands modèles de langage (LLM) actuels. Il y voit une illustration de ce qu'il qualifie de « gaspillage d'électricité » dans la mode actuelle de l'IA, tout en reconnaissant que ce n'est pas le propos central de son article.