Un groupe de chercheurs vient de publier un article décrivant une nouvelle architecture pour les agents conversationnels, intitulée Talker-Reasoner (parleur-raisonneur). Cette approche s'inspire directement de la distinction établie par le psychologue et économiste Daniel Kahneman entre deux modes de pensée humaine : le système 1, rapide et intuitif, et le système 2, lent, délibératif et logique.

Deux agents spécialisés L'architecture proposée repose sur la séparation nette des deux fonctions principales que doivent remplir les agents modernes : converser avec l'utilisateur d'une part, et planifier, raisonner, appeler des outils ou effectuer des actions dans le monde d'autre part. D'après le résumé de l'étude, l'agent Talker (système 1) est conçu pour être rapide et intuitif ; il est chargé de synthétiser la réponse conversationnelle. L'agent Reasoner (système 2) est plus lent, plus réfléchi et plus logique ; il est responsable du raisonnement en plusieurs étapes, de la planification, de l'appel d'outils et de l'exécution d'actions, produisant ainsi le nouvel état de l'agent.

Avantages annoncés : modularité et latence réduite Les auteurs de l'article mettent en avant plusieurs avantages de cette architecture. La modularité est l'un des atouts principaux : les deux composants peuvent être développés, entraînés et optimisés indépendamment. La latence serait également réduite, car le Talker peut répondre rapidement sans attendre la fin du raisonnement complexe du Reasoner. Cette approche permettrait ainsi d'améliorer à la fois la réactivité et la profondeur des interactions.

Application concrète : un coach de sommeil Pour illustrer la pertinence de leur architecture dans un contexte réel, les chercheurs ont pris l'exemple d'un agent de coaching pour le sommeil. Dans ce scénario, l'agent doit à la fois mener une conversation naturelle avec l'utilisateur (recueillir des informations sur ses habitudes, le motiver) et effectuer un raisonnement structuré (analyser les données, proposer des plans d'action personnalisés). La séparation Talker-Reasoner permettrait de gérer ces deux aspects sans compromettre la fluidité de l'échange ni la qualité du raisonnement.

Un pas vers des agents plus intelligents Cette publication s'inscrit dans un effort plus large de la communauté de l'intelligence artificielle pour rendre les agents conversationnels plus efficaces et plus fiables. En s'inspirant des travaux fondateurs de Kahneman, les auteurs offrent un cadre conceptuel clair pour repenser l'architecture des systèmes dialogiques. L'approche Talker-Reasoner pourrait influencer de futures implémentations, notamment dans les domaines où la réactivité et la planification sont cruciales, comme l'assistance personnelle, la santé ou l'éducation.

L'article complet, intitulé "Agents Thinking Fast and Slow: A Talker-Reasoner Architecture", est accessible en prépublication sur la plateforme arXiv. Il a été soumis le 10 octobre 2024 par les chercheurs Konstantina Christakopoulou, Shibl Mourad et Maja Matarić.