Un nouveau projet open source, baptisé « Funes », vient d'être présenté sur Hacker News. Il se positionne comme un cadre de travail (« framework ») pour la recherche assistée par intelligence artificielle. Son objectif : automatiser l'organisation et l'exploitation de la connaissance à partir de documents bruts.

Un « bibliothécaire » artificiel pour les chercheurs

Le nom du projet est un hommage à « Funes ou la mémoire », une nouvelle de Jorge Luis Borges dans laquelle le personnage éponyme possède une mémoire infaillible mais est incapable de généraliser ou d'oublier. Le créateur du logiciel, connu sur GitHub sous le pseudonyme ulyssestenn, a déposé le code comme modèle public (« Public template »).

Funes se présente comme un système « auto-organisé » qui fonctionne en plusieurs étapes. Un module décrit comme un « bibliothécaire IA » (AI Librarian) ingère d'abord les sources brutes — articles, documents, pages web — sans qu'aucune mise en forme préalable ne soit nécessaire. Il construit ensuite une base de connaissances en Markdown, un langage de balisage léger, où chaque note est reliée aux autres.

De la collecte à la synthèse

Le système ne se contente pas de stocker l'information. Selon la description du dépôt, Funes utilise ces notes interconnectées pour produire « des rapports sourcés, des analyses et autres productions ». L'ensemble du processus est géré par un grand modèle de langage (LLM), ce qui suggère que l'outil peut générer des synthèses tout en conservant les références aux documents d'origine.

Le framework s'appuie par ailleurs sur Git pour la gestion des versions. Chaque transformation de la base de connaissances est ainsi tracée, ce qui permet de suivre l'évolution du travail et de revenir en arrière si nécessaire. Cette approche combine la puissance des modèles de langage récents avec les bonnes pratiques du développement logiciel.

Un outil pour l'ère de la surabondance informationnelle

Funes s'inscrit dans une tendance plus large de l'intelligence artificielle appliquée à la gestion des connaissances. Alors que les chercheurs, les journalistes et les analystes sont confrontés à un volume croissant de données, des outils capables d'automatiser le classement et la synthèse suscitent un intérêt grandissant.

Le projet est hébergé sur GitHub et accessible librement. Le code source est disponible sous forme de modèle, ce qui permet à d'autres développeurs de créer leurs propres instances ou d'adapter le framework à leurs besoins spécifiques. L'auteur encourage les contributions, comme en témoignent les options de signalement de bugs et de suggestions de fonctionnalités.

Pour l'instant, Funes en est à ses débuts : la page du dépôt indique une seule bifurcation (« fork ») et zéro étoile au moment de la rédaction, mais sa publication sur la page « Newest » de Hacker News peut lui donner une visibilité immédiate auprès d'une communauté influente de la tech.

Vers une recherche augmentée ?

Si Funes tient ses promesses, il pourrait changer la manière dont les professionnels de la recherche abordent la synthèse documentaire. En confiant au LLM le soin d'organiser et de lier les informations, le chercheur humain gagnerait du temps sur les tâches de classement pour se concentrer sur l'analyse critique et la rédaction.

Reste à savoir comment l'outil gère la fiabilité des sources, le risque de « hallucinations » des modèles de langage — ces affirmations fausses mais présentées comme vraies — et la qualité des liens générés automatiquement. Le framework devra démontrer qu'il peut produire des synthèses aussi fiables qu'un travail manuel, tout en offrant un gain de temps significatif.