L'éditeur France Labs a annoncé la disponibilité de Datafari 7.0, la dernière version de son moteur de recherche open source destiné aux entreprises. Placée sous licence Apache Public License v2, cette mise à jour majeure intègre un « assistant intelligent » exploitant l'intelligence artificielle générative pour permettre aux utilisateurs de converser avec leurs documents internes.
Contrairement aux simples moteurs de recherche, Datafari fédère les connaissances en analysant et en indexant l'ensemble des documents d'une organisation, quel que soit leur format ou leur source. Avec la version 7.0, l'outil franchit une étape supplémentaire : il ne se contente plus de retrouver des fichiers, il permet de les « questionner » via un dialogue en langage naturel.
Trois modes d'interaction IA
La principale nouveauté réside dans l'intégration de trois modes d'interaction avec l'IA. Le mode « Retrieval Augmented Generation » (RAG) permet d'obtenir des réponses fondées uniquement sur les données internes de l'entreprise, sans avoir à entraîner un modèle. Le mode « agentic » va plus loin : l'IA raisonne sur la question posée et décide des actions à entreprendre pour y répondre. Enfin, l'assistant peut répondre à des questions portant sur un ou plusieurs documents spécifiques.
Côté recherche, Datafari 7.0 propose trois approches : la recherche par mots clés classique, la recherche sémantique (basée sur la vectorisation dans Apache Solr) et la recherche hybride. Les utilisateurs bénéficient également de la correction orthographique, de l'auto-complétion et de facettes pour filtrer les résultats. Des alertes par courriel peuvent être configurées pour être averti de l'ajout ou de la modification de documents correspondant à une requête.
Des capacités d'administration étendues
Pour les administrateurs, la version 7.0 offre un contrôle renforcé. Il est possible de configurer les connecteurs vers les sources de données via Apache ManifoldCF, d'utiliser l'IA lors de l'indexation pour analyser et enrichir les contenus, de gérer l'algorithme de pertinence, de mettre en avant certains documents pour des requêtes identifiées, de créer des utilisateurs et des rôles, et de consulter des statistiques d'usage. Les paramètres du modèle d'IA et de vectorisation sont également configurables.
Déploiement et perspectives
Datafari n'héberge pas localement un modèle d'IA par défaut. France Labs recommande de connecter l'outil à un service externe comme Mistral pour débuter, avant de basculer vers des modèles hébergés en interne ou chez des partenaires. La documentation complète est disponible sur Confluence, et un guide de démarrage rapide est fourni. Une image Docker facilite le déploiement.
L'éditeur prévoit de continuer à faire évoluer la partie IA en 2026 et 2027, tout en travaillant parallèlement à la refonte du système de moissonnage des données.
Datafari 7.0 est téléchargeable gratuitement sur le site officiel de l'éditeur et les sources sont accessibles sur GitHub. Une courte vidéo de démonstration est également disponible.