Datasette est un outil open source conçu pour l'exploration et la publication de données. Il permet de prendre des données de toute forme, de les analyser et de les explorer, puis de les publier sous la forme d'un site web interactif accompagné d'une API.

Exploration et analyse des données

L'outil permet d'importer des données à partir de CSV, de fichiers JSON, de connexions à des bases de données et d'autres formats. Une fois importées, Datasette identifie automatiquement les motifs dans les données et facilite le partage des résultats avec des collègues. Il est particulièrement adapté à l'analyse exploratoire de données.

Publication instantanée

La commande datasette publish permet de publier instantanément les données vers des fournisseurs d'hébergement tels que Google Cloud Run, Heroku ou Vercel. Cette fonctionnalité vise à simplifier la diffusion de données ouvertes.

Prototypage rapide

Datasette permet de mettre en place une API JSON pour toute donnée en quelques minutes, ce qui facilite le prototypage et la validation d'idées sans avoir à développer un backend personnalisé.

Public cible

L'outil est destiné aux journalistes de données, aux conservateurs de musée, aux archivistes, aux collectivités locales, aux scientifiques, aux chercheurs et à toute personne souhaitant partager des données avec le monde. Il s'inscrit dans un écosystème plus large comprenant 44 outils et 154 plugins dédiés au travail avec des données structurées.

Fonctionnalités récentes

Datasette évolue régulièrement. Une version alpha récente (1.0a30) a introduit un menu « Jump » permettant de naviguer rapidement dans une instance Datasette, avec des mécanismes pour que les plugins puissent étendre et personnaliser ce menu. Une autre version alpha (1.0a27) a modifié le fonctionnement de la protection CSRF afin de simplifier l'intégration des formulaires et des API, et a introduit un événement RenameTableEvent pour le renommage de tables par requête SQL.

La version 1.0a26 a ajouté un système column_types permettant aux colonnes de porter des informations de type supplémentaires, comme email ou url, ou des types définis par des plugins. Cette version a également ajouté une interface utilisateur pour sélectionner et trier les colonnes visibles sur une page de table.

Écosystème et communauté

Datasette dispose d'une communauté active, avec une liste de diffusion, un canal Discord et un compte Mastodon. Le projet propose également des formations et des permanences (office hours) pour des conversations en personne. Un blog dédié a été lancé récemment pour suivre l'actualité du projet. Un plugin appelé Datasette Agent a été présenté comme un assistant IA extensible pour interagir avec les bases de données SQLite.

Sécurité et versions stables

Le projet publie à la fois des versions stables (0.65.2) et des versions alpha (1.0a21 et suivantes) qui préparent la version 1.0. Une correction de sécurité a été apportée en novembre 2025 pour un problème de redirection ouverte. Le système de permissions a également été profondément modifié dans les versions alpha récentes, avec un nouveau système basé sur SQL.

Compatibilité

Datasette est écrit en Python et compatible avec Python 3.13 depuis la version 1.0a16 et la version 0.65. La licence est Apache 2.0.