À quelques jours de son sommet annuel Data + AI Summit, Databricks a dévoilé OpenSharing, un protocole open source destiné à faciliter le partage sécurisé d’actifs d’intelligence artificielle entre organisations et plateformes. Ce projet reprend et enrichit le protocole Delta Sharing, lancé en 2021, en l’étendant aux ressources propres à l’IA : modèles, compétences d’agents, tableaux de bord et données non structurées.
Le protocole est désormais hébergé sous l’égide de la Linux Foundation, au sein de sa division LF Data & IA. Il se veut indépendant des fournisseurs et permet de connecter des environnements très variés : infrastructures sur site, clouds privés ou clouds publics. L’accès aux ressources s’effectue sans copie ni déplacement des données, grâce à un système d’identifiants temporaires.
Prise en charge d’Apache Iceberg et des environnements hétérogènes
L’une des principales nouveautés d’OpenSharing par rapport à son prédécesseur est la prise en charge des clients Iceberg IRC, ce qui élargit le nombre de destinataires potentiels pour les fournisseurs de données. Les utilisateurs d’Apache Iceberg, un format de table de plus en plus répandu dans les charges de travail d’IA, peuvent ainsi bénéficier directement du protocole.
Pour relier les infrastructures sur site au cloud, Databricks s’est associé à plusieurs fournisseurs de stockage : Everpure, MinIO, Qumulo et Vast. Ces partenaires intègrent un connecteur OpenSharing, permettant aux clients d’accéder à des actifs hébergés localement comme s’ils se trouvaient dans le cloud.
Un pont entre les silos de données à l’ère de l’agentique
Selon Databricks, les entreprises étaient jusqu’alors contraintes d’utiliser des intégrations spécifiques coûteuses ou des marketplaces propriétaires pour partager des ressources d’IA. OpenSharing propose une alternative ouverte via des API standardisées pour la découverte, l’autorisation et l’accès, quel que soit l’environnement cible.
Le protocole permet ainsi de publier des compétences d’agents et des modèles d’IA exploitables par n’importe quel partenaire, et de recevoir des partages de données dans des outils aussi divers que Databricks, Apache Spark, Oracle, Power BI, Tableau ou Snowflake. Il brise de fait les silos entre plateformes, régions et environnements technologiques.
Des coûts d’intégration réduits et une gouvernance renforcée
En évitant la duplication des données, OpenSharing contribue à réduire la complexité des intégrations, à améliorer la gouvernance et à limiter les coûts opérationnels liés à la mise en œuvre de systèmes d’IA. La société précise que le protocole est disponible dès maintenant sur GitHub.
Databricks, dont les outils sont utilisés par plus de 70 % des entreprises du Fortune 500 pour construire et déployer des applications de données et d’IA, espère faire d’OpenSharing un standard largement adopté. Delta Sharing, la version précédente, comptait déjà parmi ses utilisateurs des entreprises comme Amadeus, Atlassian, LSEG, SAP, Stripe ou The Trade Desk. OpenSharing pourrait étendre cette communauté à l’ensemble de l’écosystème IA.