Datagouv MCP

Définition

MCP Datagouv désigne un serveur implémentant le Model Context Protocol (MCP) qui permet à des assistants conversationnels (Claude, ChatGPT, Gemini, etc.) d’interroger, d’explorer et d’analyser les jeux de données de data.gouv.fr — la plateforme nationale française d’open data — directement via une interface conversationnelle. Il ne s’agit pas d’un outil de scraping ou d’une API métier : c’est un connecteur standardisé qui expose les capacités de recherche et de consultation du catalogue open data français dans un format compréhensible par les agents IA, sans nécessiter de développement d’intégration sur-mesure.

Termes francophones recommandés : connecteur MCP pour l’open data français ou interface conversationnelle d’accès aux données publiques.
Note d’usage : MCP Datagouv est un nom de projet open-source maintenu par l’équipe data.gouv.fr. Le terme n’est pas enregistré dans FranceTerme ; cette proposition s’appuie sur les principes de clarté terminologique et les référentiels d’interopérabilité des données publiques.

Finalité

L’usage du MCP Datagouv permet de :

  • Démocratiser l’accès aux données publiques : permettre à tout utilisateur, sans compétence technique, d’explorer le catalogue open data français via une conversation naturelle
  • Accélérer la veille et la recherche documentaire : identifier rapidement les jeux de données pertinents sur un thème (logement, transport, éducation) sans navigation manuelle fastidieuse
  • Faciliter l’analyse préliminaire : obtenir des métadonnées structurées, des liens vers les ressources et des informations de contexte pour évaluer la pertinence d’un jeu de données avant téléchargement
  • Renforcer la transparence et la réutilisation : encourager l’exploitation des données publiques par des acteurs variés (journalistes, chercheurs, citoyens, entreprises) via des interfaces accessibles
  • Expérimenter l’IA au service de l’intérêt général : tester des cas d’usage conversationnels sur des données officielles, dans un cadre sécurisé et conforme

Prérequis

  • Un compte sur un assistant compatible MCP (ChatGPT Plus/Pro, Claude Desktop, Cursor, etc.)
  • Une connexion internet
  • Aucune compétence en programmation requise
Type d’applicationNiveau techniqueExemple d’usage
Assistant conversationnel (ChatGPT, Claude)Débutant completPoser des questions naturelles sur les données ouvertes
Extension VS Code / CursorDébutant techniqueInterroger data.gouv.fr depuis son éditeur de code
Petite app web (Streamlit, Gradio)IntermédiaireInterface simple avec champ de recherche + résultats
Script Python minimalIntermédiaireAutomatiser une veille data avec 10 lignes de code
Bot Discord / SlackIntermédiaire+Commander /data logement pour obtenir des liens utiles

Composantes techniques du MCP Datagouv

ÉlémentDescriptionPertinence fonctionnelle / accessibilité
Endpoint public hébergéURL unique https://mcp.data.gouv.fr/mcp accessible sans authentificationSimplicité d’usage immédiat, pas de configuration serveur requise
Outils en lecture seuleFonctions exposées : recherche de jeux de données, récupération de métadonnées, liste des ressources associéesSécurité par conception, pas de risque de modification accidentelle des données
Compatibilité multi-clientsConfiguration disponible pour ChatGPT, Claude Desktop, Cursor, VS Code, Mistral, etc.Flexibilité d’usage selon l’outil préféré de l’utilisateur
Format de réponse structuréRésultats renvoyés en JSON Schema, interprétables nativement par les agents IAFiabilité des réponses, facilité d’intégration dans des workflows automatisés
Documentation intégréeDescription des outils disponibles et de leurs paramètres, accessible via le protocole MCPAutonomie de l’utilisateur, réduction du besoin de support externe
Mises à jour synchroniséesLe serveur reflète en temps réel l’état du catalogue data.gouv.frFraîcheur des informations, cohérence avec la source officielle
Licence open-sourceCode disponible sur GitHub, contribuable et auditable par la communautéTransparence, pérennité, possibilité d’auto-hébergement pour des besoins spécifiques

Cas d’usage stratégiques (niveaux 1 & 2)

Exploration thématique de l’open data → Un journaliste enquête sur les prix du logement en région : il demande à son assistant « Quels jeux de données sur les prix immobiliers sont disponibles sur data.gouv.fr ? » et obtient une liste contextualisée avec liens directs vers les ressources. → Un étudiant en géographie recherche des données démographiques : il interroge le MCP via son assistant pour identifier les jeux de données récents sur la population par commune, avec métadonnées sur la fréquence de mise à jour et le format des fichiers.

Veille réglementaire et observation territoriale → Une association de veille environnementale utilise le MCP pour surveiller l’ajout de nouveaux jeux de données sur la qualité de l’air, recevant des alertes conversationnelles sur les publications récentes. → Une collectivité territoriale explore les données ouvertes publiées par d’autres communes pour identifier des indicateurs pertinents à intégrer dans son propre tableau de bord de suivi.

Prototypage rapide de services data → Un développeur teste l’idée d’une application citoyenne en interrogeant le MCP via un assistant IA pour valider la disponibilité et la structure des données nécessaires avant d’engager un développement technique. → Un designer de service public utilise le MCP pour cartographier les jeux de données existants sur un enjeu (mobilité, inclusion) et identifier les lacunes à combler par de nouvelles productions.

Limites et vigilances à anticiper → Le MCP Datagouv expose uniquement des métadonnées et des liens : le téléchargement et l’analyse approfondie des fichiers nécessitent des outils complémentaires (tableur, langage de programmation, etc.). → Les réponses dépendent de la qualité des métadonnées sur data.gouv.fr : certains jeux de données mal documentés peuvent être moins visibles ou difficiles à interpréter via l’interface conversationnelle.

Outils et référentiels complémentaires (liste publique)

Outil / RéférentielTypeApport principal
data.gouv.fr – Portail officiel Plateforme open data / GratuitSource de référence des jeux de données publiques françaises, documentation et licences
Model Context Protocol – SpécificationStandard open-source / GratuitComprendre le fonctionnement du protocole pour approfondir ou contribuer
GitHub – datagouv/datagouv-mcpDépôt de code / Open-sourceCode source du serveur, issues pour signaler des bugs, contributions possibles
Schema.org – DatasetVocabulaire de balisage / GratuitStandard pour décrire les métadonnées de jeux de données, utilisé par data.gouv.fr
Etalab – Guides open dataInstitutionnel / GratuitBonnes pratiques pour la publication et la réutilisation des données publiques en France
CNIL – Open data et protection des donnéesRégulateur / GratuitRepères pour concilier ouverture des données et respect de la vie privée

Voir aussi

  • Model Context Protocol (MCP) et interopérabilité des agents IA
  • Open data et données publiques en France
  • Architecture de l’information et découverte de données
  • IA responsable et accès aux connaissances d’intérêt général
  • Littératie des données et esprit critique face aux métadonnées
  • Conversationnel et interfaces naturelles d’accès à l’information
  • Contribution open-source et gouvernance des communs numériques

Exemple d’une application Python avec extraction des données sans MCP API Rest classique

image 3
image 2

Repo GitHub de l’application

Les contenus de définition restent publics. Les ressources (outils, grilles, supports) liées à cette fiche sont disponibles dans l’espace membre.