Définition
MCP Datagouv désigne un serveur implémentant le Model Context Protocol (MCP) qui permet à des assistants conversationnels (Claude, ChatGPT, Gemini, etc.) d’interroger, d’explorer et d’analyser les jeux de données de data.gouv.fr — la plateforme nationale française d’open data — directement via une interface conversationnelle. Il ne s’agit pas d’un outil de scraping ou d’une API métier : c’est un connecteur standardisé qui expose les capacités de recherche et de consultation du catalogue open data français dans un format compréhensible par les agents IA, sans nécessiter de développement d’intégration sur-mesure.
Termes francophones recommandés : connecteur MCP pour l’open data français ou interface conversationnelle d’accès aux données publiques.
Note d’usage : MCP Datagouv est un nom de projet open-source maintenu par l’équipe data.gouv.fr. Le terme n’est pas enregistré dans FranceTerme ; cette proposition s’appuie sur les principes de clarté terminologique et les référentiels d’interopérabilité des données publiques.
Finalité
L’usage du MCP Datagouv permet de :
- Démocratiser l’accès aux données publiques : permettre à tout utilisateur, sans compétence technique, d’explorer le catalogue open data français via une conversation naturelle
- Accélérer la veille et la recherche documentaire : identifier rapidement les jeux de données pertinents sur un thème (logement, transport, éducation) sans navigation manuelle fastidieuse
- Faciliter l’analyse préliminaire : obtenir des métadonnées structurées, des liens vers les ressources et des informations de contexte pour évaluer la pertinence d’un jeu de données avant téléchargement
- Renforcer la transparence et la réutilisation : encourager l’exploitation des données publiques par des acteurs variés (journalistes, chercheurs, citoyens, entreprises) via des interfaces accessibles
- Expérimenter l’IA au service de l’intérêt général : tester des cas d’usage conversationnels sur des données officielles, dans un cadre sécurisé et conforme
Prérequis
- Un compte sur un assistant compatible MCP (ChatGPT Plus/Pro, Claude Desktop, Cursor, etc.)
- Une connexion internet
- Aucune compétence en programmation requise
| Type d’application | Niveau technique | Exemple d’usage |
|---|---|---|
| Assistant conversationnel (ChatGPT, Claude) | Débutant complet | Poser des questions naturelles sur les données ouvertes |
| Extension VS Code / Cursor | Débutant technique | Interroger data.gouv.fr depuis son éditeur de code |
| Petite app web (Streamlit, Gradio) | Intermédiaire | Interface simple avec champ de recherche + résultats |
| Script Python minimal | Intermédiaire | Automatiser une veille data avec 10 lignes de code |
| Bot Discord / Slack | Intermédiaire+ | Commander /data logement pour obtenir des liens utiles |
Composantes techniques du MCP Datagouv
| Élément | Description | Pertinence fonctionnelle / accessibilité |
|---|---|---|
| Endpoint public hébergé | URL unique https://mcp.data.gouv.fr/mcp accessible sans authentification | Simplicité d’usage immédiat, pas de configuration serveur requise |
| Outils en lecture seule | Fonctions exposées : recherche de jeux de données, récupération de métadonnées, liste des ressources associées | Sécurité par conception, pas de risque de modification accidentelle des données |
| Compatibilité multi-clients | Configuration disponible pour ChatGPT, Claude Desktop, Cursor, VS Code, Mistral, etc. | Flexibilité d’usage selon l’outil préféré de l’utilisateur |
| Format de réponse structuré | Résultats renvoyés en JSON Schema, interprétables nativement par les agents IA | Fiabilité des réponses, facilité d’intégration dans des workflows automatisés |
| Documentation intégrée | Description des outils disponibles et de leurs paramètres, accessible via le protocole MCP | Autonomie de l’utilisateur, réduction du besoin de support externe |
| Mises à jour synchronisées | Le serveur reflète en temps réel l’état du catalogue data.gouv.fr | Fraîcheur des informations, cohérence avec la source officielle |
| Licence open-source | Code disponible sur GitHub, contribuable et auditable par la communauté | Transparence, pérennité, possibilité d’auto-hébergement pour des besoins spécifiques |
Cas d’usage stratégiques (niveaux 1 & 2)
Exploration thématique de l’open data → Un journaliste enquête sur les prix du logement en région : il demande à son assistant « Quels jeux de données sur les prix immobiliers sont disponibles sur data.gouv.fr ? » et obtient une liste contextualisée avec liens directs vers les ressources. → Un étudiant en géographie recherche des données démographiques : il interroge le MCP via son assistant pour identifier les jeux de données récents sur la population par commune, avec métadonnées sur la fréquence de mise à jour et le format des fichiers.
Veille réglementaire et observation territoriale → Une association de veille environnementale utilise le MCP pour surveiller l’ajout de nouveaux jeux de données sur la qualité de l’air, recevant des alertes conversationnelles sur les publications récentes. → Une collectivité territoriale explore les données ouvertes publiées par d’autres communes pour identifier des indicateurs pertinents à intégrer dans son propre tableau de bord de suivi.
Prototypage rapide de services data → Un développeur teste l’idée d’une application citoyenne en interrogeant le MCP via un assistant IA pour valider la disponibilité et la structure des données nécessaires avant d’engager un développement technique. → Un designer de service public utilise le MCP pour cartographier les jeux de données existants sur un enjeu (mobilité, inclusion) et identifier les lacunes à combler par de nouvelles productions.
Limites et vigilances à anticiper → Le MCP Datagouv expose uniquement des métadonnées et des liens : le téléchargement et l’analyse approfondie des fichiers nécessitent des outils complémentaires (tableur, langage de programmation, etc.). → Les réponses dépendent de la qualité des métadonnées sur data.gouv.fr : certains jeux de données mal documentés peuvent être moins visibles ou difficiles à interpréter via l’interface conversationnelle.
Outils et référentiels complémentaires (liste publique)
| Outil / Référentiel | Type | Apport principal |
|---|---|---|
| data.gouv.fr – Portail officiel | Plateforme open data / Gratuit | Source de référence des jeux de données publiques françaises, documentation et licences |
| Model Context Protocol – Spécification | Standard open-source / Gratuit | Comprendre le fonctionnement du protocole pour approfondir ou contribuer |
| GitHub – datagouv/datagouv-mcp | Dépôt de code / Open-source | Code source du serveur, issues pour signaler des bugs, contributions possibles |
| Schema.org – Dataset | Vocabulaire de balisage / Gratuit | Standard pour décrire les métadonnées de jeux de données, utilisé par data.gouv.fr |
| Etalab – Guides open data | Institutionnel / Gratuit | Bonnes pratiques pour la publication et la réutilisation des données publiques en France |
| CNIL – Open data et protection des données | Régulateur / Gratuit | Repères pour concilier ouverture des données et respect de la vie privée |
Voir aussi
- Model Context Protocol (MCP) et interopérabilité des agents IA
- Open data et données publiques en France
- Architecture de l’information et découverte de données
- IA responsable et accès aux connaissances d’intérêt général
- Littératie des données et esprit critique face aux métadonnées
- Conversationnel et interfaces naturelles d’accès à l’information
- Contribution open-source et gouvernance des communs numériques
Exemple d’une application Python avec extraction des données sans MCP API Rest classique

