Ensemble de règles, processus, rôles et normes qui encadrent la qualité, la sécurité, la disponibilité, l’usage et le cycle de vie des données au sein d’une organisation.
La gouvernance des données, c’est « la manière dont une organisation décide ce qu’elle fait de ses données ».
Elle répond à des questions essentielles :
- Quelles données collecte-t-on, pourquoi et jusqu’à quand ?
- Qui a le droit d’y accéder ou de les modifier ?
- Comment s’assure-t-on qu’elles sont exactes, fiables et à jour ?
- Où sont-elles stockées, et dans quelles conditions de sécurité ?
- Que fait-on des données obsolètes ou sensibles ?
Elle ne se limite pas à la technique : c’est une démarche transversale, mêlant droit (RGPD, lois sectorielles), éthique, sécurité, métier et écologie numérique.
Piliers de la gouvernance des données
| Pilier | Objectif |
|---|---|
| Qualité des données | Fiabilité, exactitude, complétude, cohérence |
| Sécurité & confidentialité | Protection contre les fuites, accès contrôlé, anonymisation |
| Conformité | Respect du RGPD, des lois nationales et des politiques internes |
| Cycle de vie | Définition des durées de conservation, archivage, suppression |
| Responsabilité | Désignation d’un Data Steward, DPO (Délégué à la protection des données), etc. |
| Interopérabilité | Capacité à échanger les données entre systèmes (formats ouverts, métadonnées) |
Une gouvernance engagée : au-delà du conformisme
Dans une perspective de sobriété numérique, de résilience ou de contre-discours face à l’extractivisme des données, la gouvernance peut aussi être un levier pour :
- Refuser la collecte inutile (principe de minimisation),
- Limiter le stockage passif (lutter contre les dark data),
- Privilégier les formats ouverts et documentés (ex. : CSV, JSON-LD, RDF),
- Renforcer la transparence envers les utilisateurs ou les publics,
- Documenter l’origine et l’usage des données (provenance, licence, finalité).
Exemple concret :
Une plateforme culturelle qui collecte des données sur ses visiteurs peut, via une bonne gouvernance :
- Ne conserver les logs d’audience que 30 jours,
- Ne jamais croiser les identifiants IP avec des profils utilisateurs,
- Proposer un accès à ses propres données en un clic,
- Publier un registre de traitement lisible par tous.
Bonnes pratiques
- Mettre en place un catalogue de données (data catalog),
- Documenter chaque jeu de données avec des métadonnées riches,
- Appliquer le principe « privacy by design » dès la conception des outils,
- Former les équipes à la culture des données (pas seulement aux outils).
Gouvernance vs. Management des données
- Gouvernance = « quoi faire » et « pourquoi » (stratégie, politique, règles),
- Management = « comment faire » (outils, pipelines, nettoyage, stockage).