Les métadonnées « données sur les données » sont des informations structurées qui décrivent, contextualisent, identifient et relient des ressources numériques (documents, images, vidéos, bases de données, pages web, etc.).
Elles permettent à la fois :
- aux humains de comprendre rapidement la nature, l’origine et l’usage d’un contenu,
- aux machines (moteurs de recherche, agents IA, systèmes d’archivage) de découvrir, trier, lier et réutiliser ce contenu de façon automatisée.
Outils et technologies pour les métadonnées
1. Formats et standards
| Standard | Domaine d’usage | Pertinence DMA |
|---|---|---|
| Dublin Core (DC / DCTERMS) | Généraliste (titre, auteur, date, sujet) | Simple, universel, utilisé par HAL, archives |
| Schema.org | Web sémantique, SEO, Google Dataset Search | JSON-LD natif, idéal pour WordPress documentaire |
| SKOS (Simple Knowledge Organization System) | Thésaurus, vocabulaires contrôlés | Pour catégoriser contenus culturels (ex. : genres de contes) |
| FOAF (Friend of a Friend) | Description de personnes/organisations | Lier auteurs à leurs œuvres |
| RDF / Turtle / JSON-LD | Web sémantique, graphes de connaissances | Format d’échange pour Omeka S, Wikidata |
| EXIF / IPTC | Images (auteur, lieu, licence) | À préserver lors du traitement d’images |
- Pour le web → Schema.org en JSON-LD
- Pour les bases documentaires → Dublin Core + SKOS
2. Outils de création et édition
| Outil | Usage | Souveraineté |
|---|---|---|
| OpenRefine | Nettoyage + enrichissement via Wikidata, VIAF, BnF | Auto-hébergeable, puissant pour gros volumes |
| Wikidata Query Service | Recherche et extraction d’entités normalisées | Libre, interlingue, idéal pour ancrage culturel |
| VIAF (Virtual International Authority File) | Identifier auteurs de façon persistante | Intégrable via API |
| BnF Catalogue / Rameau | Thésaurus français officiel | Pour projets francophones |
| Getty AAT | Vocabulaire contrôlé pour l’art et l’architecture | Utile pour patrimoine |
Workflow typique :
CSV brut → OpenRefine → reconciliation Wikidata → export RDF/JSON-LD → injection dans Omeka S ou WordPress.
3. Plateformes intégrant les métadonnées
| Plateforme | Gestion des métadonnées |
|---|---|
| Omeka S | Modèles de ressources basés sur RDF, vocabulaires SKOS, liens vers Wikidata |
| WordPress | Via plugins (Rank Math, Schema Pro) ou thème personnalisé |
| Drupal | Entités de contenu + champs RDF |
| Wikibase | Infrastructure derrière Wikidata, auto-hébergeable |
| Archives ouvertes (HAL, arXiv) | Métadonnées DC obligatoires |
4. Validation et test
| Outil | Fonction |
|---|---|
| Google Rich Results Test | Valider JSON-LD pour Google |
| Schema Markup Validator (Yandex) | Alternative neutre |
| W3C RDF Validator | Vérifier la syntaxe RDF/Turtle |
| Lighthouse | Audit SEO + accessibilité |
5. Bonnes pratiques
- Utiliser des identifiants persistants : Wikidata QID, ISNI, ARK, DOI
- Annoter dans la langue du contenu (ex. :
lang="") - Éviter les métadonnées vides ou génériques (
"description": "...") - Documenter son schéma de métadonnées (fichier
METADATA.mddans le repo) - Exporter les métadonnées séparément (CSV, RDF) pour archivage