Données conçues pour être trouvées, comprises et réutilisées par des humains et des machines sans dépendre d’un intermédiaire centralisé.
Un dataset FAIR n’est pas une théorie abstraite : c’est une manière pratique de préparer, documenter et partager des données pour qu’elles soient immédiatement utiles à vous, à vos collègues, à une API, ou à un futur projet.
Le jeu de données est conçu selon les principes FAIR Findable (trouvable), Accessible (accessible), Interoperable (interopérable), Reusable (réutilisable) afin de maximiser sa découvrabilité, sa réutilisation éthique et sa persistance, sans dépendre des plateformes propriétaires.
Les 4 piliers :
- Findable : doté d’un identifiant persistant (ex. : DOI, handle, CID IPFS) et de métadonnées riches (ex. : JSON-LD, Schema.org).
- Accessible : téléchargeable via un protocole ouvert (HTTP, IPFS), même si l’accès est restreint (ex. : authentification, licence).
- Interoperable : utilise des formats ouverts (CSV, JSON, RDF) et des vocabulaires partagés (ex. : Wikidata, ISO 639-3 pour les langues).
- Reusable : accompagné d’une licence claire (ex. : CC-BY-SA, ODC-BY) et de contexte (auteurs, langue, usage visé).
Pourquoi c’est important ?
Parce que dans la vraie vie, les chercheurs, les journalistes, les professeurs ou les citoyens ont besoin de données fiables et partageables pour :
- Comprendre le climat,
- Sauver des vies avec la médecine,
- Protéger les langues rares,
- Ou créer des outils utiles pour tout le monde.
Mais si les données sont cachées, mal rangées, sans explication ou verrouillées, elles deviennent inutiles.
Exemple concret
Vous exportez la liste des utilisateurs inscrits à une formation en ligne (anonymisés) :
- Non FAIR :
liste_participants.xlsxenvoyé par email. - FAIR :
Un chercheur en éducation peut intégrer vos données dans une méta-analyse mondiale… sans vous relancer.
Pourquoi c’est utile ?
- Automatisation : vos propres outils peuvent consommer ces données plus tard.
- Crédit : chaque réutilisation cite votre travail.
- Conformité : exigence croissante des financeurs publics (ANR, UE, etc.).
- Impact : vos données deviennent une ressource du commun numérique, pas un fichier mort.
FAIR, c’est transformer un simple export de base de données en une brique réutilisable de l’infrastructure numérique publique.