Données, information et contenus

Lexique de la data – Données brutes, informations structurées, contenus éditorialisés : ces trois niveaux forment l’épine dorsale de tout système numérique. Cette thématique explore comment l’information est capturée, nommée, liée, publiée et rendue utile — ou au contraire, exploitée. Elle met l’accent sur la structuration sémantique, la réutilisabilité et la souveraineté des contenus.

Définitions associées

  • AIPD

    Acronyme de Analyse d’Impact à la Protection des données, document obligatoire à fournir à cas de contrôle RGDP, qui décrit l’analyse des risques pour la vie privée. Outil PIA Synonyme : PIA (Privacy Impact Assessment). DPIA (Data Protection Impact Assessment) ou AIPD (Analyse d’Impact relative à la Protection des Données) est un processus obligatoire prévu…

  • Analyse de données – Data Analytics

    Discipline qui consiste à explorer, transformer, modéliser et visualiser des données afin d’en extraire des insights actionnables, valider des hypothèses ou soutenir la prise de décision. Contrairement au simple reporting, le data analytics implique souvent une démarche itérative, combinant nettoyage, agrégation, statistique descriptive, et parfois apprentissage automatique léger. Technologies et outils associés 1. Langages &…

  • Analyse exploratoire des données

    L’analyse exploratoire des données (ou EDA, pour Exploratory Data Analysis) est une première étape essentielle dans tout projet de data science ou d’analyse de données. Elle consiste à examiner, visualiser et résumer un jeu de données pour en comprendre la structure, détecter des tendances, repérer des anomalies, formuler des hypothèses… avant de construire des modèles.…

  • Axe de communication

    Un axe de communication est une thématique stratégique cohérente et récurrente autour de laquelle une organisation structure tout ou partie de ses messages, contenus et actions de communication. Il traduit un objectif de positionnement, une valeur fondatrice ou une promesse spécifique adressée à un public cible, et sert de fil conducteur pour garantir la cohérence,…

  • Big Data

    Le big data est l’ensemble des données récoltées, massives, qui seront ensuite triées, stockées ou analysées à postériori ou en temps réel par des outils informatique. Par exemple, les emails collectés par une entreprise sont des données qui font partie de ses data. Le concept de big data s’est popularisé dans les années 2010. Les…

  • Checksum

    Un checksum (ou « somme de contrôle ») est une valeur numérique calculée à partir du contenu d’un fichier ou d’un ensemble de données, utilisée pour vérifier l’intégrité de ces données lors d’un transfert, d’une copie ou d’un stockage. Il fonctionne comme une empreinte mathématique : même une modification minime (un bit changé) produira un…

  • Cyberrésilience

    La cyberrésilience, c’est la capacité d’une entreprise à « rebondir » après un problème numérique grave , comme une cyberattaque, une panne informatique ou une faille de sécurité. C’est comme l’immunité numérique d’une organisation : elle ne cherche pas seulement à éviter les coups, mais aussi à les encaisser, y faire face et s’en remettre rapidement, sans…

  • Dark data – données sombres

    Données collectées, stockées et conservées par une organisation mais jamais utilisées à des fins opérationnelles, analytiques ou stratégiques. Les dark data (« données sombres ») désignent l’ensemble des données inactives qu’une organisation continue de conserver — souvent par habitude, par précaution, ou faute de politique claire de gestion du cycle de vie des données —…

  • Data center – Centre de données

    Infrastructure physique spécialisée qui héberge, alimente, refroidit et sécurise des serveurs, des systèmes de stockage et des équipements réseau traitant ou conservant de grandes quantités de données. Un centre de données est un bâtiment ou un espace technique conçu pour accueillir de manière fiable, sécurisée et énergétiquement optimisée des infrastructures informatiques critiques : serveurs, baies…

  • Data lake

    Un data lake (« lac de données ») est une architecture de stockage à faible coût, hautement scalable et orientée données brutes. Contrairement aux entrepôts de données (data warehouses), qui imposent un schéma rigide dès l’ingestion, le data lake stocke les données « telles quelles », sans transformation préalable, permettant ainsi une exploration ouverte, des…

À quoi ça sert / Pour qui

À transformer des flux chaotiques en ressources documentaires exploitables, interopérables et pérennes.
Pour les documentalistes, archivistes numériques, concepteur·rices de bases de connaissances, équipes culturelles, développeur·ses sensibles au web sémantique, ou toute personne travaillant à la description ou à la diffusion de savoirs.

Repères

  • Domaines concernés : Data & analytics, Architecture de l’information, Expérience utilisateur, Écoconception
  • Types de concepts associés :
    • Concept (ex. Donnée, Information, Contenu, Métadonnée)
    • Format (ex. JSON-LD, XML, CSV, RDF)
    • Technologie (ex. Knowledge graph, API de contenu)
    • Pratique (ex. Documentation sémantique, Enrichissement contextuel)
    • Méthode (ex. Modélisation d’ontologie, Cartographie documentaire)
  • Rôles liés :
    • Gestionnaire de contenu
    • Documentaliste numérique
    • Architecte de l’information
    • Développeur·se sémantique
    • Référent·e données ouvertes
  • Niveau d’appropriation recommandé :
    Découverte → Compréhension → Application → Structuration → Maîtrise opérationnelle

Aller plus loin

Thématiques proches

• Web sémantique et données liées
• Gestion documentaire résiliente
• Architecture de l’information
• Sobriété documentaire

Domaines liés

• Data & analytics
• Architecture de l’information
• Expérience utilisateur
• Écoconception

Définitions connexes

• Donnée – Concept
• Métadonnée – Concept
• JSON-LD – Format
• Knowledge graph – Technologie
• CMS – Plateforme
• Ontologie – Modèle
• Schema.org – Standard
• Enrichissement sémantique – Pratique

FAQ

Pourquoi structurer les contenus avec JSON-LD plutôt que laisser faire Google ?

Parce que structurer soi-même, c’est garder la main sur le sens donné à ses contenus. JSON-LD permet de décrire explicitement qui, quoi, où, quand — sans dépendre des algorithmes opaques de reconnaissance automatique.

Un knowledge graph, c’est réservé aux géants du web ?

Non. Un graph de connaissances peut être petit, local et maîtrisé : un musée, une association, un projet pédagogique peuvent modéliser leurs entités (personnes, œuvres, lieux) et leurs relations pour permettre une navigation intelligible et non linéaire.