Modélisation des données

La modélisation des données consiste à concevoir la structure logique qui décrit comment les données sont organisées, liées et stockées.

Dans un monde où les données proviennent de sources très diverses structurées (bases SQL), semi-structurées (JSON, logs) et non structurées (textes, images) — la modélisation classique (tables rigides) devient insuffisante.

Il faut alors adopter des schémas flexibles ou des modèles orientés graphe, capables de :

  • Accueillir des formats variés,
  • Représenter des relations complexes (ex. : « cet utilisateur a consulté cette page, puis a mentionné ce lieu sur Twitter »),
  • Évoluer sans casser l’ensemble du système.

L’objectif n’est plus seulement de stocker, mais de relier avec du sens une démarche au cœur du web sémantique et de la documentation intelligente.

Exemple concret : la vue 360° du client

Pour comprendre un client dans sa globalité, une organisation peut fusionner :

SourceType de donnéesStructure
CRM (ex. : HubSpot, Salesforce)Identité, historique d’achat, statutStructurée (tables relationnelles)
Logs de navigation (site web, app)Pages visitées, temps passé, parcoursSemi-structurée (JSON, événements horodatés)
Réseaux sociaux (commentaires, mentions)Opinions, émotions, hashtagsNon structurée (texte libre, images)

Comment les relier ?

  • Un modèle en graphe permet de représenter :
    • Le client comme un nœud central,
    • Ses interactions (achats, clics, commentaires) comme des arêtes,
    • Les entités mentionnées (produits, lieux, émotions) comme d’autres nœuds.
  • Grâce à des techniques comme le NER (Named Entity Recognition) ou le linking sémantique, on peut relier « Paris » dans un tweet à wd:Q90 (Wikidata), ou « produit X » à une fiche produit normalisée.

Résultat : une représentation riche, dynamique et interopérable du client, bien plus utile qu’un simple tableau Excel.

Technologies associées

ApprocheOutils / standards
Modèle en grapheNeo4j, Apache Jena, GraphDB, RDF/OWL
Schémas flexiblesJSON Schema, Avro, MongoDB (schema validation optionnelle)
Lien sémantiqueWikidata, Schema.org, ontologies SSN/SOSA (IoT), SKOS
Enrichissement NLPspaCy, Stanza, transformers (Hugging Face)
Les contenus de définition restent publics. Les ressources (outils, grilles, supports) liées à cette fiche sont disponibles dans l’espace membre.