Données non-structurées

Données sans organisation prédéfinie ni modèle fixe. Elles ne se prêtent pas naturellement à une représentation tabulaire.

Formats typiques

Textes libres, images, vidéos, fichiers audio, PDF scannés, posts sur les réseaux sociaux.

Exemples

  • Un article de blog en Markdown
  • Une photo d’archive historique
  • Un enregistrement audio d’un cours de géographie

Avantages

Très riches en information humaine, proches de l’usage réel.

Inconvénients

Difficiles à indexer, analyser ou relier sans outils spécialisés (NLP, vision par ordinateur, transcription, etc.).

Pour les rendre exploitables, on cherche à leur ajouter de la structure (métadonnées, annotations, embeddings) : c’est au cœur de la documentation numérique et du SEO documentaire.

Hétérogénéité des types de données

TypeStructureExemplesOutils associés
StructuréesRigide, tabulaireBDD clients, commandesSQL, PostgreSQL
Semi-structuréesSouple, hiérarchiqueJSON, XML, logsNoSQL, APIs, ETL
Non-structuréesAucune structure nativeTextes, images, vidéosNLP, IA générative, métadonnées
Les contenus de définition restent publics. Les ressources (outils, grilles, supports) liées à cette fiche sont disponibles dans l’espace membre.