Données sans organisation prédéfinie ni modèle fixe. Elles ne se prêtent pas naturellement à une représentation tabulaire.
Formats typiques
Textes libres, images, vidéos, fichiers audio, PDF scannés, posts sur les réseaux sociaux.
Exemples
- Un article de blog en Markdown
- Une photo d’archive historique
- Un enregistrement audio d’un cours de géographie
Avantages
Très riches en information humaine, proches de l’usage réel.
Inconvénients
Difficiles à indexer, analyser ou relier sans outils spécialisés (NLP, vision par ordinateur, transcription, etc.).
Pour les rendre exploitables, on cherche à leur ajouter de la structure (métadonnées, annotations, embeddings) : c’est au cœur de la documentation numérique et du SEO documentaire.
Hétérogénéité des types de données
| Type | Structure | Exemples | Outils associés |
|---|---|---|---|
| Structurées | Rigide, tabulaire | BDD clients, commandes | SQL, PostgreSQL |
| Semi-structurées | Souple, hiérarchique | JSON, XML, logs | NoSQL, APIs, ETL |
| Non-structurées | Aucune structure native | Textes, images, vidéos | NLP, IA générative, métadonnées |