Le text mining est le processus d’exploration et d’analyse de grands volumes de données textuelles afin d’en extraire des informations, des tendances et des relations significatives.
Panorama d’outils couramment utilisés en text-mining
Bibliothèques Python pour le text mining
- Gensim
- NLTK (Natural Language Toolkit) : bibliothèque Python
- SpaCy
- TextBlob
Modèles de traitement de langage naturel
- Doc2Vec
- Stanford NLP
- Word2Vec
Plateformes d’analyse
- RapidMiner
- Knime (Open source)
Synonyme : text analytics, fouille de texte, extraction de connaissances à partir de textes