L’exploration de données est un processus de découverte et d’extraction des modèles, des anomalies, des corrélations utiles dans de grands volumes de données brutes ou sur le Web.
Une fois triées, les informations peuvent aider le Machine Learning pour réaliser des tâches complexes sans avoir besoin d’intervention humaine.
Le data mining désigne aussi les technologies qui servent à l’analyse des comportements d’achat des consommateurs, l’analyse des corrélations de produits dans le panier, analyser le cycle de décision.
Quelques outils de data mining
- Apache Mahout
- DataMelt
- Elki
- Knime
- Orange
- Rattle
- Scikit Learn
- SAS Data Mining
- TeraData
- R-Programming
- Xplently
- Rapid Miner
- Board