Traitement des données par lots pour les assainir et les normaliser à des fins décisionnelles et de performance.
Le traitement Batch remonte à l’invention de la machine à statistiques par Herman Hollerith en 1890, créateur d’IBM (International Business Machines Corporation).
Dans le traitement de data en mode curatif dans un CRM les données sont envoyées à un rythme mensuel ou annuel pour être nettoyées de manière massive.
Dans le mode de traitement régulier, les données sont traitées quotidiennement dans le but d’améliorer la performance, éliminer les doublons, vérifier la délivrabilité des emails, NPAI (n’habite pas à l’adresse indiquée)…
Spark Apache et Hadoop sont des frameworks open source gratuits qui permettent de créer des applications capables de créer de stocker et traiter des données massives en mode batch.