Hadoop

Hadoop est un framework qui permet de stocker et de traiter de grandes quantités de données structurées sur des clusters de serveurs.

L’éco-système Hadoop a été créé par Doug Cutting et Mike Cafarella en 2005, en s’inspirant des travaux de Google sur le système de fichiers distribué et le traitement de données en grands volumes.

Hadoop est un projet open-source soutenu et développé par la Fondation Apache.

Pour utiliser Hadoop, il est recommandé d’utiliser un service d’hébergement ou une infrastructure cloud spécialisée dans le traitement de données distribuées telles que le cloud d’Amazon Web Services (AWS) ERM, Google Cloud Dataproc, Microsoft Azure HDInsight.