Hadoop est une plateforme de gestion de données distribuées ou un framework logiciel open source destiné au stockage et au traitement de
Big Data. Il est parfois décrit comme une forme de système d’exploitation distribué et allégé. Il est conçu pour gérer et exploiter de vastes
volumes de données, pour une mise à l'échelle linéaire sur de vastes clusters constitués de milliers d’ordinateurs. Il a été développé à l’origine pour Yahoo!, mais est désormais disponible gratuitement et publiquement grâce à l'Apache Software Foundation, même si son exploitation nécessite généralement des connaissances approfondies en programmation.