HDFS (Hadoop Distributed File System) est une des composantes du framework Hadoop.
HDFS est un système de fichiers distribué, c'est-à-dire qu'il utilise un cluster de serveurs pour constituer un espace de stockage.
HDFS est capable de stocker un nombre quelconque de fichiers. Les fichiers stockés dans le cluster sont découpés en blocs de données et répartis sur les différents noeuds du cluster HDFS.
Pour garantir la résilience des données, chaque bloc de données est dupliqué sur plusieurs noeuds (trois par défaut).
Ainsi, si un noeud tombe en panne, le système de fichiers n'est pas affecté.