Hadoop HDFS es un sistema de ficheros distribuido de Hadoop que almacena los archivos en un clúster de varias máquinas. De esta manera almacena grandes cantidades de datos, puesto que en general no es posible almacenar cientos de terabytes o petabytes en una única máquina.