¿Qué significa hdfs?
El significado de hdfs se presenta a continuación:
hdfs es la abreviatura de HadoopDistributedFileSystemHadoop.
El sistema de archivos distribuido (HDFS) se refiere a un sistema de archivos distribuido (sistema de archivos distribuido) diseñado para ejecutarse en hardware común (hardware básico). Tiene muchas similitudes con los sistemas de archivos distribuidos existentes. Pero al mismo tiempo, la diferencia entre este y otros sistemas de archivos distribuidos también es obvia.
HDFS es un sistema altamente tolerante a fallos y es adecuado para su implementación en máquinas económicas. HDFS puede proporcionar acceso a datos de alto rendimiento y es muy adecuado para aplicaciones en conjuntos de datos a gran escala. HDFS relaja algunas restricciones POSIX para lograr el propósito de transmitir datos del sistema de archivos. HDFS se desarrolló originalmente como infraestructura para el proyecto del motor de búsqueda Apache Nutch. HDFS es parte del proyecto Apache Hadoop Core.
HDFS tiene características de alta tolerancia a fallas y está diseñado para implementarse en hardware de bajo costo. Y proporciona un alto rendimiento para acceder a los datos de la aplicación, adecuado para aplicaciones con grandes conjuntos de datos.
HDFS relaja los requisitos POSIX para que se pueda lograr el acceso por streaming a los datos en el sistema de archivos.
HDFS adopta un modelo de estructura maestro/esclavo. Un clúster HDFS está compuesto por un NameNode y varios DataNodes. El NameNode sirve como servidor principal, administra el espacio de nombres del sistema de archivos y el acceso del cliente a los archivos; el DataNode en el clúster administra los datos almacenados.