¿Cuáles son los sistemas de almacenamiento de archivos distribuidos?
En la actualidad, además de GPFS, varios sistemas de archivos distribuidos convencionales incluyen PVFS, Lustre, PanFS, GoogleFS, etc. La introducción específica es la siguiente:
1. El proyecto PVFS (Parallel Virtual File System) es un proyecto de código abierto creado por la Universidad de Clemson para ejecutar clústeres de Linux. Actualmente, PVFS todavía tiene las siguientes deficiencias:
1. p>
( 1) Nodo de administración único: solo hay un nodo de administración para administrar los metadatos. Cuando el sistema del clúster alcanza una cierta escala, el nodo de administración puede estar demasiado ocupado y se convertirá en un cuello de botella del sistema; /p>
(2) Falta de mecanismo tolerante a fallas para el almacenamiento de datos: cuando un determinado nodo de E/S no puede funcionar, los datos no estarán disponibles;
(3) Configuración estática: la configuración de PVFS solo se puede hacer en Realice esto antes de comenzar. Una vez que el sistema se está ejecutando, la configuración original no se puede cambiar.
2. El sistema de archivos Lustre es un sistema de archivos distribuido basado en almacenamiento de objetos. Este proyecto se lanzó en la Universidad Carnegie Mellon en 1999. Lustre también es un proyecto de código abierto. Tiene solo dos nodos de gestión de metadatos, similar a PVFS. Cuando el sistema alcanza una cierta escala, los nodos de gestión se convertirán en el cuello de botella del sistema Lustre.
3. PanFS (Panasas File System) es un sistema de archivos distribuido utilizado por Panasas para administrar su propio sistema de almacenamiento en clúster.
4. GoogleFS (Google File System) es un sistema de archivos distribuido diseñado por Google para satisfacer las necesidades internas de procesamiento de datos de la empresa.
5. En comparación con otros sistemas de archivos, GPFS tiene las siguientes tres ventajas principales:
(1) Utilice una gestión de bloqueo distribuida y una estrategia de bloques de datos grandes para admitir clústeres de archivos más grandes. El administrador de tokens del sistema establece bloqueos detallados para bloques, inodos, atributos y entradas de directorio. El primer cliente en obtener el bloqueo será responsable de mantener la gestión de coherencia de los objetos compartidos correspondientes, lo que reduce los metadatos. La carga en el servidor; /p>
(2) Con múltiples servidores de metadatos, los metadatos también se distribuyen, lo que hace que la administración de metadatos ya no sea un cuello de botella del sistema;
(3) La administración de tokens utiliza bytes como unidad mínima de bloqueos, lo que significa que a menos que dos solicitudes accedan al mismo byte de datos en el mismo archivo, las solicitudes de acceso a datos nunca entrarán en conflicto.