Las diferencias entre los formatos de compresión comunes de Linux Tar, Zip y Gz
Al igual que Unix y los sistemas similares a Unix, esta historia comienza hace mucho tiempo, en la década de 1970. A primera hora de la mañana de junio de 1979, la utilidad Tar se lanzó oficialmente por primera vez como parte de Unix V7. En ese momento, el programa Tar se diseñó principalmente como una forma de escribir archivos en cinta por lotes y de manera eficiente. Ahora, aunque la mayoría de los usuarios de Linux no saben qué es una unidad de cinta, los archivos tar (un apodo para tar) todavía se usan comúnmente para empaquetar múltiples archivos o incluso árboles de directorios completos en un solo archivo.
Los usuarios de Linux/Unix deben tener en cuenta que los archivos en formato tar normal sólo se archivan en lugar de comprimirse. En otras palabras, si tar 100 archivos de 50 kb, el tamaño del archivo tar debería ser de alrededor de 5000 kb.
El único beneficio de utilizar Tar para archivar archivos es que reduce la asignación de espacio en disco con cierta granularidad. (Por ejemplo, un archivo de 1 byte también ocupará 4 kb de espacio en disco en un disco con un tamaño de clúster de 4 kb. Si hay 1000 archivos de 1 byte dispersos en este disco, ocupará 4 MB, pero después de archivarlos con Tar, solo ocupa alrededor de 1 MB)
Vale la pena mencionar que tar no es la única forma de crear archivos en Linux/Unix. Todos los amigos programadores deberían conocer ar, que se utiliza principalmente para crear bibliotecas estáticas en la mayoría de los casos. De hecho, también se puede utilizar para crear otros tipos de archivos. Por ejemplo, en. El archivo del paquete deb utilizado por el sistema Debian es el archivo ar. El paquete mpkg de macOS es un archivo cpio comprimido con gzip. Pero ar y cpio no son tan amigables y fáciles de usar como tar, por lo que tar es más popular y popular.
Aunque el archivado era una buena opción, a medida que pasó el tiempo y llegó la era de las PC personales, la gente se dio cuenta de que se podían ahorrar importantes costos de almacenamiento comprimiendo los datos. Por lo tanto, el archivo zip que apareció con MS-DOS 10 años después es un formato de archivo que admite la compresión. El método de compresión más común es la compresión con el algoritmo LZ77. Debido a que fue desarrollado por PKWARE, el formato zip también cuenta con muchos años de protección de patente. Por lo tanto, para no infringir la patente de PKWARE, se introdujo y utilizó ampliamente el formato gzip, que también utiliza el algoritmo LZ77.
La filosofía de Unix es hacer el mejor trabajo posible, por eso gzip sólo está diseñado para comprimir archivos. Por lo tanto, para crear un archivo comprimido, primero se debe crear el archivo usando tar y luego se debe comprimir el archivo, de ahí el archivo tar.gz (también conocido como tgz para abreviar, para cumplir con el nombre de archivo de MS-DOS 8.3). restricciones).
Con el continuo desarrollo de la tecnología, se han implementado uno por uno algoritmos de compresión con relaciones de compresión más altas, como el algoritmo Burrows-Wheeler implementado en bzip2. Archivo xz implementado utilizando el algoritmo LZMA.
Ahora los usuarios son libres de utilizar cualquier formato de archivo en Linux y Windows. Dado que el formato zip es compatible de forma nativa con el sistema operativo Windows, es especialmente adecuado para entornos multiplataforma.