Linux上的压缩与归档

嵌入式 44浏览

非常非常非常简要的描述而已。

压缩

压缩的简要原理是通过一些算法,拿CPU的计算时间去换磁盘上存储的空间。同时还可节省网络传输中的带宽。

对于文本文件的压缩效果比较好,对二进制程序、图片等文件的压缩效果就很差。

compress, uncompress

文件名:*.Z

古老的压缩工具,目前已经不使用。

gzip, gunzip, zcat

文件名:*.gz

gzip用于压缩文件,简要语法。

# gzip [OPTION] FILE...

FILE是待压缩的文件名,可多个。

[root@C7 tmp]# ls -l
total 364
-rw-r--r--. 1 root root  18104 Jan  3  2018 functions
-rw-r--r--  1 root root  22384 Apr 17 14:20 lvm_mount_point.xfsdump
-rw-------  1 root root 327049 Apr 23 16:20 messages
[root@C7 tmp]# gzip functions lvm_mount_point.xfsdump messages 
[root@C7 tmp]# ls -l
total 64
-rw-r--r-- 1 root root  5021 Jan  3  2018 functions.gz
-rw-r--r-- 1 root root   769 Apr 17 14:20 lvm_mount_point.xfsdump.gz
-rw------- 1 root root 50126 Apr 23 16:20 messages.gz

压缩后,会自动删除源文件,并生成.gz名称的压缩文件。

-d:用于解压缩。等同于gunzip命令。

[root@C7 tmp]# gzip -d functions.gz
[root@C7 tmp]# gunzip functions.gz

同理,解压后,压缩文件消失,压缩前的源文件生成。

-# --fast --best:“#”表示一个数字,取值为1~9,表示压缩的效果。1表示最快--fast,9表示最好--best。默认是6。

-c:表示将压缩后的数据流输出到STDOUT,不会修改源文件。结合重定向可以实现压缩文件时不删除源文件。

[root@C7 tmp]# ls -l functions*
-rw-r--r-- 1 root root 18104 Jan  3  2018 functions
[root@C7 tmp]# gzip -c functions > functions.gz
[root@C7 tmp]# ls -l functions*
-rw-r--r-- 1 root root 18104 Jan  3  2018 functions
-rw-r--r-- 1 root root  5021 Apr 23 16:51 functions.gz

对于文本文件压缩后的文件,是无法使用诸如cat等文本查看器直接查看了,想基于压缩文件查看的话,可使用zcat。

[root@C7 tmp]# zcat functions.gz | tail
              "x$1" = xcondrestart ] ; then

        systemctl_redirect $0 $1
        exit $?
    fi
fi

strstr "$(cat /proc/cmdline)" "rc.debug" && set -x
return 0

bzip2, bunzip2, bzcat

文件名:*.bz2

命令功能与用法等同于gzip系列。

在gzip中想要在压缩的时候保留源文件,需要通过-c选项结合重定向,而在bzip2中,可直接通过-k选项。

-k --keep:压缩时,不删除源文件。

[root@C7 tmp]# bzip2 -k lvm_mount_point.xfsdump
[root@C7 tmp]# ls -l lvm_mount_point.xfsdump*
-rw-r--r-- 1 root root 22384 Apr 17 14:20 lvm_mount_point.xfsdump
-rw-r--r-- 1 root root   764 Apr 17 14:20 lvm_mount_point.xfsdump.bz2

xz, unxz, xzcat

文件名:*.xz

命令功能与用法等同于bzip2系列。含-k选项。

压缩小结

压缩效果:xz>bzip2>gzip。

可通过file命令查看压缩文件的实际/内部格式,不可以仅通过文件的扩展名来判断一个文件的类型,扩展名仅作为用户识别。

[root@C7 tmp]# file functions.gz lvm_mount_point.xfsdump.bz2 messages.xz 
functions.gz:                gzip compressed data, was "functions", from Unix, last modified: Wed Jan  3 00:29:40 2018
lvm_mount_point.xfsdump.bz2: bzip2 compressed data, block size = 900k
messages.xz:                 XZ compressed data

 

归档

上述的压缩命令,是无法实现将多个文件合并压缩为一个压缩文件,或者针对目录进行压缩的。

[root@C7 tmp]# file init.d/
init.d/: directory
[root@C7 tmp]# gzip init.d/
gzip: init.d/ is a directory -- ignored
[root@C7 tmp]# bzip2 init.d/
bzip2: Input file init.d/ is a directory.
[root@C7 tmp]# xz init.d/
xz: init.d/: Is a directory, skipping

想实现该需求,就需要归档。

归档的作用是可以将多个文件/目录合并为一个档案文件(archive),即类似于Windows上的WinRAR的打包操作。

归档工具有两种,cpio和tar,前者是比较古老的命令,已逐渐被后者所取代,因此本文简述一下后者的使用即可。

创建档案

档案文件名:*.tar、*.tar.gz、*.tar.bz2、*.tar.xz

# tar -c[zjJ]f ARCH_FILE FILE...

-c:表示创建档案。

-f:指定档案文件名(ARCH_FILE),后面必须跟上档案文件名,否则报错。例如“-fc”会报错。

FILE:待归档文件/目录。

在归档的时候,可以指定压缩。tar的压缩本质上是调用了上文所说到的压缩工具,而不是它本身就具备了压缩的能力。

-z:使用gzip压缩。

-j:使用bzip2压缩。

-J:使用xz压缩。

[root@C7 tmp]# tar -czf test.tar.gz functions init.d/ lvm_mount_point.xfsdump messages 
[root@C7 tmp]# file test.tar.gz 
test.tar.gz: gzip compressed data, from Unix, last modified: Tue Apr 23 17:48:25 2019

归档操作不会删除源文件。因此归档压缩后,源文件“functions init.d/ lvm_mount_point.xfsdump messages”还存在。

展开档案

# tar -xf ARCH_FILE [-C EXTRACT_DIR]

tar展开归档,会自动覆盖已有文件。不需要指定原压缩格式,tar会自动识别。

[root@C7 tmp]# rm -rf functions lvm_mount_point.xfsdump messages init.d/
[root@C7 tmp]# tar -xf test.tar.gz
[root@C7 tmp]# ls -ld functions lvm_mount_point.xfsdump messages init.d/
-rw-r--r-- 1 root root  18104 Jan  3  2018 functions
drwxr-xr-x 2 root root     70 Apr 23 17:31 init.d/
-rw-r--r-- 1 root root  22384 Apr 17 14:20 lvm_mount_point.xfsdump
-rw------- 1 root root 327049 Apr 23 16:20 messages

-C EXTRACT_DIR:用于指定归档展开的路径,默认不指定的话,是在当前目录下。

[root@C7 tmp]# mkdir new_dir
[root@C7 tmp]# tar -xf test.tar.gz -C new_dir/
[root@C7 tmp]# ls -l new_dir/
total 364
-rw-r--r-- 1 root root  18104 Jan  3  2018 functions
drwxr-xr-x 2 root root     70 Apr 23 17:31 init.d
-rw-r--r-- 1 root root  22384 Apr 17 14:20 lvm_mount_point.xfsdump
-rw------- 1 root root 327049 Apr 23 16:20 messages

查看档案

# tar -tf ARCH_FILE
[root@C7 tmp]# tar -tf test.tar.gz 
functions
init.d/
init.d/README
init.d/functions
init.d/netconsole
init.d/network
lvm_mount_point.xfsdump
messages