我有一个压缩文件Data.zip
(如果未压缩)包含许多文件:
file_1.txt
file_2.txt
...
...
我想要一个 CLI 命令将其转换为一个新文件夹Data_zipped
,其中包含Data.zip
未压缩的单个文件:
Data_zipped/file_1.zip
Data_zipped/file_2.zip
...
...
但诀窍在于它Data.zip
包含如此多的文件(而且它们总体上是如此之大),以至于我无法先解压缩 Data.zip,然后一口气压缩其中的各个文件:这一切都必须“即时”发生:
对于所有文件Data.zip/
- 获取第 i 个文件
- 把它压缩成
name_of_that_file.zip
- 将压缩文件存储在新文件夹中
Data_zipped
如何使用 CLI 做到这一点?
我修改了@George 的超清晰脚本,以帮助更好地解释文件夹结构:
#!/bin/bash
#Name of zip file
filename=$1
# Check if valid zip file is passed
if [[ $(file "$filename" | grep -o "Zip archive data") =~ "Zip archive data" ]]
then
# List the contents of the zip file
unzip -l "$filename"
# Get the number of files in zip file
count=$(unzip -l "$filename" | awk '{count = $2 - 2} END {print count}')
echo "$count"
fi
exit 0
当我运行它时,我得到(我使用一个只有几个文件的令牌 Data.zip,但你明白了):
./GU_script.sh Data.zip
Archive: Data.zip
Length Date Time Name
--------- ---------- ----- ----
0 2017-11-21 22:58 Data/
120166309 2017-11-21 14:58 Data/Level1_file.csv
120887829 2017-11-21 14:58 Data/Level1_other_file.csv
163772796 2017-11-21 14:59 Data/Level1_yet_other_file.csv
193519556 2017-11-21 14:59 Data/Level1_here_is_another_file.csv
153798779 2017-11-21 14:59 Data/Level1_so_many_files.csv
131918225 2017-11-21 14:59 Data/Level1_many_more_to_go.csv
--------- -------
884063494 7 files
5
所以基本上,我希望将Level1_file.csv
其他文件单独压缩(-> Level1_file.zip)并放在一个文件夹中。
编辑2;
我最终结合了@George 和@David Foerster 的答案:
#!/bin/bash
#Name of zip file
filename="$1"
# Check if valid zip file is passed
if file "$filename" | grep -wq "Zip archive data";
then
#!/bin/bash
src="$filename"
dst=.
LC_ALL=C unzip -l "$src" |
sed -re '1,/^-{6}/d; /^-{6}/,$d; /\/$/d; s/^\s*(\S+\s+){3}//' |
while IFS= read -r f; do
out="${f##*/}"; out="$dst/${f%%/*}_zipped/${out%.*}.zip"
if [ ! -d "${out%/*}" ]; then
mkdir -p "${out%/*}" || break
fi
zip --copy "$src" --out "$out" "$f" || break
done
else
echo "Invalid file type: \"zip\" file required"
exit 1
fi
您可以使用“复制”操作
zip(1)
和一些文件路径修改。它的优点是可以将压缩数据流直接复制到目标存档,而无需间歇性解压。我添加
LC_ALL=C
了 的调用,unzip
因为它的输出格式在不同的实现中看起来有点不稳定,我想至少避免依赖于语言环境的输出变体。这应该能够做你想做的事:
注意:
使用的树结构:
您是否考虑过使用 zip-support 研究 fuse 文件系统?
这基本上将 zip 文件公开为常规目录,任何应用程序都可以从中打开和读取文件,而 fuse 库处理读取和写入压缩流的脏细节。
在 Ubuntu 上,你可以安装它
sudo apt install fuse-zip
安装 fuse-zip 后,您可以使用 安装 zip 文件
fuse-zip /path/to/some.zip mnt/
,其中 mnt 是您选择的空目录。完成后,使用 卸载它
fusermount -u mnt/
,其中 mnt 是您安装它的目录。fuse-zip 甚至会为您即时创建 zip,如果它不存在的话。
您可以将Data.zip中包含的文件一一解压缩:
unzip Data.zip file1.txt
并压缩它们。