Eu tenho um arquivo compactado Data.zip
que (se descompactado) contém muitos arquivos:
file_1.txt
file_2.txt
...
...
Eu quero ter um comando CLI para transformar isso em uma nova pasta Data_zipped
que contém os arquivos individuais Data.zip
descompactados:
Data_zipped/file_1.zip
Data_zipped/file_2.zip
...
...
Mas o truque é que Data.zip
contém tantos arquivos (e eles são tão grandes coletivamente) que não consigo primeiro descompactar Data.zip e depois compactar os arquivos individuais dentro dele de uma só vez: tudo tem que acontecer 'na hora':
Para todos os arquivos emData.zip/
- obtenha o i-ésimo arquivo
- comprimi-lo em
name_of_that_file.zip
- armazene o arquivo compactado na nova pasta
Data_zipped
Como fazer isso usando a CLI?
Eu modifiquei o script super claro do @George para ajudar a explicar melhor a estrutura da pasta:
#!/bin/bash
#Name of zip file
filename=$1
# Check if valid zip file is passed
if [[ $(file "$filename" | grep -o "Zip archive data") =~ "Zip archive data" ]]
then
# List the contents of the zip file
unzip -l "$filename"
# Get the number of files in zip file
count=$(unzip -l "$filename" | awk '{count = $2 - 2} END {print count}')
echo "$count"
fi
exit 0
Quando executo, recebo (eu uso um token Data.zip com apenas alguns arquivos, mas você entendeu):
./GU_script.sh Data.zip
Archive: Data.zip
Length Date Time Name
--------- ---------- ----- ----
0 2017-11-21 22:58 Data/
120166309 2017-11-21 14:58 Data/Level1_file.csv
120887829 2017-11-21 14:58 Data/Level1_other_file.csv
163772796 2017-11-21 14:59 Data/Level1_yet_other_file.csv
193519556 2017-11-21 14:59 Data/Level1_here_is_another_file.csv
153798779 2017-11-21 14:59 Data/Level1_so_many_files.csv
131918225 2017-11-21 14:59 Data/Level1_many_more_to_go.csv
--------- -------
884063494 7 files
5
Então, basicamente, eu gostaria que Level1_file.csv
os outros arquivos fossem compactados individualmente (-> Level1_file.zip) e colocados em uma pasta.
Editar2;
Acabei combinando as respostas de @George e @David Foerster:
#!/bin/bash
#Name of zip file
filename="$1"
# Check if valid zip file is passed
if file "$filename" | grep -wq "Zip archive data";
then
#!/bin/bash
src="$filename"
dst=.
LC_ALL=C unzip -l "$src" |
sed -re '1,/^-{6}/d; /^-{6}/,$d; /\/$/d; s/^\s*(\S+\s+){3}//' |
while IFS= read -r f; do
out="${f##*/}"; out="$dst/${f%%/*}_zipped/${out%.*}.zip"
if [ ! -d "${out%/*}" ]; then
mkdir -p "${out%/*}" || break
fi
zip --copy "$src" --out "$out" "$f" || break
done
else
echo "Invalid file type: \"zip\" file required"
exit 1
fi
Você pode usar a operação de “copiar”
zip(1)
e algumas alterações no caminho do arquivo. Tem a vantagem de copiar fluxos de dados compactados diretamente para o arquivo de destino sem descompactação intermitente.Acrescentei
LC_ALL=C
à invocação deunzip
porque seu formato de saída parece um pouco esquisito em diferentes implementações e quero evitar, pelo menos, variantes de saída dependentes de localidade.Isso deve ser capaz de fazer o que você deseja:
Nota :
Estrutura de árvore usada:
Você já pensou em procurar um sistema de arquivos fuse com suporte a zip ?
Isso basicamente expõe o arquivo zip como um diretório regular, do qual qualquer aplicativo pode abrir e ler arquivos, enquanto a biblioteca fuse lida com os detalhes sujos de leitura e gravação do fluxo compactado.
No Ubuntu você pode instalá-lo com
sudo apt install fuse-zip
Depois de instalar o fuse-zip, você pode montar um arquivo zip com
fuse-zip /path/to/some.zip mnt/
, onde mnt é um diretório vazio de sua escolha.Após terminar, desmonte-o com
fusermount -u mnt/
, onde mnt é o diretório onde você o montou.fuse-zip até criará o zip instantaneamente para você, se não existir.
você pode descompactar os arquivos contidos em Data.zip um por um:
unzip Data.zip file1.txt
e comprimi-los.