AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 546465
Accepted
manifestor
manifestor
Asked: 2019-10-13 03:22:39 +0800 CST2019-10-13 03:22:39 +0800 CST 2019-10-13 03:22:39 +0800 CST

bzip2: Verifica o tamanho descompactado do arquivo sem realmente descompactá-lo

  • 772

Eu tenho um grande bzip2arquivo compactado e preciso verificar seu tamanho descompactado sem realmente descompactá-lo (semelhante a gzip -l file.gzou xz -l file.xz). Como isso pode ser feito usando bzip2?

compression
  • 2 2 respostas
  • 3261 Views

2 respostas

  • Voted
  1. Best Answer
    frostschutz
    2019-10-13T05:40:24+08:002019-10-13T05:40:24+08:00

    Como mencionado nos comentários e na resposta vinculada, a única maneira confiável é descompactar (em um pipe) e fazer uma contagem de bytes.

    $ bzcat file.bz2 | wc -c
    1234
    

    Como alternativa, encontre alguma ferramenta que faça isso sem o tubo supérfluo (pode ser um pouco mais eficiente):

    $ 7z t file.bz2
    [...]
    Everything is Ok
    Size:       1234
    

    Isso também se aplica ao gzip e outros formatos. Embora gzip -l file.gzimprima um tamanho, pode ser um resultado errado. Quando o arquivo passa de um determinado tamanho, você obtém coisas como:

    $ gzip --list foobar.gz 
             compressed        uncompressed  ratio uncompressed_name
               97894400            58835168 -66.4% foobar
    $ gzip --list foobar.gz 
             compressed        uncompressed  ratio uncompressed_name
             4796137936                   0   0.0% foobar
    

    Ou se o arquivo foi concatenado ou simplesmente não foi criado corretamente:

    $ truncate -s 1234 foobar
    $ gzip foobar
    $ cat foobar.gz foobar.gz > barfoo.gz
    $ gzip -l barfoo.gz 
             compressed        uncompressed  ratio uncompressed_name
                     74                1234  96.0% barfoo
    $ zcat barfoo.gz | wc -c
    2468
    

    O tamanho não corresponde, então isso não é confiável de forma alguma.

    Às vezes você pode trapacear, dependendo do que está dentro do arquivo. Por exemplo, se for uma imagem compactada do sistema de arquivos, com um cabeçalho de metadados no início, você pode descompactar apenas esse cabeçalho e ler o tamanho total do sistema de arquivos a partir dele.

    $ truncate -s 1234M foobar.img
    $ mkfs.ext2 foobar.img
    $ bzip2 foobar.img
    $ bzcat foobar.img.bz2 | head -c 1M > header.img
    $ tune2fs -l header.img
    tune2fs 1.45.4 (23-Sep-2019)
    Filesystem volume name:   <none>
    Last mounted on:          <not available>
    Filesystem UUID:          95b64880-c4a7-4bea-9b63-6fdcc86d0914
    [...]
    Block count:              315904
    Block size:               4096
    

    Então, extraindo uma pequena parte, você aprende que são 315.904 blocos de 4.096 bytes, o que resulta em 1.234 MiB.

    Não há garantia de que seria o tamanho real do arquivo compactado (pode ser maior ou menor), mas assumindo que não há coisas estranhas, é mais confiável do que gzip -lem qualquer caso.

    Por último, mas não menos importante, se esses arquivos forem criados por você, basta registrar o tamanho.

    • 6
  2. NATI0N
    2019-10-13T04:27:46+08:002019-10-13T04:27:46+08:00

    Essa pergunta já foi respondida aqui . Colado abaixo:

    Conforme observado por outros, o bzip2 não fornece muitas informações. Mas essa técnica funciona - você terá que descompactar o arquivo, mas não precisará gravar os dados descompactados no disco, o que pode ser uma solução "boa o suficiente" para você:

    $ ls -l foo.bz2
    -rw-r--r-- 1 ~quack ~quack 2364418 Jul  4 11:15 foo.bz2
    
    $ bzcat foo.bz2 | wc -c         # bzcat decompresses to stdout, wc -c counts bytes
    2928640                         # number of bytes of decompressed data
    

    Você pode canalizar essa saída para outra coisa para fornecer uma forma legível por humanos:

    $ ls -lh foo.bz2
    -rw-r--r-- 1 quack quack 2.3M Jul  4 11:15 foo.bz2
    
    $ bzcat foo.bz2 | wc -c | perl -lne 'printf("%.2fM\n", $_/1024/1024)'
    2.79M
    
    • 2

relate perguntas

  • Crie arquivos 7z separados para cada diretório no diretório atual e, adicionalmente, paralelize através do GNU Parallel

  • É possível alterar o nível de compactação zlib-flate?

  • Como extraio um "arquivo X1"?

  • compressão com btrfs-send / btrfs-receive

  • Como ativar a compactação btrfs zstd

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Possível firmware ausente /lib/firmware/i915/* para o módulo i915

    • 3 respostas
  • Marko Smith

    Falha ao buscar o repositório de backports jessie

    • 4 respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    user12345 Falha ao buscar o repositório de backports jessie 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl Por que a maioria dos exemplos do systemd contém WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve