Problema estranho ao passar variáveis do arquivo de texto

Question

DEKKER

Asked: 2022-10-01 04:20:46 +0800 CST2022-10-01 04:20:46 +0800 CST 2022-10-01 04:20:46 +0800 CST

Maneira mais rápida de escrever variável bash em um arquivo

772

Eu quero gerar alguns arquivos grandes para algum experimento.

Este é o meu roteiro. Ele cria um arquivo, em seguida, o lê para uma variável e tenta escrevê-lo quantas vezes forem definidas no loop em arquivos:

#! /usr/bin/env bash

set -e
set -u

< /dev/urandom tr -dc "\t\n [:alnum:]" | head -c32768 > temp.txt
data=$(cat ./temp.txt)

for testdir in "$@"; do
    echo "create directory '$testdir'"
    mkdir -p $testdir
    for i in {1..3}; do
        counter=$(printf %02d $i)
        testfile=$testdir/test_${testdir##*/}_$counter.txt
        echo "create file '$testfile'"
        echo "$data" > $testfile
    done
done

Se eu tentar usar este script para criar 3000 arquivos (cada pasta terá 3 arquivos) demora cerca de 19s no meu sistema:

tempo generateUserData.sh TESTE{0..1000}

create directory 'TEST999'
create file 'TEST999/test_TEST999_01.txt'
create file 'TEST999/test_TEST999_02.txt'
create file 'TEST999/test_TEST999_03.txt'
create directory 'TEST1000'
create file 'TEST1000/test_TEST1000_01.txt'
create file 'TEST1000/test_TEST1000_02.txt'
create file 'TEST1000/test_TEST1000_03.txt'

real    0m19.333s
user    0m14.791s
sys     0m4.784s

O reconhecimento echopode ser a parte lenta aqui. Alguma ideia de como posso fazer o dele o mais rápido possível?

2 respostas

Voted

Stéphane Chazelas · Answer 1 · 2022-10-01T04:51:06+08:00

Best Answer

Stéphane Chazelas

2022-10-01T04:51:06+08:002022-10-01T04:51:06+08:00

O que seria lento seria bifurcar processos e executar comandos externos comomkdir

counter=$(printf %02d $i)

Também bifurca um processo no bash. Isso pode ser evitado escrevendo-o como:

printf -v counter %02d "$i"

Ou:

printf -v testfile %s/%s_%02d.txt "$testdir" "${testdir##*/}" "$i"

Crie todo o diretório com uma mkdirinvocação ( mkdir -p -- "$@"; não esqueça do --) em vez de executar uma mkdirpor arquivo.

Também não há necessidade de um arquivo temporário:

data=$(< /dev/urandom tr -dc "\t\n [:alnum:]" | head -c32768; echo .)
data=${data%.}

A adição de .é necessária se você deseja $datater a garantia de conter 32768 bytes, pois a substituição de comando remove todos os caracteres de nova linha à direita. Observe também que echosem -nadiciona um de volta. printfdeve ser usado em vez de de echoqualquer maneira para dados arbitrários:

Também tenha cuidado head -c 32768, pois fornece 32768 bytes, não caracteres, portanto, pode cortar caracteres no meio.

printf %s "$data" > "$file"

3

bxm · Answer 2 · 2022-10-01T05:37:29+08:00

Assumindo um pouco do que Stéphane Chazelas disse em sua boa resposta, com alguns ajustes.

#!/usr/bin/env bash

set -e
set -u

main() {
  < /dev/urandom tr -dc "\t\n [:alnum:]" | dd iflag=fullblock of=./temp.txt bs=32K count=1
  mkdir -p -- "${@:?}"
  for testdir in "$@"; do
    for i in {1..3}; do
      printf "%s/%s_%02d.txt\n" "$testdir" "${testdir##*/}" "$i"
    done
  done | xargs -n1 -P${proc:-16} cp ./temp.txt
}

time main "${@}"

dd- maneira alternativa de obter o número exato de bytes (embora isso aconteça apenas uma vez, não fará muita diferença de qualquer maneira)
todos aqueles echoadicionados cerca de 3 segundos do meu lado com uma contagem de 1000
multithread, ajustável em tempo de execução (via procvariável) - brinque para encontrar o valor ideal para o seu sistema

por exemplo

proc=32 bash ./foo.sh {1..1000}

NB - supondo que sua pergunta original sobre o preenchimento da variável fosse uma instância de um problema XY ... se isso for um requisito difícil, minha resposta não é válida conforme escrita.

Essa alteração deve fazê-lo:

data="$(< /dev/urandom tr -dc "\t\n [:alnum:]" | dd iflag=fullblock bs=32K count=1)"
dd iflag=fullblock bs=32K count=1 of=./temp.txt <<<"${data}"

A segunda ddé ter certeza de que obtemos apenas os dados gerados, sem eles, em algum lugar entre $( )e <<<parece que encontramos um byte extra de algum lugar (nova linha implícita?). Feliz em receber correções sobre isso. Parece um pouco complicado, admito, se o tamanho dos dados aleatórios for arbitrário ou sem importância, você pode simplificar isso, tenho certeza

Maneira mais rápida de escrever variável bash em um arquivo

tempo generateUserData.sh TESTE{0..1000}

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Maneira mais rápida de escrever variável bash em um arquivo

tempo generateUserData.sh TESTE{0..1000}

2 respostas

relate perguntas