exportar variáveis env programaticamente, via stdout do comando [duplicado]

Question

anton_rh

Asked: 2017-12-08 04:28:08 +0800 CST2017-12-08 04:28:08 +0800 CST 2017-12-08 04:28:08 +0800 CST

cabeça come personagens extras

772

Esperava-se que o seguinte comando shell imprimisse apenas linhas ímpares do fluxo de entrada:

echo -e "aaa\nbbb\nccc\nddd\n" | (while true; do head -n 1; head -n 1 >/dev/null; done)

Mas, em vez disso, apenas imprime a primeira linha: aaa.

O mesmo não acontece quando é usado com a opção -c( --bytes):

echo 12345678901234567890 | (while true; do head -c 5; head -c 5 >/dev/null; done)

Esse comando é gerado 1234512345conforme o esperado. Mas isso funciona apenas na implementação coreutilshead do utilitário. A implementação do busybox ainda consome caracteres extras, então a saída é apenas 12345.

Acho que essa forma específica de implementação é feita para fins de otimização. Você não pode saber onde a linha termina, então não sabe quantos caracteres precisa ler. A única maneira de não consumir caracteres extras do fluxo de entrada é ler o fluxo byte por byte. Mas a leitura do fluxo um byte por vez pode ser lenta. Então, acho que headlê o fluxo de entrada em um buffer grande o suficiente e, em seguida, conta as linhas nesse buffer.

O mesmo não pode ser dito para o caso em que a --bytesopção é usada. Neste caso, você sabe quantos bytes precisa ler. Portanto, você pode ler exatamente esse número de bytes e não mais do que isso. A implementação corelibs usa essa oportunidade, mas a busybox não, ela ainda lê mais bytes do que o necessário em um buffer. Provavelmente é feito para simplificar a implementação.

Então a pergunta. É correto que o headutilitário consuma mais caracteres do fluxo de entrada do que o solicitado? Existe algum tipo de padrão para utilitários Unix? E se houver, ele especifica esse comportamento?

PS

Você tem que pressionar Ctrl+Cpara parar os comandos acima. Os utilitários Unix não falham na leitura além de EOF. Se você não quiser pressionar, pode usar um comando mais complexo:

echo 12345678901234567890 | (while true; do head -c 5; head -c 5 | [ `wc -c` -eq 0 ] && break >/dev/null; done)

que eu não usei para simplificar.

3 respostas

Voted

Stephen Kitt · Answer 1 · 2017-12-08T04:53:15+08:00

É correto que o utilitário principal consuma mais caracteres do fluxo de entrada do que o solicitado?

Sim, é permitido (veja abaixo).

Existe algum tipo de padrão para utilitários Unix?

Sim, POSIX volume 3, Shell & Utilities .

E se houver, ele especifica esse comportamento?

Ele faz, em sua introdução:

Quando um utilitário padrão lê um arquivo de entrada pesquisável e termina sem erro antes de atingir o fim do arquivo, o utilitário deve garantir que o deslocamento do arquivo na descrição do arquivo aberto seja posicionado corretamente logo após o último byte processado pelo utilitário. Para arquivos que não são pesquisáveis, o estado do deslocamento do arquivo na descrição do arquivo aberto para esse arquivo não é especificado.

headé um dos utilitários padrão , portanto, uma implementação em conformidade com POSIX deve implementar o comportamento descrito acima.

O GNU tenta deixar head o descritor de arquivo na posição correta, mas é impossível buscar em pipes, portanto, em seu teste, ele falha em restaurar a posição. Você pode ver isso usando strace:

$ echo -e "aaa\nbbb\nccc\nddd\n" | strace head -n 1
...
read(0, "aaa\nbbb\nccc\nddd\n\n", 8192) = 17
lseek(0, -13, SEEK_CUR)                 = -1 ESPIPE (Illegal seek)
...

O readretorna 17 bytes (todas as entradas disponíveis), headprocessa quatro deles e tenta retroceder 13 bytes, mas não consegue. (Você também pode ver aqui que o GNU headusa um buffer de 8 KiB.)

Quando você diz headpara contar bytes (o que não é padrão), ele sabe quantos bytes ler, então pode (se implementado dessa forma) limitar sua leitura de acordo. É por isso que seu head -c 5teste funciona: o GNU headlê apenas cinco bytes e, portanto, não precisa procurar restaurar a posição do descritor de arquivo.

Se você gravar o documento em um arquivo e usá-lo, obterá o comportamento desejado:

$ echo -e "aaa\nbbb\nccc\nddd\n" > file
$ < file (while true; do head -n 1; head -n 1 >/dev/null; done)
aaa
ccc

ilkkachu · Answer 2 · 2017-12-08T04:49:23+08:00

de POSIX

O utilitário principal deve copiar seus arquivos de entrada para a saída padrão, finalizando a saída de cada arquivo em um ponto designado.

Não diz nada sobre quanto head deve ler da entrada. Exigir que ele leia byte por byte seria bobagem, pois seria extremamente lento na maioria dos casos.

Isso é, no entanto, abordado no readbuiltin/utility: todos os shells que posso encontrar readde pipes um byte por vez e o texto padrão pode ser interpretado como significando que isso deve ser feito, para poder ler apenas uma única linha:

O utilitário de leitura deve ler uma única linha lógica da entrada padrão em uma ou mais variáveis de shell.

No caso de read, que é usado em scripts de shell, um caso de uso comum seria algo assim:

read someline
if something ; then 
    someprogram ...
fi

Aqui, a entrada padrão de someprogramé a mesma do shell, mas pode-se esperar que someprogramleia tudo o que vem após a primeira linha de entrada consumida pelo reade não o que sobrou após uma leitura em buffer de read. Por outro lado, usar headcomo no seu exemplo é muito mais incomum.

Se você realmente deseja excluir todas as outras linhas, seria melhor (e mais rápido) usar alguma ferramenta que possa lidar com toda a entrada de uma só vez, por exemplo

$ seq 1 10 | sed -ne '1~2p'   # GNU sed
$ seq 1 10 | sed -e 'n;d'     # works in GNU sed and the BSD sed on macOS

$ seq 1 10 | awk 'NR % 2' 
$ seq 1 10 | perl -ne 'print if $. % 2'

ijbalazs · Answer 3 · 2017-12-09T08:14:18+08:00

ijbalazs

2017-12-09T08:14:18+08:002017-12-09T08:14:18+08:00

awk '{if (NR%2) == 1) print;}'

1

cabeça come personagens extras

Matriz JSON para bash variáveis usando jq

A data pode formatar a hora atual para o fuso horário GMT? [duplicado]

bash + lê variáveis e valores do arquivo pelo script bash

Como posso copiar um diretório e renomeá-lo no mesmo comando?

conexão ssh. Conexão X11 rejeitada devido a autenticação incorreta

Como baixar o pacote não instalá-lo com o comando apt-get?

comando systemctl não funciona no RHEL 6

rsync porta 22 e 873 uso

snap /dev/loop em 100% de utilização -- sem espaço livre

chave de impressão jq e valor para todos no subobjeto

cabeça come personagens extras

3 respostas

relate perguntas