resultados inesperados de `service | grep`

Question

Zac Helmberger

Asked: 2025-01-16 10:55:24 +0800 CST2025-01-16 10:55:24 +0800 CST 2025-01-16 10:55:24 +0800 CST

Pesquisando entradas exclusivas em um arquivo

772

Estou usando Arch Linux/Debian Linux e quero uma lista de "identificadores" únicos em um arquivo ASCII txt. Aqui está um trecho dos dados que quero reduzir:

... (Received from VRW): wind ...
... (Received from 1a00): air_ ...
... (Received from 5710): air_ ...
... (Received from ####): air_ ...
... (Received from 15d8): air_ ...
... (Received from ####): air_ ...
... (Received from 6e9e): baro ...
... (Received from 6e9e): volt ...
... (Received from 6e9e): wind ...
... (Received from 6e9e): air_ ...

Devido ao grande tamanho do arquivo e aos inúmeros "identificadores" duplicados, quero gerar apenas identificadores exclusivos para que a saída fique assim:

... (Received from VRW): wind ...
... (Received from 1a00): air_ ...
... (Received from 5710): air_ ...
... (Received from ####): air_ ...
... (Received from 15d8): air_ ...
... (Received from 6e9e): baro ...

Melhor ainda seria simplesmente a lista de identificadores exclusivos, como 15d8, 6e9e, VRW, etc. Mas suspeito que isso seria muito mais difícil de fazer.

Das sugestões de perguntas semelhantes anteriores que tentei:

grep "(Received from" datafile.txt

e obtive uma lista enorme de identificadores, a maioria dos quais são repetições.

Eu também tentei:

grep "(Received from" datafile.txt | sort -u

mas não consegui dizer se fez alguma diferença

Eu também tentei:

parallel --tag --lb grep "Received from" {} | perl -ne '$seen{$_}++ or print;' ::: Data1.txt

o que provavelmente demonstra meu nível de ignorância nesses assuntos.

3 respostas

Voted

Gilles Quénot · Answer 1 · 2025-01-17T19:30:18+08:00

Best Answer

Gilles Quénot

2025-01-17T19:30:18+08:002025-01-17T19:30:18+08:00

Com awk(adaptar $4para a coluna correta):

awk -F' |)' '!seen[$4]++ {print $4}' file

ou com a extensão match()da implementação GNU de awke um regex :

gawk '{match($0, /Received from ([^\)]+)/, a)} !seen[a[1]]++ {print a[1]}' file

Com implementações de grepcom suporte para -oe expressões regulares perl como GNU grepquando construído com suporte PCRE(2) e sort:

grep -oP 'Received from \K[^)]+' file | sort -u

Aquele, ao contrário dos outros, extrairia todos os fósforos da linha.

1

Stéphane Chazelas · Answer 2 · 2025-01-17T14:44:13+08:00

Stéphane Chazelas

2025-01-17T14:44:13+08:002025-01-17T14:44:13+08:00

Em Perl, isso poderia ser feito com:

perl -ne 'print if /\(Received from (.*?)\)/ && ! $seen{$1}++' datafile.txt

Onde imprimimos linhas se elas correspondem à expressão regular e o que foi correspondido pelo primeiro par de ()within ainda não foi visto.

0

Kamil Maciorowski · Answer 3 · 2025-01-17T14:46:23+08:00

Kamil Maciorowski

2025-01-17T14:46:23+08:002025-01-17T14:46:23+08:00

Melhor ainda seria simplesmente a lista de identificadores exclusivos, como 15d8, 6e9e, VRW, etc. Mas suspeito que isso seria muito mais difícil de fazer.

Pelo contrário, eu acho. Você extrai apenas identificadores e então é muito fácil criar tal lista: sort -u. Processar linhas inteiras e decidir se a linha atual deve ser omitida, dependendo de seu fragmento, parece um pouco mais difícil. Aqui, extraímos identificadores com sedsubstituindo linhas inteiras apenas por elas:

<datafile.txt sed -n 's/.*(Received from \([^)]*\)): .*/\1/p' | sort -u

Notas:

Se houver dois ou mais (Received from …): em uma linha, somente o identificador do primeiro será extraído.
Identificadores contendo )não são suportados.

0

Pesquisando entradas exclusivas em um arquivo

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Pesquisando entradas exclusivas em um arquivo

3 respostas

relate perguntas