Grep para um conjunto de linhas de $START a $END AND que contém uma correspondência em $MIDDLE

Question

WashichawbachaW

Asked: 2018-02-14 22:28:53 +0800 CST2018-02-14 22:28:53 +0800 CST 2018-02-14 22:28:53 +0800 CST

Como imprimir apenas 1 nome de arquivo junto com o padrão correspondente?

772

Desejo imprimir o(s) nome(s) do arquivo junto com o padrão correspondente, mas apenas uma vez, mesmo que a correspondência do padrão tenha várias ocorrências no arquivo.

Por exemplo, tenho uma lista de padrões; list_of_patterns.txte o diretório que preciso para encontrar os arquivos é /path/to/files/*.

list_of_patterns.txt :

A
B
C
D
E

/caminho/para/arquivos/

/file1
/file2
/file3

Digamos que /file1tenha o padrão Avárias vezes assim:

/arquivo1 :

(Também vale para outros arquivos onde há várias correspondências de padrão.)

Eu tenho este comando grep em execução, mas ele imprime o nome do arquivo toda vez que um padrão corresponde.

grep -Hof list_of_patterns.txt /path/to/files/*

resultado:

/file1:A
/file1:A
/file1:A
/file2:B
/file2:B
/file3:C
/file3:B
... and so on.

Eu sei que o sort pode fazer isso quando você o canaliza após o comando grep grep -Hof list_of_patterns.txt /path/to/files/* | sort -u, mas ele só é executado quando o grep é concluído. No mundo real, my list_of_patterns.txttem centenas de padrões dentro. Às vezes, leva uma hora para terminar a tarefa.

Existe uma maneira melhor de acelerar o processo?

ATUALIZAÇÃO: alguns arquivos têm mais de cem ocorrências de padrão correspondente. Ex /file4. tem ocorrências do padrão A900 vezes. É por isso que está demorando grepuma hora para terminar porque imprime todas as ocorrências da correspondência de padrão junto com o nome do arquivo.

Por exemplo, saída:

/file4:A
/file4:A
/file4:A
/file4:A
/file4:A
/file4:A
/file4:A
/file4:A
... and so on til' it reach 900 occurrences.

Eu só quero que imprima apenas uma vez.

Ex.: Saída desejada:

/file4:A
/file1:A
/file2:B
/file3:A
/file4:B

1 respostas

Voted

RomanPerekhrest · Answer 1 · 2018-02-14T23:21:59+08:00

Best Answer

RomanPerekhrest

2018-02-14T23:21:59+08:002018-02-14T23:21:59+08:00

Existe uma maneira melhor de acelerar o processo?

Sim, chama-se GNU parallel:

parallel -j0 -k "grep -Hof list_of_patterns.txt {} | sort -u" ::: /path/to/files/*

j N- número de postos de trabalho. Executar Ntrabalhos em paralelo. 0significa o maior número possível.
k( --keep-order) - mantém a sequência de saída igual à ordem de entrada
::: arguments- use argumentsa partir da linha de comando como fonte de entrada em vez de stdin (entrada padrão)

3

Como imprimir apenas 1 nome de arquivo junto com o padrão correspondente?

Como exportar uma chave privada GPG e uma chave pública para um arquivo

ssh Não é possível negociar: "nenhuma cifra correspondente encontrada", está rejeitando o cbc

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

Como descarregar o módulo do kernel 'nvidia-drm'?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Como imprimir apenas 1 nome de arquivo junto com o padrão correspondente?

1 respostas

relate perguntas