Linux grep o que no arquivo 1 está no arquivo 2 [duplicado]

Question

user68650

Asked: 2022-05-21 09:17:33 +0800 CST2022-05-21 09:17:33 +0800 CST 2022-05-21 09:17:33 +0800 CST

Sed script para AWK

772

Eu não faço isso com frequência, e quando eu faço é sempre sensível ao tempo. Eu tenho o script sed abaixo que extrai um padrão numérico de mais de um milhão de arquivos. Eu preciso lançar isso para o AWK, então quando o padrão correspondente é encontrado, ele imprime o nome do arquivo onde foi encontrado. O número da linha seria ótimo, mas não seria ganancioso.

saída desejada

Nome do arquivo1 000-323423-33

Nome do arquivo2 000-323423-33

Nome do arquivo3 000-323423-33

Já tentei vários métodos mas nada funcionou, alguém com mais experiência pode dar uma orientação adequada? Agradeço antecipadamente!

#!/bin/sh

#shopt -s nullglob
FILES=/mnt/c/temp/1/*.txt
for f in $FILES

do
    echo "Processing $f"
    sed -nr \
        -e '/[0-9]{3}-[0-9]{6}-[0-9]{2}/{
            s/.*([0-9]{3}\-[0-9]{6}\-[0-9]{2}).*/\1/
            G
            p 
            }' $f 
done

2 respostas

Voted

thanasisp · Answer 1 · 2022-05-21T09:32:15+08:00

Best Answer

thanasisp

2022-05-21T09:32:15+08:002022-05-21T09:32:15+08:00

Parece que sua tarefa é o que grepestá fazendo. Se você realmente não quiser os dois pontos, substitua-os por espaço usando tr, supondo que os dois pontos não existam nos nomes dos arquivos.

grep -Eon '[0-9]{3}-[0-9]{6}-[0-9]{2}' *.txt | tr ':' ' '

A saída será como:

file1 10 000-323423-33
file2 20 000-323423-34
file3 30 000-323423-35
file3 31 000-323423-36

2

glenn jackman · Answer 2 · 2022-05-21T10:17:18+08:00

glenn jackman

2022-05-21T10:17:18+08:002022-05-21T10:17:18+08:00

@thanasisp tem razão, grepé ideal para este trabalho.

Com awk, você pode escrever

awk -v OFS=, '
  match($0, /[0-9]{3}-[0-9]{6}-[0-9]{2}/) {
    print FILENAME, FNR, substr($0, RSTART, RLENGTH)
  }
' /mnt/c/temp/1/*.txt

ref: https://www.gnu.org/software/gawk/manual/html_node/String-Functions.html

Com tantos arquivos, você pode receber um erro de "lista de argumentos muito longa". É quando você precisafind

find /mnt/c/temp/1/ -type f -name '*.txt' -exec awk -v OFS=, '
  match($0, /[0-9]{3}-[0-9]{6}-[0-9]{2}/) {
    print FILENAME, FNR, substr($0, RSTART, RLENGTH)
  }
' '{}' +

1

Sed script para AWK

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Sed script para AWK

2 respostas

relate perguntas