Grep para um conjunto de linhas de $START a $END AND que contém uma correspondência em $MIDDLE

Question

Sistemas Libsur

Asked: 2024-04-13 01:58:41 +0800 CST2024-04-13 01:58:41 +0800 CST 2024-04-13 01:58:41 +0800 CST

Exibir ocorrências e contar linhas entre elas e depois da última

772

Eu tenho este arquivo:

table_01 (id, field01, field02, field03, field04)
record_01
record_02
record_03
table_02 (id, field01, field02, field03)
record_01
table_03 (id, field01, field02, field03, field04)
record_01
record_02
table_04 (id, field01, field02, field03, field04, field04)
record_01
table_05 (id, field01, field02, field03, field04)
record_01
record_02
record_03
record_04

Quero ter um script para exibir as linhas com a ocorrência da palavra “ table” e exibir o número de linhas entre elas e as linhas após a última ocorrência.

Então a saída seria:

table_01 (id, field01, field02, field03, field04)
3
table_02 (id, field01, field02, field03)
1
table_03 (id, field01, field02, field03, field04)
2
table_04 (id, field01, field02, field03, field04, field04)
1
table_05 (id, field01, field02, field03, field04)
4

Até agora eu tenho este script:

awk '$0 ~ /table/ {if (n) print NR-1-n; n=NR}' file

Sua saída é:

Mas este script não exibe as linhas com a ocorrência de “ table” e não exibe as linhas após a última ocorrência. Como posso modificá-lo para exibir o que está faltando?

4 respostas

Voted

G-Man Says 'Reinstate Monica' · Answer 1 · 2024-04-13T02:18:41+08:00

Best Answer

G-Man Says 'Reinstate Monica'

2024-04-13T02:18:41+08:002024-04-13T02:18:41+08:00

Claramente, você já percorreu 90% do caminho:

awk '/tabela/ {se (n) imprimir NR-1-n; n=NR; imprimir}
     FIM {if (n) imprimir NR-1-n}'              arquivo

Você não precisa $0 ~; isso está implícito.

5

kos · Answer 2 · 2024-04-13T02:44:08+08:00

kos

2024-04-13T02:44:08+08:002024-04-13T02:44:08+08:00

Eu montei uma solução Perl:.

perl -Mfeature=say -e '
    while (<>) {
        if (/^table/) {
            $c && say $c;
            print;
            $c = 0;
            next;
        }
        $c++;
    }
    say $c;
' <input

user@server ~/[REDACTED] (git)-[REDACTED] % perl -Mfeature=say -e '
    while (<>) {
        if (/^table/) {
            $c && say $c;
            print;
            $c = 0;
            next;
        }
        $c++;
    }
    say $c;
' <input
table_01 (id, field01, field02, field03, field04)
3
table_02 (id, field01, field02, field03)
1
table_03 (id, field01, field02, field03, field04)
2
table_04 (id, field01, field02, field03, field04, field04)
1
table_05 (id, field01, field02, field03, field04)
4

4

Aeronautix · Answer 3 · 2024-04-13T09:04:22+08:00

Minha resposta assume um cenário em que pode haver tabelas vazias (linhas de "tabela vazia"/linhas correspondentes) e um cenário generalizado em que pode haver linhas extras (não-tabela/não-correspondentes) anexadas ao arquivo de entrada.

Neste cenário, para exibir as linhas da tabela (linhas correspondentes) e contar as ocorrências das linhas de registro seguintes (linhas não correspondentes), use awk, se o padrão desejado for ^table:

awk '
  /^$/ {next}
  /^table/ {
    if (precedingmatch)
      {print 0}
    else if (n)
      {print n}
    
    print; n=0; precedingmatch=1; matchesfound=1
  }
  !/^table/ {
    if (matchesfound) {n++}
    
    precedingmatch=0
  }
  END {if (matchesfound) {print n} else {print 0} }
' file.txt

precedingmatché usado para imprimir 0quando duas linhas subsequentes são linhas da tabela.
matchesfoundé usado para ignorar a impressão da contagem de linhas que não são de tabela encontradas antes de qualquer primeira linha da tabela.

Amostra file.txtcom algumas "tabelas vazias", uma nova linha e algumas linhas anexadas aleatoriamente:

randomline_01
randomline_02
table_01 (id, field01, field02, field03, field04)
table_02 (id, field01, field02, field03)
record_01
record_02

table_03 (id, field01, field02, field03, field04)
record_01
record_02
record_03
table_04 (id, field01, field02, field03, field04, field05)
table_05 (id, field01, field02, field03, field04)

Saída:

table_01 (id, field01, field02, field03, field04)
0
table_02 (id, field01, field02, field03)
2
table_03 (id, field01, field02, field03, field04)
3
table_04 (id, field01, field02, field03, field04, field05)
0
table_05 (id, field01, field02, field03, field04)
0

Um arquivo sem linhas de "tabela", um arquivo vazio ou um arquivo preenchido com novas linhas gera 0.

jubilatious1 · Answer 4 · 2024-04-15T13:31:28+08:00

Usando Raku (anteriormente conhecido como Perl_6)

~$ raku -ne 'BEGIN my $c = 0;  if /^table/ { $c && put $c; .put; $c = 0; next}; $c++;'  file

Raku é uma linguagem de programação da família Perl que oferece suporte de alto nível para Unicode. Esta solução Raku segue o esboço geral (em Perl) postado por @kos e @terdon.

Exemplo de entrada (linhas extras tableno final, embora o OP diga que elas não serão encontradas):

table_01 (id, field01, field02, field03, field04)
record_01
record_02
record_03
table_02 (id, field01, field02, field03)
record_01
table_03 (id, field01, field02, field03, field04)
record_01
record_02
table_04 (id, field01, field02, field03, field04, field04)
record_01
table_05 (id, field01, field02, field03, field04)
record_01
record_02
record_03
record_04
table_06 (id, field01, field02, field03, field04)
table_07 (id, field01, field02, field03, field04)

Saída de amostra:

table_01 (id, field01, field02, field03, field04)
3
table_02 (id, field01, field02, field03)
1
table_03 (id, field01, field02, field03, field04)
2
table_04 (id, field01, field02, field03, field04, field04)
1
table_05 (id, field01, field02, field03, field04)
4
table_06 (id, field01, field02, field03, field04)
table_07 (id, field01, field02, field03, field04)

Acima dá a mesma resposta que as respostas Perl de @kos e @terdon. Para ser mais explícito, a primeira instrução dentro do bloco pode ser escrita $c.Bool && put $c;ou mesmo $c.so && put $c;, mas o código acima é suficiente.

INSERIR ZERO SE NÃO HÁ REGISTROS "NÃO TABELA" INTERVENIENTES:

Aqui está o código para retornar 0quando nenhuma recordlinha seguir o tablecabeçalho (semelhante à resposta de @Aeronautix):

~$ raku -ne 'BEGIN my $c = 0;  if /^table/ { $c && put($c-1); .put; $c = 0}; $c++; END put($c-1);'  file
table_01 (id, field01, field02, field03, field04)
3
table_02 (id, field01, field02, field03)
1
table_03 (id, field01, field02, field03, field04)
2
table_04 (id, field01, field02, field03, field04, field04)
1
table_05 (id, field01, field02, field03, field04)
4
table_06 (id, field01, field02, field03, field04)
0
table_07 (id, field01, field02, field03, field04)
0

Nota: para todas as respostas acima, o código assume que a primeira linha começa com tablee o OP confirma que nenhuma linha perdida ocorrerá antes da primeira tablelinha.

No entanto (para outros usuários/fontes de dados), se uma recordlinha perdida for encontrada no topo do arquivo, a primeira resposta retornará o número de linhas antes da primeira linha da tabela. A segunda resposta retornará "um menos" o número de linhas antes da primeira linha da tabela.

https://raku.org

Exibir ocorrências e contar linhas entre elas e depois da última

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Exibir ocorrências e contar linhas entre elas e depois da última

4 respostas

relate perguntas