Necessidade de algumas chamadas de sistema

Question

BDN

Asked: 2018-05-26 08:02:05 +0800 CST2018-05-26 08:02:05 +0800 CST 2018-05-26 08:02:05 +0800 CST

análise de texto da coluna

772

2018-05-24 23:57:30 1.1.1.1 8.8.4.4
2018-05-24 23:57:32 2.2.2.2 8.8.4.4
2018-05-24 23:58:12 8.8.8.8 8.8.4.4
2018-05-24 23:58:23 8.8.8.8 8.8.4.4
2018-05-24 23:59:40 8.8.8.8 8.8.4.4
2018-05-24 23:59:51 8.8.8.8 8.8.4.4

Como eu tenho o arquivo de log no formato acima. Agora preciso analisá-lo e a saída deve ser semelhante a abaixo (mostrando apenas a primeira e a última linha comparando a terceira e a quarta coluna se os dados da linha forem repetidos.

2018-05-24 23:57:30 1.1.1.1 8.8.4.4
2018-05-24 23:57:32 2.2.2.2 8.8.4.4
2018-05-24 23:58:12 8.8.8.8 8.8.4.4
2018-05-24 23:59:51 8.8.8.8 8.8.4.4

6 respostas

Voted

choroba · Answer 1 · 2018-05-26T08:14:59+08:00

choroba

2018-05-26T08:14:59+08:002018-05-26T08:14:59+08:00

Perl para o resgate:

perl -ane '
    if ($F[2] ne $c3 || $F[3] ne $c4) {
        $printed or print $previous;
        $printed = print;
    } else {
        $printed = 0;
    }
    ($c3, $c4, $previous) = (@F[2, 3], $_);
    END { print $previous unless $printed }
' -- input.file

-nlê a entrada linha por linha e executa o código para cada linha.
-adivide cada linha de entrada em espaço em branco na matriz @F.
$c3 e $c4 são usados para manter os valores anteriores das colunas 3 e 4, os valores reais são armazenados em $F[2] e $F[3] (arrays são indexados a partir de 0).
$previous armazena a linha anterior caso precisemos imprimi-la.
$printed apenas impede a impressão da última linha duas vezes (o que aconteceria se suas colunas 3 e 4 fossem diferentes da linha anterior).

6

αғsнιη · Answer 2 · 2018-05-26T08:17:42+08:00

Best Answer

αғsнιη

2018-05-26T08:17:42+08:002018-05-26T08:17:42+08:00

Com awk:

awk '!first[$3, $4]{ first[$3, $4]= $0 } { last[$3, $4]= $0 }
    END{ for (x in last) print first[x] (last[x] != first[x]? ORS last[x]:"") }' infile
2018-05-24 23:58:12 8.8.8.8 8.8.4.4
2018-05-24 23:59:51 8.8.8.8 8.8.4.4
2018-05-24 23:57:30 1.1.1.1 8.8.4.4
2018-05-24 23:57:32 2.2.2.2 8.8.4.4

a firstmatriz associada mantém a primeira linha ocorrida com a combinação de chaves da coluna nº 3 e coluna nº 4, mas a lastmatriz mantém a última linha com as mesmas chaves todas as vezes.

Depois que todas as linhas foram lidas, os valores na firstmatriz são as linhas que ocorreram no início (com diferentes colunas nº 3, nº 4) e os valores em lastsão as linhas que ocorreram no último.

Em seguida, na ENDimpressão, os valores salvos em firstarray e a seguir em last. Isso (last[x] != first[x]? ORS last[x]:"")é usado para evitar a duplicação da linha quando essa é a única linha única sem nenhuma combinação repetida das colunas 3 e 4.

4

cheft · Answer 3 · 2018-05-26T12:31:52+08:00

cheft

2018-05-26T12:31:52+08:002018-05-26T12:31:52+08:00

Você também pode pegar linhas únicas comparando apenas as colunas 3,4 e, em seguida, acrescentar a última linha neste caso. Mas isso pode resultar em uma duplicata da última linha se todas as outras linhas tiverem 3ª e 4ª colunas diferentes.

Em seguida, basta adicionar outro tubo ao uniq para remover, se necessário.

{uniq <your_file> -f2; tail -n1 <your_file>; } | cat | uniq

-f aqui pula os primeiros 2 campos delimitados por espaço.

0

Rakesh Sharma · Answer 4 · 2018-05-27T02:47:59+08:00

Rakesh Sharma

2018-05-27T02:47:59+08:002018-05-27T02:47:59+08:00

 perl -lane '
   *x = sub { print for splice @A; } if $. == 1;
   x() if $. > 1 and $F[2] ne $c3 || $F[3] ne $c4;
   ($c3, $c4, $A[!!@A]) = (@F[2,3], $_);
   x() if eof;
 '    include.txt

§ Como funciona.

    °  Array @A holds only 2 elements max at any time. The beginning and end lines for the range.

   °  subroutine &x displays the array @A and after displaying empties it as well.

  °  display the previous range provided we are not at the first line and either of the previous columns don't match with the current.

  °   update the previous columns and array.

0

MiniMax · Answer 5 · 2018-05-27T04:50:23+08:00

primeira variante

paste -d'\n' <(uniq -f2 input.txt) <(tac input.txt | uniq -f2 | tac) | uniq

segunda variante

awk '
$3$4 == prev {
    buf = $0 ORS
}
$3$4 != prev {
    print buf $0
    prev = $3$4
    buf = ""
}
END {
    printf("%s", buf)
}' input.txt

teste

Entrada (complicada para teste)

2018-05-24 23:57:30 1.1.1.1 8.8.4.4
2018-05-24 23:57:32 2.2.2.2 8.8.4.4
2018-05-24 23:58:12 8.8.8.8 8.8.4.4
2018-05-24 23:58:23 8.8.8.8 8.8.4.4
2018-05-24 23:59:40 8.8.8.8 8.8.4.4
2018-05-24 23:59:51 8.8.8.8 8.8.4.4
2018-05-25 00:18:12 8.8.1.8 8.8.4.4
2018-05-25 00:18:23 8.8.1.8 8.8.4.4
2018-05-25 00:19:40 8.8.1.8 8.8.4.4
2018-05-25 00:19:51 8.8.1.8 8.8.4.4
2018-05-25 00:39:51 8.8.2.8 8.8.4.4
2018-05-25 00:49:52 8.8.2.8 8.8.4.4
2018-05-25 00:59:51 8.8.2.8 8.8.4.4

Saída (ambas as variantes)

2018-05-24 23:57:30 1.1.1.1 8.8.4.4
2018-05-24 23:57:32 2.2.2.2 8.8.4.4
2018-05-24 23:58:12 8.8.8.8 8.8.4.4
2018-05-24 23:59:51 8.8.8.8 8.8.4.4
2018-05-25 00:18:12 8.8.1.8 8.8.4.4
2018-05-25 00:19:51 8.8.1.8 8.8.4.4
2018-05-25 00:39:51 8.8.2.8 8.8.4.4
2018-05-25 00:59:51 8.8.2.8 8.8.4.4

Rakesh Sharma · Answer 6 · 2018-05-27T19:21:22+08:00

 perl -lane '
   *x = sub { print for splice @A; } if $. == 1;
   x() if $. > 1 and $F[2] ne $c3 || $F[3] ne $c4;
   ($c3, $c4, $A[!!@A]) = (@F[2,3], $_);
   x() if eof;
 '    include.txt

§ Como funciona.

    °  Array @A holds only 2 elements max at any time. The beginning and end lines for the range.

   °  subroutine &x displays the array @A and after displaying empties it as well.

  °  display the previous range provided we are not at the first line and either of the previous columns don't match with the current.

  °   update the previous columns and array.

¶ É elaborado outro método que utiliza o editor sed.

 #! /bin/sh
  # declare regex assist variables
   b='[:space:]'
   s="[$b]"         # \s
   S="[^$b]"       # \S

   #      \S+                \s+
   F="$S$S*"   sp="$s$s*"
   F_s="$F$sp"      #  \S+\s+

   # composition of a line 
   L="$F_s$F_s\($F\)$sp\($F\)"

   #  matching next line
   M=".*$s\1$sp\2"

   #    2 lines when they match with 3,4 fields
   L2="$L\(\\n$M\)\{1\}"

   # 3 lines when they match in fields 3,4
   L3="$L\(\\n$M\)\{2\}"

  #### code 
  sed -e '
       #  bring on board next line for interrogation 
        N

         #   2 lines fields 3,4 donot match 
          #  display the first line... redo code with remaining 
         '"/^$L2\$/"'!{
                  P;D
           }

            #  3 lines with first two match but third not match in fields 3,4
           :a;h;N
           '"/^$L3\$/"'!{
                 x;p;g
                 s/.*\(\n\)/\1/;D
              }

              s/\n.*\(\n\)/\1/;ba
      '   include.txt

análise de texto da coluna

primeira variante

segunda variante

teste

Como exportar uma chave privada GPG e uma chave pública para um arquivo

ssh Não é possível negociar: "nenhuma cifra correspondente encontrada", está rejeitando o cbc

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

Como descarregar o módulo do kernel 'nvidia-drm'?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

análise de texto da coluna

6 respostas

primeira variante

segunda variante

teste

relate perguntas