AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 446032
Accepted
BDN
BDN
Asked: 2018-05-26 08:02:05 +0800 CST2018-05-26 08:02:05 +0800 CST 2018-05-26 08:02:05 +0800 CST

análise de texto da coluna

  • 772
2018-05-24 23:57:30 1.1.1.1 8.8.4.4
2018-05-24 23:57:32 2.2.2.2 8.8.4.4
2018-05-24 23:58:12 8.8.8.8 8.8.4.4
2018-05-24 23:58:23 8.8.8.8 8.8.4.4
2018-05-24 23:59:40 8.8.8.8 8.8.4.4
2018-05-24 23:59:51 8.8.8.8 8.8.4.4

Como eu tenho o arquivo de log no formato acima. Agora preciso analisá-lo e a saída deve ser semelhante a abaixo (mostrando apenas a primeira e a última linha comparando a terceira e a quarta coluna se os dados da linha forem repetidos.

2018-05-24 23:57:30 1.1.1.1 8.8.4.4
2018-05-24 23:57:32 2.2.2.2 8.8.4.4
2018-05-24 23:58:12 8.8.8.8 8.8.4.4
2018-05-24 23:59:51 8.8.8.8 8.8.4.4
linux awk
  • 6 6 respostas
  • 474 Views

6 respostas

  • Voted
  1. choroba
    2018-05-26T08:14:59+08:002018-05-26T08:14:59+08:00

    Perl para o resgate:

    perl -ane '
        if ($F[2] ne $c3 || $F[3] ne $c4) {
            $printed or print $previous;
            $printed = print;
        } else {
            $printed = 0;
        }
        ($c3, $c4, $previous) = (@F[2, 3], $_);
        END { print $previous unless $printed }
    ' -- input.file
    
    • -nlê a entrada linha por linha e executa o código para cada linha.
    • -adivide cada linha de entrada em espaço em branco na matriz @F.
    • $c3 e $c4 são usados ​​para manter os valores anteriores das colunas 3 e 4, os valores reais são armazenados em $F[2] e $F[3] (arrays são indexados a partir de 0).
    • $previous armazena a linha anterior caso precisemos imprimi-la.
    • $printed apenas impede a impressão da última linha duas vezes (o que aconteceria se suas colunas 3 e 4 fossem diferentes da linha anterior).
    • 6
  2. Best Answer
    αғsнιη
    2018-05-26T08:17:42+08:002018-05-26T08:17:42+08:00

    Com awk:

    awk '!first[$3, $4]{ first[$3, $4]= $0 } { last[$3, $4]= $0 }
        END{ for (x in last) print first[x] (last[x] != first[x]? ORS last[x]:"") }' infile
    2018-05-24 23:58:12 8.8.8.8 8.8.4.4
    2018-05-24 23:59:51 8.8.8.8 8.8.4.4
    2018-05-24 23:57:30 1.1.1.1 8.8.4.4
    2018-05-24 23:57:32 2.2.2.2 8.8.4.4
    

    a firstmatriz associada mantém a primeira linha ocorrida com a combinação de chaves da coluna nº 3 e coluna nº 4, mas a lastmatriz mantém a última linha com as mesmas chaves todas as vezes.

    Depois que todas as linhas foram lidas, os valores na firstmatriz são as linhas que ocorreram no início (com diferentes colunas nº 3, nº 4) e os valores em lastsão as linhas que ocorreram no último.

    Em seguida, na ENDimpressão, os valores salvos em firstarray e a seguir em last. Isso (last[x] != first[x]? ORS last[x]:"")é usado para evitar a duplicação da linha quando essa é a única linha única sem nenhuma combinação repetida das colunas 3 e 4.

    • 4
  3. cheft
    2018-05-26T12:31:52+08:002018-05-26T12:31:52+08:00

    Você também pode pegar linhas únicas comparando apenas as colunas 3,4 e, em seguida, acrescentar a última linha neste caso. Mas isso pode resultar em uma duplicata da última linha se todas as outras linhas tiverem 3ª e 4ª colunas diferentes.

    Em seguida, basta adicionar outro tubo ao uniq para remover, se necessário.

    {uniq <your_file> -f2; tail -n1 <your_file>; } | cat | uniq

    -f aqui pula os primeiros 2 campos delimitados por espaço.

    • 0
  4. Rakesh Sharma
    2018-05-27T02:47:59+08:002018-05-27T02:47:59+08:00
     perl -lane '
       *x = sub { print for splice @A; } if $. == 1;
       x() if $. > 1 and $F[2] ne $c3 || $F[3] ne $c4;
       ($c3, $c4, $A[!!@A]) = (@F[2,3], $_);
       x() if eof;
     '    include.txt
    

    § Como funciona.

        °  Array @A holds only 2 elements max at any time. The beginning and end lines for the range.
    
       °  subroutine &x displays the array @A and after displaying empties it as well.
    
      °  display the previous range provided we are not at the first line and either of the previous columns don't match with the current.
    
      °   update the previous columns and array. 
    
    • 0
  5. MiniMax
    2018-05-27T04:50:23+08:002018-05-27T04:50:23+08:00

    primeira variante

    paste -d'\n' <(uniq -f2 input.txt) <(tac input.txt | uniq -f2 | tac) | uniq
    

    segunda variante

    awk '
    $3$4 == prev {
        buf = $0 ORS
    }
    $3$4 != prev {
        print buf $0
        prev = $3$4
        buf = ""
    }
    END {
        printf("%s", buf)
    }' input.txt
    

    teste

    Entrada (complicada para teste)

    2018-05-24 23:57:30 1.1.1.1 8.8.4.4
    2018-05-24 23:57:32 2.2.2.2 8.8.4.4
    2018-05-24 23:58:12 8.8.8.8 8.8.4.4
    2018-05-24 23:58:23 8.8.8.8 8.8.4.4
    2018-05-24 23:59:40 8.8.8.8 8.8.4.4
    2018-05-24 23:59:51 8.8.8.8 8.8.4.4
    2018-05-25 00:18:12 8.8.1.8 8.8.4.4
    2018-05-25 00:18:23 8.8.1.8 8.8.4.4
    2018-05-25 00:19:40 8.8.1.8 8.8.4.4
    2018-05-25 00:19:51 8.8.1.8 8.8.4.4
    2018-05-25 00:39:51 8.8.2.8 8.8.4.4
    2018-05-25 00:49:52 8.8.2.8 8.8.4.4
    2018-05-25 00:59:51 8.8.2.8 8.8.4.4
    

    Saída (ambas as variantes)

    2018-05-24 23:57:30 1.1.1.1 8.8.4.4
    2018-05-24 23:57:32 2.2.2.2 8.8.4.4
    2018-05-24 23:58:12 8.8.8.8 8.8.4.4
    2018-05-24 23:59:51 8.8.8.8 8.8.4.4
    2018-05-25 00:18:12 8.8.1.8 8.8.4.4
    2018-05-25 00:19:51 8.8.1.8 8.8.4.4
    2018-05-25 00:39:51 8.8.2.8 8.8.4.4
    2018-05-25 00:59:51 8.8.2.8 8.8.4.4
    
    • 0
  6. Rakesh Sharma
    2018-05-27T19:21:22+08:002018-05-27T19:21:22+08:00
     perl -lane '
       *x = sub { print for splice @A; } if $. == 1;
       x() if $. > 1 and $F[2] ne $c3 || $F[3] ne $c4;
       ($c3, $c4, $A[!!@A]) = (@F[2,3], $_);
       x() if eof;
     '    include.txt
    

    § Como funciona.

        °  Array @A holds only 2 elements max at any time. The beginning and end lines for the range.
    
       °  subroutine &x displays the array @A and after displaying empties it as well.
    
      °  display the previous range provided we are not at the first line and either of the previous columns don't match with the current.
    
      °   update the previous columns and array.
    

    ¶ É elaborado outro método que utiliza o editor sed.

     #! /bin/sh
      # declare regex assist variables
       b='[:space:]'
       s="[$b]"         # \s
       S="[^$b]"       # \S
    
       #      \S+                \s+
       F="$S$S*"   sp="$s$s*"
       F_s="$F$sp"      #  \S+\s+
    
       # composition of a line 
       L="$F_s$F_s\($F\)$sp\($F\)"
    
       #  matching next line
       M=".*$s\1$sp\2"
    
       #    2 lines when they match with 3,4 fields
       L2="$L\(\\n$M\)\{1\}"
    
       # 3 lines when they match in fields 3,4
       L3="$L\(\\n$M\)\{2\}"
    
      #### code 
      sed -e '
           #  bring on board next line for interrogation 
            N
    
             #   2 lines fields 3,4 donot match 
              #  display the first line... redo code with remaining 
             '"/^$L2\$/"'!{
                      P;D
               }
    
                #  3 lines with first two match but third not match in fields 3,4
               :a;h;N
               '"/^$L3\$/"'!{
                     x;p;g
                     s/.*\(\n\)/\1/;D
                  }
    
                  s/\n.*\(\n\)/\1/;ba
          '   include.txt 
    
    • 0

relate perguntas

  • Necessidade de algumas chamadas de sistema

  • Reorganize as letras e compare duas palavras

  • Embaralhamento de arquivo de várias linhas

  • astyle não altera a formatação do arquivo de origem

  • Passe o sistema de arquivos raiz por rótulo para o kernel do Linux

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    ssh Não é possível negociar: "nenhuma cifra correspondente encontrada", está rejeitando o cbc

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    Como descarregar o módulo do kernel 'nvidia-drm'?

    • 13 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Wong Jia Hau ssh-add retorna com: "Erro ao conectar ao agente: nenhum arquivo ou diretório" 2018-08-24 23:28:13 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Bagas Sanjaya Por que o Linux usa LF como caractere de nova linha? 2017-12-20 05:48:21 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve