AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / ubuntu / Perguntas / 1137740
Accepted
deepblue_86
deepblue_86
Asked: 2019-04-25 06:36:39 +0800 CST2019-04-25 06:36:39 +0800 CST 2019-04-25 06:36:39 +0800 CST

removendo as últimas linhas repetidas nos arquivos de texto

  • 772

Eu tenho um arquivo de texto da seguinte maneira;

ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.5 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.6 4212835.9 -2545104.6
CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9
CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9
CPVG00CPV_R_20183460000.gz 5626883.3 -2380932.2 1824483.1

Neste arquivo, repita seis e três vezes, respectivamente ALIC00AUS_R_20183350000.gz. CPVG00CPV_R_20183460000.gzPreciso remover as últimas linhas repetidas de cada string da coluna 1 e a saída deve ser a seguinte;

ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
ALIC00AUS_R_20183350000.gz -4052052.5 4212836.0 -2545104.6
CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9
CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9
text-processing
  • 3 3 respostas
  • 68 Views

3 respostas

  • Voted
  1. Best Answer
    steeldriver
    2019-04-25T07:11:42+08:002019-04-25T07:11:42+08:00

    Se você tiver certeza de que cada $1(primeira coluna) foi duplicada pelo menos uma vez, poderá:

    1. inverter a ordem das linhas
    2. selecione apenas as linhas que $1 já foram vistas antes
    3. inverter o resultado

    Ex.

    $ tac file | awk 'seen[$1]++' | tac
    ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
    ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
    ALIC00AUS_R_20183350000.gz -4052052.7 4212836.0 -2545104.6
    ALIC00AUS_R_20183350000.gz -4052052.7 4212835.9 -2545104.6
    ALIC00AUS_R_20183350000.gz -4052052.5 4212836.0 -2545104.6
    CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9
    CPVG00CPV_R_20183460000.gz 5626883.4 -2380932.3 1824483.9
    
    • 2
  2. RaidPinata
    2019-04-25T07:29:44+08:002019-04-25T07:29:44+08:00

    Se você puder atender à garantia na resposta fornecida por @steeldriver, essa é a melhor solução, caso contrário, use este script.

    ##!/usr/bin/awk -f
    {
      if (!seen[$1]++) {
        line = $0
        prev = $1
      }
      else {
        if (prev == $1) print line
        line = $0
      }
    }
    END { if (prev != $1) print line }
    
    • 2
  3. RaidPinata
    2019-04-25T06:43:57+08:002019-04-25T06:43:57+08:00

    Awk é um programa para fazer esse tipo de substituição.

    Para remover linhas que tenham uma duplicata na primeira coluna, isso deve ser feito.

    awk '!seen[$1]++' filename > outputfile

    Se você precisar remover a duplicação completa de linhas, use isso.

    awk '!seen[$0]++' filename > outputfile

    Como visto nesta resposta: https://unix.stackexchange.com/questions/171091/remove-lines-based-on-duplicates-within-one-column-without-sort

    Aqui está uma breve explicação. awk é usado para escaneamento de padrão e processamento de texto. Primeiro, ele verifica se o valor da coluna 1 ($1) está no mapa visualizado. Se não for, imprime a linha no arquivo de saída ou tela se você não redirecionar (> arquivo de saída). A próxima parte é que ele adiciona as informações da coluna visualizada a vistas (++) para que possa pesquisar com o próximo padrão.

    • 0

relate perguntas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Existe um comando para listar todos os usuários? Também para adicionar, excluir, modificar usuários, no terminal?

    • 9 respostas
  • Marko Smith

    Como excluir um diretório não vazio no Terminal?

    • 4 respostas
  • Marko Smith

    Como descompactar um arquivo zip do Terminal?

    • 9 respostas
  • Marko Smith

    Como instalo um arquivo .deb por meio da linha de comando?

    • 11 respostas
  • Marko Smith

    Como instalo um arquivo .tar.gz (ou .tar.bz2)?

    • 14 respostas
  • Marko Smith

    Como listar todos os pacotes instalados

    • 24 respostas
  • Martin Hope
    Flimm Como posso usar o docker sem sudo? 2014-06-07 00:17:43 +0800 CST
  • Martin Hope
    led-Zepp Como faço para salvar a saída do terminal em um arquivo? 2014-02-15 11:49:07 +0800 CST
  • Martin Hope
    ubuntu-nerd Como descompactar um arquivo zip do Terminal? 2011-12-11 20:37:54 +0800 CST
  • Martin Hope
    TheXed Como instalo um arquivo .deb por meio da linha de comando? 2011-05-07 09:40:28 +0800 CST
  • Martin Hope
    Ivan Como listar todos os pacotes instalados 2010-12-17 18:08:49 +0800 CST
  • Martin Hope
    David Barry Como determino o tamanho total de um diretório (pasta) na linha de comando? 2010-08-06 10:20:23 +0800 CST
  • Martin Hope
    jfoucher "Os seguintes pacotes foram retidos:" Por que e como resolvo isso? 2010-08-01 13:59:22 +0800 CST
  • Martin Hope
    David Ashford Como os PPAs podem ser removidos? 2010-07-30 01:09:42 +0800 CST

Hot tag

10.10 10.04 gnome networking server command-line package-management software-recommendation sound xorg

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve