AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 408363
Accepted
Duck
Duck
Asked: 2017-12-03 04:08:16 +0800 CST2017-12-03 04:08:16 +0800 CST 2017-12-03 04:08:16 +0800 CST

Verificando se um arquivo de texto possui todas as entradas e está formatado corretamente

  • 772

Eu tenho um arquivo que é assim

0001;4;5;30;33;41;52
0002;9;37;39;41;43;49
0003;10;11;29;30;36;47
0004;1;5;6;27;42;59
0005;1;2;6;16;19;46
0006;7;13;19;22;40;47
0007;3;5;20;21;38;56
... etc

O primeiro número é um contador e os seis seguintes são números de 1 ou 2 dígitos.

O arquivo tem milhares de linhas como esta. Começa em 1 e vai até 9999.

Existe uma maneira de verificar se há uma linha faltando? Quero dizer, se todos os números estiverem presentes desde o da primeira linha até o da última linha?

quero dizer assim:

0001;4;5;30;33;41;52      // first line
0002;9;37;39;41;43;49
0003;10;11;29;30;36;47
...
9999;3;4;8;12;55;88       // last line

falta alguma linha entre 0001 e 9999?

Suponha isto:

0001;4;5;30;33;41;52     
0002;9;37;39;41;43;49
0003;10;11;29;30;36;47
0004;1;5;6;27;42;59
0006;7;13;19;22;40;47

Vejo? 0005 está faltando.

Como bônus, seria bom verificar se todos os sete números são delimitados por ;e não por qualquer outro caractere.

Obrigado

awk csv
  • 2 2 respostas
  • 232 Views

2 respostas

  • Voted
  1. Best Answer
    RomanPerekhrest
    2017-12-03T04:24:28+08:002017-12-03T04:24:28+08:00

    AWKsolução (assumindo que o seu se imprime o primeiro como se estivesse ok ):

    Arquivo de amostra input.csv:

    0001;4;5;30;33;41;52
    0002;9;37;39;41;43;49
    0003;10;11;29;30;36;47
    0005;1;2;6;16;19;46
    0006;7;13;19;22;40;47
    0007;3;5;20;21;38;56
    0008;1;5,6;27;42;59
    0009;10;1;6;27;42;59
    

    para condição para verificar se há uma linha faltando :

    awk -F';' 'NR!=int($1){ printf "%04d is missing\n",NR; exit }' input.csv
    

    A saída:

    0004 is missing
    

    for condição para verificar se todos os sete números são delimitados por; :

    awk -F';' 'NF!=7{printf "Incorrect number of fields: %d on record %d\n",NF,NR; exit}' input.csv
    

    A saída:

    Incorrect number of fields: 6 on record 7
    
    • 3
  2. glenn jackman
    2017-12-03T13:57:34+08:002017-12-03T13:57:34+08:00

    Além da resposta aceita, para encontrar qualquer linha com um caractere indesejado:

    grep '[^0-9;]' filename
    

    que produzirá qualquer linha no arquivo que contenha um caractere que não seja um número ou um ponto e vírgula. Use grep -npara encontrar o número da linha dessas linhas ofensivas.

    • 1

relate perguntas

  • remova o número de linhas duplicadas com base na correspondência antes da primeira vírgula

  • anexar linhas após outros arquivos linha por linha

  • Como remover uma única linha entre duas linhas

  • Reorganize as letras e compare duas palavras

  • Embaralhamento de arquivo de várias linhas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Matriz JSON para bash variáveis ​​usando jq

    • 4 respostas
  • Marko Smith

    A data pode formatar a hora atual para o fuso horário GMT? [duplicado]

    • 2 respostas
  • Marko Smith

    bash + lê variáveis ​​e valores do arquivo pelo script bash

    • 4 respostas
  • Marko Smith

    Como posso copiar um diretório e renomeá-lo no mesmo comando?

    • 4 respostas
  • Marko Smith

    conexão ssh. Conexão X11 rejeitada devido a autenticação incorreta

    • 3 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Marko Smith

    comando systemctl não funciona no RHEL 6

    • 3 respostas
  • Marko Smith

    rsync porta 22 e 873 uso

    • 2 respostas
  • Marko Smith

    snap /dev/loop em 100% de utilização -- sem espaço livre

    • 1 respostas
  • Marko Smith

    chave de impressão jq e valor para todos no subobjeto

    • 2 respostas
  • Martin Hope
    EHerman Matriz JSON para bash variáveis ​​usando jq 2017-12-31 14:50:58 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Drux A data pode formatar a hora atual para o fuso horário GMT? [duplicado] 2017-12-26 11:35:07 +0800 CST
  • Martin Hope
    AllisonC Como posso copiar um diretório e renomeá-lo no mesmo comando? 2017-12-22 05:28:06 +0800 CST
  • Martin Hope
    Steve Como as permissões de arquivo funcionam para o usuário "root"? 2017-12-22 02:46:01 +0800 CST
  • Martin Hope
    Bagas Sanjaya Por que o Linux usa LF como caractere de nova linha? 2017-12-20 05:48:21 +0800 CST
  • Martin Hope
    Cbhihe Altere o editor padrão para vim para _ sudo systemctl edit [unit-file] _ 2017-12-03 10:11:38 +0800 CST
  • Martin Hope
    showkey Como baixar o pacote não instalá-lo com o comando apt-get? 2017-12-03 02:15:02 +0800 CST
  • Martin Hope
    youxiao Por que os diretórios /home, /usr, /var, etc. têm o mesmo número de inode (2)? 2017-12-02 05:33:41 +0800 CST
  • Martin Hope
    user223600 gpg — o comando list-keys gera uid [ desconhecido ] depois de importar a chave privada para uma instalação limpa 2017-11-26 18:26:02 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve