AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 412329
Accepted
Noah Goodrich
Noah Goodrich
Asked: 2017-12-22 10:03:04 +0800 CST2017-12-22 10:03:04 +0800 CST 2017-12-22 10:03:04 +0800 CST

Usando o awk para quebrar um timestamp e formatá-lo

  • 772

Para nomes de arquivos como este:

fileLoad.xml2017-12-21_10_55_53-153.txt
otherFile.xml2017-12-20-11_23_01-87899.txt
someFile.xml2017-11-30-21_00_59-1.txt

O que estou tentando fazer awké isolar o nome do arquivo .xmle, em seguida, isolar e formatar o carimbo de data/hora para uso em um csv/banco de dados.

Eu tenho o seguinte:

NR==1 {
    fn=substr(FILENAME, 0, FILENAME-5);
    ts=fn;                                                                                                                                                                                                
    sub(/[0-9]{4}.*$/,"",fn);                                                                                      
    sub(/^\w+\.xml/,"",ts);
} {
     printf "fn\tts"
}

Posso retirar o '-' do final, mas depois disso não consigo descobrir como converter o timestamp restante para ser formatado como 2017-11-30 21:00:59.

awk text-formatting
  • 1 1 respostas
  • 363 Views

1 respostas

  • Voted
  1. Best Answer
    Lizardx
    2017-12-22T12:20:33+08:002017-12-22T12:20:33+08:00

    Isso funciona, embora eu pessoalmente não use o awk para isso, eu usaria o gawk, que possui alguns recursos significativos que facilitam essa operação de tipo exato, gensub ().

    echo 'fileLoad.xml2017-12-21_10_55_53-153.txt
    otherFile.xml2017-12-20-11_23_01-87899.txt
    someFile.xml2017-11-30-21_00_59-1.txt' | awk '{
      gsub(/^.*\.xml|-[0-9]+\.txt/,"",$0);
      date=$0; 
      time=$0; 
      sub(/[-_][0-9]{2}_[0-9]{2}_[0-9]{2}$/,"",date); 
      sub(/^[0-9]{4}-[0-9]{2}-[0-9]{2}[-_]/,"",time);
      gsub(/_/,":",time);
      print date " "  time 
    }'
    2017-12-21 10:55:53
    2017-12-20 11:23:01
    2017-11-30 21:00:59
    

    Como você especificou o awk, esta é uma maneira de fazer isso, embora um pouco básica.

    Observe que, devido à ausência de gensub, transferi o valor de $ 0 para dois detentores, para poder remover o início de um e o final do outro.

    Como você pode ver, é fácil remover os iniciadores / finalizadores iniciais, e isso deixa apenas os dados de data / hora para processamento posterior.

    Usando gawk e gensub é mais fácil.

    echo 'fileLoad.xml2017-12-21_10_55_53-153.txt
    otherFile.xml2017-12-20-11_23_01-87899.txt
    someFile.xml2017-11-30-21_00_59-1.txt' | gawk '{
      gsub(/^.*\.xml|-[0-9]+\.txt/,"",$0);
      datetime = gensub(/^([0-9-]{10})[-_]([0-9_]{8})$/,"\\1 \\2",1,$0);
      gsub(/_/,":",datetime);
      print datetime 
    }'
    2017-12-21 10:55:53
    2017-12-20 11:23:01
    2017-11-30 21:00:59
    

    Observe que os padrões de início/fim fazem a mesma coisa, um pega o padrão real e o reproduz, o segundo apenas diz, dê-me as primeiras 10 correspondências para [0-9-] e as últimas 8 correspondências para [0-9_] , depende apenas do que é mais fácil de ler.

    A verdadeira questão é se você não teria se saído melhor usando Perl para este trabalho.

    • 2

relate perguntas

  • remova o número de linhas duplicadas com base na correspondência antes da primeira vírgula

  • anexar linhas após outros arquivos linha por linha

  • Como remover uma única linha entre duas linhas

  • Reorganize as letras e compare duas palavras

  • Embaralhamento de arquivo de várias linhas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Matriz JSON para bash variáveis ​​usando jq

    • 4 respostas
  • Marko Smith

    A data pode formatar a hora atual para o fuso horário GMT? [duplicado]

    • 2 respostas
  • Marko Smith

    bash + lê variáveis ​​e valores do arquivo pelo script bash

    • 4 respostas
  • Marko Smith

    Como posso copiar um diretório e renomeá-lo no mesmo comando?

    • 4 respostas
  • Marko Smith

    conexão ssh. Conexão X11 rejeitada devido a autenticação incorreta

    • 3 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Marko Smith

    comando systemctl não funciona no RHEL 6

    • 3 respostas
  • Marko Smith

    rsync porta 22 e 873 uso

    • 2 respostas
  • Marko Smith

    snap /dev/loop em 100% de utilização -- sem espaço livre

    • 1 respostas
  • Marko Smith

    chave de impressão jq e valor para todos no subobjeto

    • 2 respostas
  • Martin Hope
    EHerman Matriz JSON para bash variáveis ​​usando jq 2017-12-31 14:50:58 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Drux A data pode formatar a hora atual para o fuso horário GMT? [duplicado] 2017-12-26 11:35:07 +0800 CST
  • Martin Hope
    AllisonC Como posso copiar um diretório e renomeá-lo no mesmo comando? 2017-12-22 05:28:06 +0800 CST
  • Martin Hope
    Steve Como as permissões de arquivo funcionam para o usuário "root"? 2017-12-22 02:46:01 +0800 CST
  • Martin Hope
    Bagas Sanjaya Por que o Linux usa LF como caractere de nova linha? 2017-12-20 05:48:21 +0800 CST
  • Martin Hope
    Cbhihe Altere o editor padrão para vim para _ sudo systemctl edit [unit-file] _ 2017-12-03 10:11:38 +0800 CST
  • Martin Hope
    showkey Como baixar o pacote não instalá-lo com o comando apt-get? 2017-12-03 02:15:02 +0800 CST
  • Martin Hope
    youxiao Por que os diretórios /home, /usr, /var, etc. têm o mesmo número de inode (2)? 2017-12-02 05:33:41 +0800 CST
  • Martin Hope
    user223600 gpg — o comando list-keys gera uid [ desconhecido ] depois de importar a chave privada para uma instalação limpa 2017-11-26 18:26:02 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve