Grep para um conjunto de linhas de $START a $END AND que contém uma correspondência em $MIDDLE

Question

WashichawbachaW

Asked: 2018-04-03 22:25:28 +0800 CST2018-04-03 22:25:28 +0800 CST 2018-04-03 22:25:28 +0800 CST

Processamento de texto: como classificar lista por data delimitada por uma string

772

Eu quero classificar o conteúdo file.txtpor data. <td></td>A data para classificar está na quarta tag de dados da tabela

Ex: Conteúdo de file.txt:

<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2018Mar01</td></tr>
<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2017Jan31</td></tr>
<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2018Apr02</td></tr>
<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2017Dec25</td></tr>

Saída desejada: Como posso fazer isso?

<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2017Jan31</td></tr>
<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2017Dec25</td></tr>
<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2018Mar01</td></tr>
<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2018Apr02</td></tr>

Eu tenho usado sorto comando, mas não está funcionando.

cat file.txt 2> /dev/null | sort -t'>' -k9n -k9.4M -k9.7n

EDIT: Encontrei este link de referência, mas ainda não funciona corretamente. https://stackoverflow.com/a/16060031/7842707

1 respostas

Voted

RomanPerekhrest · Answer 1 · 2018-04-03T22:56:56+08:00

Best Answer

RomanPerekhrest

2018-04-03T22:56:56+08:002018-04-03T22:56:56+08:00

Caso cada <tr>item esteja em uma linha separada:

awk+ sortsolução:

awk -F'[<>]' '{ print $(NF-4), $0 }' file.txt | sort -k1,1n -k1.5M | cut -d' ' -f2-

-F'[<>]'- tratar <e >como separador de campo
$(NF-4)- contém o último <td>valor de tag (por exemplo 2017Jan31, ) de cada linha. Isso é usado como uma chave de classificação.
-k1,1n- classificar pelo 1º campo numericamente (ou seja, por data e ano)
-k1.5M- ordenação do mês da data a partir do 5º caracter
cut -d' ' -f2-- remover uma chave de classificação auxiliar (o 1º campo)

A saída:

<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2017Jan31</td></tr>
<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2017Dec25</td></tr>
<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2018Mar01</td></tr>
<tr><td>some_name_here</td><td>number_code_here</td><td>2018Mar31</td><td>2018Apr02</td></tr>

1

Processamento de texto: como classificar lista por data delimitada por uma string

Como exportar uma chave privada GPG e uma chave pública para um arquivo

ssh Não é possível negociar: "nenhuma cifra correspondente encontrada", está rejeitando o cbc

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

Como descarregar o módulo do kernel 'nvidia-drm'?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Processamento de texto: como classificar lista por data delimitada por uma string

1 respostas

relate perguntas