Reorganize as letras e compare duas palavras

Question

Renga

Asked: 2022-06-11 05:31:17 +0800 CST2022-06-11 05:31:17 +0800 CST 2022-06-11 05:31:17 +0800 CST

Torne a 2ª coluna única e adicione o respectivo valor delas nas 1ª colunas

772

Eu inseri como mostrado abaixo e preciso manter apenas as strings exclusivas da segunda coluna, onde a primeira coluna se tornará a soma de todos os valores para cada string exclusiva.

Por exemplo: pegue o OIAna 2ª coluna e adicione os respectivos valores de OIA da primeira coluna e imprima antes OIAde .

ENTRADA:

1079 OIA
1079 OIA
975  OIA
975  OIA
372  CLN
243  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN
224  TLN

Saída esperada:

4108    OIA
372     CLN
2483    TLN

3 respostas

Voted

DanieleGrassini · Answer 1 · 2022-06-11T05:42:00+08:00

Best Answer

DanieleGrassini

2022-06-11T05:42:00+08:002022-06-11T05:42:00+08:00

awk '{m[$2]+=$1}END{for(i in m)print m[i],i}' file

isso deve funcionar bem para a maioria dos casos com colunas separadas por espaços em branco.

3

Ed Morton · Answer 2 · 2022-06-11T09:40:56+08:00

Ed Morton

2022-06-11T09:40:56+08:002022-06-11T09:40:56+08:00

Supondo que sua entrada seja sempre agrupada pelos valores da 2ª coluna, conforme mostrado em sua entrada de exemplo:

$ awk '$2!=prev{if (NR>1) print sum, prev; sum=0; prev=$2} {sum+=$1} END{print sum, prev}' file
4108 OIA
372 CLN
2483 TLN

O acima não manterá quase nada na memória e, portanto, funcionará para arquivos arbitrariamente grandes e produzirá a saída na mesma ordem que os valores de entrada $ 2.

3

Kusalananda · Answer 3 · 2022-08-18T11:00:24+08:00

Kusalananda

2022-08-18T11:00:24+08:002022-08-18T11:00:24+08:00

Supondo que os dados sejam classificados na segunda coluna, usando GNU datamash:

datamash -W groupby 2 sum 1 <file

Isso lê a entrada como campos delimitados por espaços em branco, agrupa os dados pelo segundo campo e soma o primeiro campo para cada grupo.

A saída dada aos dados na pergunta será delimitada por tabulação:

CLN     372
OIA     4108
TLN     2483

Observe que os campos são trocados do que é esperado na pergunta. Para corrigir isso e também classificar os dados de entrada no segundo campo (no caso de não ser tão ordenadamente quanto na pergunta):

sort -b -k 2,2 file | datamash -W groupby 2 sum 1 | awk -v OFS='\t' '{ print $2, $1 }'

1

Torne a 2ª coluna única e adicione o respectivo valor delas nas 1ª colunas

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Torne a 2ª coluna única e adicione o respectivo valor delas nas 1ª colunas

3 respostas

relate perguntas