Reorganize as letras e compare duas palavras

Question

Bharat

Asked: 2018-04-12 10:50:31 +0800 CST2018-04-12 10:50:31 +0800 CST 2018-04-12 10:50:31 +0800 CST

Comando mais simples para imprimir valores exclusivos de alguns dados de coluna com contagem de valores repetidos

772

Uma amostra de dados de entrada com 3 colunas, 1ª e 3ª coluna tem valores em duplicatas, precisa imprimi-los exclusivamente com sua contagem de repetição.

sort -u ajuda em algum sentido, mas não consegue imprimir a ocorrência de valores repetidos relacionados à 1ª e 3ª coluna.

Input :

A 3210 -06:00
A 5172 -06:00
A 3335 -07:00
A 3258 -05:00
B 3322 -05:00
B 5097 -05:00
C 3238 -06:00
C 5364 -05:00
C 3366 -06:00
C 3293 -06:00

Resultado :

A(2) -06:00
A(1) -07:00
A(1) -05:00
B(2) -05:00
C(3) -06:00
C(1) -05:00

ou

Resultado :

A 2 -06:00
A 1 -07:00
A 1 -05:00
B 2 -05:00
C 3 -06:00
C 1 -05:00

3 respostas

Voted

hhoke1 · Answer 1 · 2018-04-12T11:03:00+08:00

hhoke1

2018-04-12T11:03:00+08:002018-04-12T11:03:00+08:00

Não é exatamente o formato que você deseja, mas atende a todos os outros requisitos:

awk '{print $1" "$3}' <inFile> | sort | uniq -c

Em inglês, use awk para imprimir apenas a primeira e a terceira colunas, depois classifique e uniq com count.

3

Kusalananda · Answer 2 · 2018-04-12T11:13:10+08:00

$ awk '{ count[$1,$3]++ } END { for (i in count) { split(i, field, SUBSEP); printf("%s(%d)%s%s\n", field[1], count[i], OFS, field[2]) } }' file
A(1) -07:00
B(2) -05:00
A(2) -06:00
A(1) -05:00
C(3) -06:00
C(1) -05:00

Observe que a saída pode não ser classificada. Passe-o, sortse necessário.

O código armazena a contagem de quantas vezes o primeiro e o terceiro campos da entrada ocorreram juntos como um par, na countmatriz (com o primeiro e o terceiro campos como o índice). No final, fazemos um loop sobre os índices do array, dividindo-os no primeiro e terceiro campos originais (como field[1]e field[2]respectivamente) e os exibimos junto com a contagem no formato desejado.

No formato alternativo:

Se o arquivo de entrada usar um único espaço para o separador de campo (caso contrário, use awk '{ print $1,$3 }'em vez de cut):

$ cut -d ' ' -f 1,3 file | sort | uniq -c
   1 A -05:00
   2 A -06:00
   1 A -07:00
   2 B -05:00
   1 C -05:00
   3 C -06:00

Para trocar as duas primeiras colunas:

$ cut -d ' ' -f 1,3 file | sort | uniq -c | awk '{ print $2, $1, $3 }'
A 1 -05:00
A 2 -06:00
A 1 -07:00
B 2 -05:00
C 1 -05:00
C 3 -06:00

agc · Answer 3 · 2018-04-12T11:11:28+08:00

Best Answer

agc

2018-04-12T11:11:28+08:002018-04-12T11:11:28+08:00

Dado Input use cut, sort, uniqe sed:

cut -d ' ' -f1,3 Input | 
sort | uniq -c | 
sed 's/^ *//;s/^\([0-9]*\) \([^ ]*\)/\2 \1/'

Usando datamashe sed:

datamash -t ' ' -g1,3 -s countunique 2 < Input | 
sed 's/\(.*\) \(.*\) \(.*\)/\1 \3 \2/'

Saída de qualquer um:

A 1 -05:00
A 2 -06:00
A 1 -07:00
B 2 -05:00
C 1 -05:00
C 3 -06:00

2

Comando mais simples para imprimir valores exclusivos de alguns dados de coluna com contagem de valores repetidos

Como exportar uma chave privada GPG e uma chave pública para um arquivo

ssh Não é possível negociar: "nenhuma cifra correspondente encontrada", está rejeitando o cbc

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

Como descarregar o módulo do kernel 'nvidia-drm'?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Comando mais simples para imprimir valores exclusivos de alguns dados de coluna com contagem de valores repetidos

3 respostas

relate perguntas