Eu tenho este arquivo de texto de entrada:
CD196_RS15035 normal alleles
CD196_RS15035 normal alleles
CD196_RS15035 truncation in the allele
CD196_RS15035 truncation in the allele
CD196_RS15035 no stop for allele
CD196_RS15035 no stop for allele
CD196_RS16835 normal alleles
CD196_RS16835 truncation in the allele
CD196_RS16835 no stop for allele
CD196_RS16835 no stop for allele
Quero contar o número de vezes que cada string ocorre na segunda coluna que corresponde à primeira coluna.
Quero um arquivo de texto de saída como este:
CD196_RS15035 normal alleles 2 truncation in the allele 2 no stop for allele 2
CD196_RS16835 normal alleles 1 truncation in the allele 1 no stop for allele 2
Qualquer dica seria útil. Obrigado.
Com
awk
a matriz multidimensional de:Uma opção potencial poderia ser 'construir' cada linha percorrendo as variáveis, por exemplo
Supondo que as colunas sejam delimitadas por tabulações, você poderia fazer isso com
datamash
:Saída: