我有这个输入文本文件:
CD196_RS15035 normal alleles
CD196_RS15035 normal alleles
CD196_RS15035 truncation in the allele
CD196_RS15035 truncation in the allele
CD196_RS15035 no stop for allele
CD196_RS15035 no stop for allele
CD196_RS16835 normal alleles
CD196_RS16835 truncation in the allele
CD196_RS16835 no stop for allele
CD196_RS16835 no stop for allele
我想计算每个字符串在与第一列相对应的第二列中出现的次数。
我想要这样的输出文本文件:
CD196_RS15035 normal alleles 2 truncation in the allele 2 no stop for allele 2
CD196_RS16835 normal alleles 1 truncation in the allele 1 no stop for allele 2
任何提示都会有帮助。谢谢。
With
awk
的多维数组:一个潜在的选择可能是通过循环变量来“构建”每一行,例如
假设列是制表符分隔的,您可以使用
datamash
:输出: