我有一个巨大的文件,其中包含许多列和行中的数值。第 6 列之后的列中的值都是数字加上缺少NA
(0
或1
或)。2
NA
我想以这种方式更改第 7 列及以后所有列中的值: 0
to A A
、1
to A B
、2
toB B
和NA
to 0 0
。这样,第 7 列的标题将是两次。我可以这样做awk
吗?我的输入文件是这样的,但在此之后有很多列。我的输出文件应该是制表符分隔的。
id1 id2 parental maternal sex phenotype A_101 A_102 A_103
20907153 20907153 0 0 -9 -9 1 0 0 0 0 0
31405729 31405729 0 0 -9 -9 0 0 0 0 0 0
31450731 31450731 0 0 -9 -9 0 0 0 2 0 0
41940308 41940308 0 0 -9 -9 0 0 0 NA 0 0
52428081 52428081 0 0 -9 -9 0 0 0 0 0 0
41943104 41943104 0 0 -9 -9 0 0 0 0 0 0
有点长,但直截了当:
如果字段编号> = 7,则循环遍历每个字段,如果匹配您的条件之一,则将该字段替换为相应的对。循环后打印整行。
对我来说,这会返回: