我正在使用这种晦涩的文件格式处理数据:
SNP A1 A2 F1 I1 F2 I2 F3 I3
rs0001 A C 0.02 0.00 1.99
(注意前三个字段周围的空格)
标头很长(500k 条目),我想将其转换为如下内容:
SNP A1 A2 F1_I1 F2_I2 F3_I3
rs0001 A C 0.02 0.00 1.99
...这样无论是否删除不规则的空白,都可以更轻松地处理。作为参考,这也是可以接受的,只要它是一致的:
SNP A1 A2 F1_I1 F2_I2 F3_I3
rs0001 A C 0.02 0.00 1.99
有什么办法可以在 Unix/Linux 中重新格式化它吗?谢谢