我想知道如何按以下方式对文件的行进行排序:
我的文件是 file.txt(制表符分隔):
g1 00A98_01563 00554_01552 CCUG38_01373
g2 00554_01444
g3 00A98_04566 CCUG38_05322
我想得到这个(制表符分隔):
g 00A98 00554 CCUG38
g1 1 1 1
g2 0 1 0
g3 1 0 1
和/或也采用这种格式(制表符分隔):
g 00A98 00554 CCUG38
g1 00A98_01563 00554_01552 CCUG38_01373
g2 00554_01444
g3 00A98_04566 CCUG38_05322
如何使用带有 sort、awk、grep 或其他方法的命令行来执行此操作?
一切顺利, 问候
使用Miller,将输入视为分隔键值对,以 TAB 作为输入字段分隔符,下划线作为输入对分隔符,并将输出设置为 TSV。然后你可以对你的数据进行非稀疏化
然后,您可以添加各种转换 ex。
或者
在最后一种情况下,对齐看起来“关闭”,但用
--ocsv
代替输出--tsv
应该确认它是正确的。这是
toMatrix.awk