我有一个排序的 ID 和数字(位置)文件。我需要将第二列中的位置分组为 500 个间隔,然后拆分为不同的文件。
输入
snp00001 200
snp00002 300
snp00003 400
snp00004 500
snp00005 600
snp00006 900
snp00007 1500
snp00008 1800
snp00009 3000
snp00010 3500
snp00011 4000
snp00012 5000
期望的输出
snp00001 200 Group1
snp00002 300 Group1
snp00003 400 Group1
snp00004 500 Group1
snp00005 600 Group1
snp00006 900 Group2
snp00007 1500 Group3
snp00008 1800 Group3
snp00009 3000 Group4
snp00010 3500 Group4
snp00011 4000 Group5
snp00012 5000 Group6
然后将这些组保存到不同的文件中,分别重命名为Group1
、和。Group2
Group3
Group4
我已经尝试bedtools
了一些其他命令,但问题无法解决。
任何帮助将不胜感激。
谢谢!
这是一个完美的工作
awk
:要打印到单独的文件中,请执行以下操作:
这将
Group1
通过Group5
您的示例数据生成文件,格式如下:使用 Perl + csplit。范围运算符或触发器运算符“...”