我有一个这样的 gtf 文件:
ChrI Coding_transcript gene 8451772 8509212 . - . gene_id "UMM-S589-0.12-gene-1"
ChrI Coding_transcript exon 8501974 8509212 . - . gene_id "UMM-S589-0.12-gene-1"
ChrI Coding_transcript exon 8491643 8501928 . - 0 gene_id "UMM-S589-0.12-gene-1"
我现在想在第 9 列中添加更多信息,使其看起来像这样:
ChrI Coding_transcript exon 8501974 8509212 . - . gene_id "UMM-S589-0.12-gene-1"; transcript_id "UMM-S589-0.12-gene-1", exon_id "1";
ChrI Coding_transcript exon 8491643 8501928 . - 0 gene_id "UMM-S589-0.12-gene-1";transcript_id "UMM-S589-0.12-gene-1", exon_id "2";
有谁知道我可以用来制作这个文件的任何简单命令吗?太感谢了!
尝试这个:
输出:
NF==10
检查字段数是否为 10。print $0
打印完整行。transcript_id $10
因为它与 gene_id 相同++count[$3]
打印外显子的出现(第三场)NF!=10
只需打印该行。