ShannonTown提出的问题 -coding

ShannonTown

Asked: 2024-05-24 05:16:15 +0800 CST

如何从 fastq 文件中提取序列并将每个序列另存为新文件

6

我有一个 fastq 文件，其中前 8 行如下所示：

@SRR21388627.2845086/1
GCTGCAGTTGCTGCTGTTGCTGCTGCTGGGGCAGCACACCAGGATGGCCGGCGCCCCCG
+
FFFFFFFFFFFFFFFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFF:FFFFFFFFFF:FF
@SRR21388627.2707233/1
GCTGCAGTTGCTGCTGTTGCTGCTGCTGGGGCAGCACACCAGGATGGCCGGCGCCCCCG
+
FFFF:FF,:FFFF,FF,F:FFFFF:,F,,:,FF:,:,FFF:::F:,,FFF:::,FF:::

我想获取DNA序列并将每个序列保存为一个新文件，该文件以序列之前的行命名，例如“SRR21388627.2845086.1.fq”，其中删除了@，并/替换为.

到目前为止，我想出了一个参考这篇文章的命令，但它还不起作用，因为我不确定如何删除@和/替换awk

cat deltaQ_1_region_1.fq | paste - - - - | cut -f1,2 | 
awk -F'\t' '$1!=prev{close(out); out=$1".fq"; prev=$1} {sub(/[^\t]+\t/,""); print > out}' file

谢谢你！

Web Analytics