我想删除文件中每次出现的the>
和 word之间的部分。Bacteria
- 这是输入的示例:
>AADV02000003.105686.107093 Bacteria;Cyanobacteria;Cyanobacteriia;Cyanobacteriales;
- 结果应如下所示:
>Bacteria;Cyanobacteria;Cyanobacteriia;Cyanobacteriales;
这是一个 FASTA 文件(仿生信息学中的一种常见文件格式),因此>
始终是该行中的第一个非空白字符,并且该行中只有一个这样的字符。
我正在考虑使用sed
,但我不确定如何设置命令。感谢您的帮助。