在一个文件夹中有一组匹配的文件,每对文件的名称是这样的,带有一个基本名称,例如
LP6005334-DNA_H01_vs_LP6005333-DNA_H01.passed.somatic.indels.vcf.parsed.txt
和
LP6005334-DNA_H01_vs_LP6005333-DNA_H01.passed.somatic.indels.vcf_fixed_vcf.txt.hg19_multianno.txt
我如何columns 5th and 6th
从文件passed.somatic.indels.vcf.parsed
名中提取文件并将这些列附加到匹配的文件 ( ) 中,返回带有基本名称( )passed.somatic.indels.vcf_fixed_vcf.txt.hg19_multianno
的输出.txtLP6005334-DNA_H01_vs_LP6005333-DNA_H01
为了切割我所做的列
[
fi1d18@cyan01 folder]$ for f in *.passed.somatic.indels.vcf.parsed.txt; do awk '{print $5,$6}' $f > $out
> done;
-bash: $out: ambiguous redirect
此后我不知道如何找到匹配的查找并将剪切列附加到
这是一对这些文件的链接
和
这取决于你的文件是如何分隔的,但你应该能够使用类似的东西
扩展
${f%.parsed.txt}
和${f%%.*}
分别从循环文件名中删除最短和最长的“点后缀”。对于文件对
不符合原始问题中的命名约定,您需要相应地更改模式匹配
前任。