我想了解下面的 for 循环,也许可以简化它。例如,我想连接目录中每个样本的 rem 文件。
文件:
file1.1.fq
file1.rem.1.fq
file1.2.fq
file1.rem.2.fq
file2.1.fq
file2.rem.1.fq
file2.2.fq
file2.rem.2.fq
for循环:
list=`for i in *rem*.1.fq; do echo $i | cut -f 1 -d \.; done`
for i in $list; do cat $i.rem.1.fq $i.rem.2.fq > $i.rem.b.fq; done
我可以在不列出清单的情况下这样做吗?做什么的cut -f 1 -d
?如果文件名的一部分在列表中的两者之间,为什么会cat $i.rem.1.fq
起作用但不起作用?这是否意味着它捕获了之前的所有内容(例如file1)?cat $i.1.fq
rem
*
*rem*
尝试:
也许添加检查文件是否存在:
问题中提出的方法容易出错——如果文件包含空格,则第二个
for
循环可能无法正常运行。cut -f 1 -d.
将一个字符串切割成字段(在这种情况下由 分隔.
),并输出请求的字段(在这种情况下,只是第一个)。如果给定字符串file 1.whatever
,它将输出file 1
。同样,这很容易出错,因为 glob 模式*rem*.1.fq
可以返回文件名anyremthing.1.fq
-*
通配符匹配任何内容(包括nothing)。更好的选择是执行单个循环并使用参数扩展,在循环内使用某种形式的替换来匹配具有相关名称的其他文件。
*.rem.1.fq
——您可能希望进一步缩小范围——例如。file[0-9].rem.1.fq
.${param%string}
在循环中用于删除后缀.1.fq
. 许多 shell 还支持其他形式的参数扩展替换——例如。${param/string/repl}
."$param"
此外,引用 all或替换通常是一个好主意"$(command)"
- 否则大多数 shell 将应用字段拆分和文件名生成,您可能最终会尝试cat file 1
而不是cat 'file 1'
.如果您不能
--
保证文件名不会以-
.