我花了很多时间寻找关于我的问题的现有问题,但我没有找到任何针对这种情况的具体解决方案。如果有解决它的现有线程/问题,我提前道歉,如果有人能指出我,我将不胜感激。
我必须在数据系统的众多文件中搜索一个模式(例如“GENE”)。但是,数据集命名如下:
foo_1549474392_93.nwk
foo_1549474392_93.ort.final.nwk
foo_1549474392_93.ort.nwk
foo_1549474392_93.ort_reroot.nwk
这些是用于分析 n# 93 的文本文件。总共有 550 个。问题是,我只能在名为“foo_1549474392_93.nwk”的文件中找到模式(即:任何内容 + 下划线 + 数字 + .nwk,数字从 1 到 550,而不是 001 到 550)。下划线之前的所有其他内容都无关紧要。
我已经试过了
grep "GENE" *'/d'.nwk
以及使用 [0-9] 等的许多变体。
非常感谢你的帮助!
要搜索名称与任何内容 + 下划线 + 数字 + .nwk 匹配的任何文件,数字从 1 到 550 不包括 001、551 等,请尝试:
因为
{1..550}
扩展为您想要的数字(并且只有您想要的数字),所以 glob*_{1..550}.nwk
将仅包含您想要的文件。为了确保扩展中的所有文件实际存在于目录中,我们设置nullglob
了shopt -s nullglob
.由于您可能不希望 nullglob 中的更改影响其他命令,因此使用括号将命令放在子 shell 中可能很有用。
nullglob 中的更改仅影响子外壳(括号内的内容),而不影响之前或之后的任何内容。
例子
让我们创建四个文件
GENE
,其中两个与您的文件名条件匹配,两个不匹配:现在,让我们运行我们的命令:
排除不需要的文件并找到好名称。
为了比较,让我们尝试:
这匹配不需要的文件。