重新排列字母并比较两个单词

Question

Anna1364

Asked: 2018-05-05 10:07:22 +0800 CST2018-05-05 10:07:22 +0800 CST 2018-05-05 10:07:22 +0800 CST

从文件中提取与第二个文件匹配的行并将它们合并为单个文件

772

我有一个文件包含一些职位，

head positions
142541687
142541814
142541910
142542976
142544533
142546366
142548674
142560386

我有另一个文件夹包含 1800 个文件，每个文件属于一个人（总共 1800 个人）。第 2 列是位置，第 4 列是个人 ID：

 head NA20507.mapped.ILLUMINA.bwa.TSI.low_coverage.20130415.bam_dp
1   142541687   78 NA20507
1   142535975   79 NA20507
1   142535976   79 NA20507
1   142535977   77 NA20507
1   142535978   78 NA20507
1   142535979   77 NA20507

或另一个人的例子，

head NA20901.mapped.ILLUMINA.bwa.GIH.low_coverage.20120522.bam_dp
1   142541687   135 NA20901
1   142535975   135 NA20901
1   142535976   137 NA20901
1   142535977   138 NA20901
1   142535978   138 NA20901
1   142535979   136 NA20901
1   142535980   135 NA20901

对于每个单独的文件，我只想保留那些具有位置文件中位置的行（单个文件的第二列与位置文件匹配），但是我想分别为每个位置存储它！

   cat NA20507.mapped.ILLUMINA.bwa.TSI.low_coverage.20130415.bam_dp_match142541687
        1   142541687   78 NA20507

最后，我想为所有个人合并这些文件：例如位置 142541687

head desired_pos142541687
1   142541687   78  NA20507
1   142541687   135 NA20901

或职位 142542976;

desired_pos142542976

    1   142535976   79 NA20507
    1   142535976   137 NA20901

1 个回答

Voted

Kusalananda · Answer 1 · 2018-05-05T10:36:04+08:00

Best Answer

Kusalananda

2018-05-05T10:36:04+08:002018-05-05T10:36:04+08:00

这或多或少与您对类似问题的答案相同：首先读取一个文件（位置），然后解析其他文件并提取数据。

awk 'NR == FNR { pos[$1]=1; next } $2 in pos { f="desired_pos" $2; print >>f; close(f) }' positions NA*.bam_dp

如果给出问题中的两个单独的文件，并且如果positions包含 142535975，那么这将desired_pos142535975使用以下内容创建：

1   142535975   79 NA20507
1   142535975   135 NA20901

假设所有位置都引用染色体 1（或至少与单个文件中相同的染色体），这将起作用，因为除了文件中的位置之外没有染色体名称信息positions。

1

从文件中提取与第二个文件匹配的行并将它们合并为单个文件

如何将 GPG 私钥和公钥导出到文件

ssh 无法协商：“找不到匹配的密码”，正在拒绝 cbc

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

如何卸载内核模块“nvidia-drm”？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

从文件中提取与第二个文件匹配的行并将它们合并为单个文件

1 个回答

相关问题