grep 从 $START 到 $END 的一组行并且在 $MIDDLE 中包含匹配项

Question

Whitehot

Asked: 2024-06-20 17:21:23 +0800 CST2024-06-20 17:21:23 +0800 CST 2024-06-20 17:21:23 +0800 CST

将命令行输出传递给 awk 变量

772

我正在尝试使用数据文件的先前版本中的行数来规范化数据文件。阅读完这些问题后，我认为这可行：

awk -v num=$(wc -l my_first_file.bed) '{print $1, $2, $3, $4/num}' my_other_file.bed

但它会引发这个错误：

awk: cmd. line:1: my_first_file.bed
awk: cmd. line:1:              ^ syntax error

使用反斜杠保护.不会改变任何内容，使用反引号代替也不会改变任何内容$()。

我如何将的输出用作wc -l变量awk？这一切都将在 snakemake 管道内发生，因此在灵活性方面我受到一定限制。

内容my_other_file.bed：

chrUn_KI270548v1    0   50  0.00000
chrUn_KI270548v1    50  192 1.00000
chrUn_KI270548v1    192 497 0.00000
chrUn_KI270548v1    497 639 1.00000
chrUn_KI270548v1    639 723 0.00000
chrUn_KI270548v1    723 860 1.00000
chrUn_KI270548v1    860 865 2.00000
chrUn_KI270548v1    865 879 1.00000
chrUn_KI270548v1    879 991 2.00000
chrUn_KI270548v1    991 1002    3.00000
chrUn_KI270548v1    1002    1021    2.00000
chrUn_KI270548v1    1021    1093    1.00000
chrUn_KI270548v1    1093    1133    2.00000
chrUn_KI270548v1    1133    1222    1.00000
chrUn_KI270548v1    1222    1235    2.00000
chrUn_KI270548v1    1235    1364    1.00000
chrUn_KI270590v1    0   16  4.00000
chrUn_KI270590v1    16  46  5.00000
chrUn_KI270590v1    46  48  6.00000
chrUn_KI270590v1    48  95  7.00000
chrUn_KI270590v1    95  117 8.00000
chrUn_KI270590v1    117 130 9.00000
chrUn_KI270590v1    130 136 8.00000
chrUn_KI270590v1    136 138 7.00000
chrUn_KI270590v1    138 139 6.00000

3 个回答

Voted

Kusalananda · Answer 1 · 2024-06-20T18:23:14+08:00

wc -l filename将输出包含两列的行；行数和文件名：

$ wc -l .profile
27 .profile

awk当您尝试使用此字符串进行除法时，您的代码会变得混乱。

如果将文件内容重定向wc -l到，则该wc实用程序将无法输出文件的名称，而只会输出文件中的换行符数：

$ wc -l <.profile
27

因此，将您的代码更改为：

awk -v num=$(wc -l <my_first_file.bed) '{print $1, $2, $3, $4/num}' my_other_file.bed

或者，让我们awk来计算一下：

awk 'FNR == NR { lines++; next } { print $1, $2, $3, $4/lines }' my_first_file.bed my_other_file.bed

或者，

awk 'FNR == NR { lines++; next } { $4 /= lines; print }' my_first_file.bed my_other_file.bed

这里，我们提供了awk 两个文件供使用，但在读取第一个文件时，我们所做的只是增加变量lines。当开始读取第二个文件时，条件FNR == NR不再为真（从当前文件读取的记录数不再与整体读取的记录数相同），我们开始执行第二个块。

这假设第一个文件永远不会是空的。

如果您希望输出以制表符分隔，那么请不要忘记OFS="\t"设置awk。

woolwich · Answer 2 · 2024-06-20T18:17:56+08:00

woolwich

2024-06-20T18:17:56+08:002024-06-20T18:17:56+08:00

尝试运行wc -l my_first_file.bed：

$ wc -l my_first_file.bed
24 my_first_file.bed

因此，你的命令将被 shell 扩展为

awk -v num=24 my_first_file.bed '{print $1, $2, $3, $4/num}' my_other_file.bed`

这使得my_first_file.bed你的 Awk 命令当然不是有效的 Awk 语法。

解决此问题的一种方法是将wc -l my_first_file.bed命令更改为仅输出第一列。例如，如下所示：

awk -v num=$(wc -l my_first_file.bed | cut -d' ' -f1) '{print $1, $2, $3, $4/num}' my_other_file.bed

这使用空格作为 cut 输出的分隔符，以便将行数传递给变量。

3

AdminBee · Answer 3 · 2024-06-20T18:23:54+08:00

AdminBee

2024-06-20T18:23:54+08:002024-06-20T18:23:54+08:00

awk您可以通过传递两个文件作为操作数来完成此操作：

awk 'NR==FNR{lines++;next} {print $1,$2,$3,$4/lines}' my_first_file.bed my_other_file.bed

这将执行以下操作：

在处理第一个文件时（由NR全局行计数器表示，等于FNR每个文件的行计数器），我们只需增加行数，但之后跳过执行到下一行。
在处理下一个文件时，我们打印所有列，但将第 4 列除以值lines，该值不再增加，因为NR现在大于FNR

my_first_file.bed请注意，如果为空，则此操作将不起作用。

1

将命令行输出传递给 awk 变量

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

将命令行输出传递给 awk 变量

3 个回答

相关问题