从文本文件传递变量的奇怪问题

Question

Asked: 2022-05-12 06:27:52 +0800 CST2022-05-12 06:27:52 +0800 CST 2022-05-12 06:27:52 +0800 CST

使用 awk 检查一个变量中特定列上每一行中的数字与另一个变量中两个特定列中的所有行

772

我需要检查一个变量中特定列的每一行中的数字与另一个变量中两个特定列中的所有行的对比awk，并在第一个变量中保留满足参数的行。

到目前为止，我尝试通过一个强大的awk命令来执行此操作都失败了。我显然可以在外部循环中执行此操作，但它会非常慢，因为我有 100 条数千行要检查。我感谢解决这个问题的任何和所有帮助，我一直在寻求改进我对 awk 的使用，所以如果你有一个解决方案，最好有一个解释，这样我就可以学习和提高自己。

这是一个例子：

假设我只想打印第 2 列中的行${ListToCheckFrom}，如果数字有 > 第 2 列和 < 第 3 列中的任何行${ListToCheckAgainst}

输入示例：

ListToCheckFrom="C,2  
C,22  
C,12  
hr,15"

ListToCheckAgainst="C1,25,50  
hr1,22,30  
r,12,18  
C,15,44"

预期输出：
```
C,22  
hr,15
```

2 个回答

Voted

AdminBee · Answer 1 · 2022-05-12T06:44:37+08:00

由于您已用标记问题bash，因此您可以使用进程替换来读取 shell 变量，如输入文件。以下脚本片段应该这样做：

#!/bin/bash

ListToCheckFrom="C,2  
C,22  
C,12  
hr,15"

ListToCheckAgainst="C1,25,50  
hr1,22,30  
r,12,18  
C,15,44"

awk -F',' 'list=="constr"{n++; low[n]=$2;high[n]=$3;next}
           {for (i=1;i<=n;i++) {if ($2>low[i]&&$2<high[i]) {print;next};}}' \
           list=constr <(echo "$ListToCheckAgainst") \
           list=chk <(echo "$ListToCheckFrom")

这将指定作为第一个输入文件的'd 内容，以及echo作为第二个输入文件的 'd 内容。它将在“打开”每个文件之前或之前设置一个变量，以便在内部区分当前正在处理哪些“文件”。$ListToCheckAgainstecho$ListToCheckFromawklistconstrchkawk

当处理来自的“约束”时$ListToCheckAgainst，它只是将第 2 列和第 3 列中指定的“下”和“上”界限分别存储在数组low和high中。除此之外，它会立即跳过处理到下一个输入行。
在处理要从中检查的列表时$ListToCheckFrom，它会扫描之前注册的所有范围，如果发现第 2 列在其中任何一个范围内，则打印它（并立即跳过处理到下一个输入行）。

如果您的数据存储在“物理”文件而不是 shell 变量中，您可以简单地使用文件名而不是进程替换作为命令行参数。

Ed Morton · Answer 2 · 2022-05-12T07:20:05+08:00

$ cat tst.sh
#!/usr/bin/env bash

ListToCheckFrom='C,2
C,22
C,12
hr,15'

ListToCheckAgainst='C1,25,50
hr1,22,30
r,12,18
C,15,44'

awk '
    BEGIN { FS="," }
    NR==FNR {
        begs2ends[$2] = $3
        next
    }
    {
        for ( beg in begs2ends ) {
            beg += 0
            end = begs2ends[beg]+0
            if ( (beg < $2) && ($2 < end) ) {
                print
                next
            }
        }
    }
' <(printf '%s\n' "$ListToCheckAgainst") <(printf '%s\n' "$ListToCheckFrom")

$ ./tst.sh
C,22
hr,15

使用 awk 检查一个变量中特定列上每一行中的数字与另一个变量中两个特定列中的所有行

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

使用 awk 检查一个变量中特定列上每一行中的数字与另一个变量中两个特定列中的所有行

2 个回答

相关问题