grep 从 $START 到 $END 的一组行并且在 $MIDDLE 中包含匹配项

Question

Asked: 2023-02-28 03:17:51 +0800 CST2023-02-28 03:17:51 +0800 CST 2023-02-28 03:17:51 +0800 CST

使用两个值都出现在不同的行上并每第 n 行重复一次来计算通过管道传输到 awk 的小数输入？

772

我在 macOS 系统上将输入通过管道传输到 awk。我想要两个十进制值的总和。每两行出现一个，另一个出现在每四行。我想要每五行的总和结果。这些值前面用冒号+空格分隔，后面用逗号分隔。每六行是空的。此模式重复直到输入结束。

BB: 728345643856359022, 
SH: 3560836, 
RJ: 1500369, 
DD: 1403849, 
Total:,

BB: 729586953244932948, 
SH: 8560836, 
RJ: 4700360, 
DD: 3403021, 
Total:,

BB: 821334125345384020, 
SH: 5293431, 
RJ: 2642499, 
DD: 2433292, 
Total:,

如果相关，which awk输出/usr/bin/awk和brew list --version输出gawk 5.2.1_1。这在 g/awk 中可能吗？任何建议表示赞赏！

要格式化我正在使用的输入：

getlist | awk '{print $1 $2}' \
| grep 'BB\|SH\|RJ\|DD' \
| sed 's/"//g' \
| awk '{print;} NR % 4 == 0 { print "Total:,";}' \
| awk '{print;} NR % 5 == 0 { print "";}' \
| awk '{print $1 $2}'

预期产出

BB: 728345643856359022, 
SH: 3560836, 
RJ: 1500369, 
DD: 1403849, 
Total: 4964685,

BB: 729586953244932948, 
SH: 8560836, 
RJ: 4700360, 
DD: 3403021, 
Total: 11963857,

BB: 821334125345384020, 
SH: 5293431, 
RJ: 2642499, 
DD: 2433292, 
Total: 7726723,

3 个回答

Voted

terdon · Answer 1 · 2023-02-28T04:01:45+08:00

首先，让我们稍微简化一下您的管道。我不知道getlist会产生什么输出，但根据您展示的内容，这将等同于不添加该行的微小更改，Total因为这只会使其更难解析，我们将在稍后添加它：

getlist | 
 tr -d '"' |
 awk '/BB|SH|RJ|DD/{print $1 $2}; NR % 5 == 0 { print ""}'

您可以在处换行|，不需要\ 。并且您可以将所有步骤合并为一个awk, 并使用trinstead ofsed简洁（并且可能速度虽然这里的差异很小）。

考虑到这一点，我们可以awk稍微扩展一下以获得剩余的部分：

getlist | 
 tr -d '",' |
 awk '/BB|SH|RJ|DD/{
        print $1 $2","; 
        if(/SH/){ sh = $2 } 
        if(/DD/){ printf "Total: %d,\n", sh + $2 }
      }
      NR % 5 == 0 { print ""}'

请注意，我添加,到要删除的字符中tr以方便数字运算（,不是数字），因此我还将它添加回printawk 的各种调用中。

万一我误解了，这里有一种方法可以使用原始管道中已有的输出来做同样的事情（我将您的示例保存为file）：

$ awk '{ 
         if(!/Total/){print; 
           if(/SH/){ sh = $2 } 
           if(/DD/){ val = sh + $2 }
         }
         else{
            print "Total:",val","
         }
        }' file
BB: 728345643856359022, 
SH: 3560836, 
RJ: 1500369, 
DD: 1403849, 
Total: 4964685,

BB: 729586953244932948, 
SH: 8560836, 
RJ: 4700360, 
DD: 3403021, 
Total: 11963857,

BB: 821334125345384020, 
SH: 5293431, 
RJ: 2642499, 
DD: 2433292, 
Total: 7726723,

Ed Morton · Answer 2 · 2023-02-28T04:56:47+08:00

任何时候你的数据中有标签值对，我发现最好先创建这些映射的数组（m[]如下），然后你可以通过使用关联名称索引数组来获取任何值。使用任何 awk：

$ awk -F': *' -v OFS=': ' '{m[$1]=$2} $1=="Total"{$2=(m["SH"] + m["DD"])","} 1' file
BB: 728345643856359022,
SH: 3560836,
RJ: 1500369,
DD: 1403849,
Total: 4964685,

BB: 729586953244932948,
SH: 8560836,
RJ: 4700360,
DD: 3403021,
Total: 11963857,

BB: 821334125345384020,
SH: 5293431,
RJ: 2642499,
DD: 2433292,
Total: 7726723,

steve · Answer 3 · 2023-02-28T03:58:26+08:00

这是一种方法，它采用您现有的输出并获得新的所需输出。此处适用于 gawk 5.1.0。

$ awk '/^SH/{a=$2}/^DD/{b=$2}/^Total/{$0="Total: "a+b","}1' input.txt
BB: 728345643856359022,
SH: 3560836,
RJ: 1500369,
DD: 1403849,
Total: 4964685,

BB: 729586953244932948,
SH: 8560836,
RJ: 4700360,
DD: 3403021,
Total: 11963857,

BB: 821334125345384020,
SH: 5293431,
RJ: 2642499,
DD: 2433292,
Total: 7726723,
$

使用两个值都出现在不同的行上并每第 n 行重复一次来计算通过管道传输到 awk 的小数输入？

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

使用两个值都出现在不同的行上并每第 n 行重复一次来计算通过管道传输到 awk 的小数输入？

3 个回答

相关问题