从文本文件传递变量的奇怪问题

Question

lolilaliaa

Asked: 2022-04-03 09:20:02 +0800 CST2022-04-03 09:20:02 +0800 CST 2022-04-03 09:20:02 +0800 CST

根据 Bash 中的输入进行评分

772

你能帮我吗？我有一个任务。我输入了一些带有数字的文本。例如：

beta     1
score   9
something   2
beta     4
something   1

我需要用相同的文本计算所有数字。我的输出将是：（以这种方式使用“：”）

beta:5
something:3
score:9

临时文件也可能有问题，我可以在其中保存我的分数。我需要mktemp在脚本完成后使用来删除它。请帮帮我，谢谢。

4 个回答

Voted

Kusalananda · Answer 1 · 2022-04-03T09:56:51+08:00

我将假设输入总是每行包含两个字段。

您可以使用 GNUdatamash实用程序对数据进行排序，按第一个字段对其进行分组，然后计算每个组的第二个字段的总和：

datamash -s -W --output-delimiter=: groupby 1 sum 2 <file

在这里，-s对输入进行排序，-W使实用程序将任何连续的空白字符视为字段分隔符，并将--output-delimiter=:输出分隔符设置为:字符。其余的告诉datamash按第一个字段分组并计算每个组的第二个字段的总和。

给定名为的文件中问题中的输入file，这将产生以下输出：

beta:5
score:9
something:3

您也可以通过任何其他方式解决此问题。最简单的计算解决方案是使用awk：

awk '{ sum[$1] += $2 } END { for (key in sum) printf "%s:%d\n", key, sum[key] }' file

在这里，我们使用关联数组 ,sum来保存第一个字段中每个字符串的总和。该END模块在输入结束时执行，并将计算的总和与字符串一起输出。

请注意，此解决方案还假设第一个字段是一个不包含空格字符的单词，如问题所示。

使用 shell 循环，从原始文件中读取已排序的行，每当遇到新的第一个字段时打印并重置第二个字段的总和：

unset -v prev

sort file |
{
        while read -r key value; do
                if [ "$key" != "${prev-$key}" ]; then
                        # prev is set and different from $key

                        printf '%s:%d\n' "$prev" "$sum"
                        sum=0
                fi

                prev=$key
                sum=$(( sum + value ))
        done

        if [ "${prev+set}" = set ]; then
                printf '%s:%d\n' "$prev" "$sum"
        fi
}

相关：为什么使用 shell 循环处理文本被认为是不好的做法？

Weihang Jian · Answer 2 · 2022-04-03T10:32:12+08:00

Weihang Jian

2022-04-03T10:32:12+08:002022-04-03T10:32:12+08:00

如果您正在处理大文件，请考虑使用sortandawk这样我们就不会分配巨大的数组来在 RAM 中存储键和值。

λ cat input.txt 
beta     1
score   9
something   2
beta     4
something   1

sort input.txt |
  awk -v OFS=: 'NR==1{ key=$1 }; NR>1&&$1!=key{ print key, sum; sum=0; key=$1 }; {sum+=$2} END{ print key, sum}'

beta:5
score:9
something:3

2

nezabudka · Answer 3 · 2022-04-05T00:36:32+08:00

nezabudka

2022-04-05T00:36:32+08:002022-04-05T00:36:32+08:00

#!/bin/bash
declare -i SECOND
while read first second; do
        if [ -z $FIRST ] || [ $first = $FIRST ]; then
                SECOND+=second
        else 
                echo $FIRST:$SECOND
                SECOND=second
        fi
        FIRST=$first
done < <(sort file)
echo $FIRST:$SECOND

通常我会写一个类似的空白，并在生产中将所有变量放在引号中。

0

Praveen Kumar BS · Answer 4 · 2022-04-04T22:41:37+08:00

Praveen Kumar BS

2022-04-04T22:41:37+08:002022-04-04T22:41:37+08:00

 for k in $(awk '{if(!seen[$1]++)print $1}' file.txt); do awk -v k="$k" 'BEGIN{sum=0}$0 ~ k {sum=sum+$2}END{print k,sum}' file.txt; done

输出

beta 5
score 9
something 3

-1

根据 Bash 中的输入进行评分

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

根据 Bash 中的输入进行评分

4 个回答

相关问题