ip 命令是否支持通配符？

Question

Ismael Sanchez

Asked: 2025-03-03 10:21:30 +0800 CST2025-03-03 10:21:30 +0800 CST 2025-03-03 10:21:30 +0800 CST

如何计算 Unix 中分隔文件中的空白字段

772

来自以下脚本：

EmpID:Name:Designation:UnitName:Location:DateofJoining:Salary
1001:Thomson:SE:IVS:Mumbai:10-Feb-1999:60000
1002:Johnson:TE::Bangalore:18-Jun-2000:50000
1003:Jackson:DM:IMS:Hyderabad:23-Apr-1985:90000
1004:BobGL::ETA:Mumbai:05-Jan-2004:55000
1005:Alice:PA:::26-Aug-2014:25000
1006:LilySE::IVS:Bangalore:17-Dec-2015:40000
1007:Kirsten:PM:IMS:Mumbai:26-Aug-2014:45000
1004:BobGL::ETA:Mumbai:05-Jan-2021:55000

我想获取空格数（以 '::' 表示）。非常感谢您的支持。

5 个回答

Voted

Kusalananda · Answer 1 · 2025-03-03T14:47:30+08:00

Kusalananda

2025-03-03T14:47:30+08:002025-03-03T14:47:30+08:00

假设您想要计算冒号分隔的 CSV 文件中空字段的数量，我们可以使用Miller ( mlr)进行操作，如下所示：

$ mlr --csv --ifs colon put -q 'for (k,v in $*) { is_empty(v) { @count=@count+1 } } end { print @count }' file
6

由于 Miller 支持 CSV，因此它也能正确处理包含嵌入冒号的字段。例如，以下 CSV 有两个空字段（Designation和Salary）：

EmpID:Name:Designation:UnitName:Location:DateofJoining:Salary
1008:"Text::CSV"::"Team::Overseas":Stockholm:2025-03-03:

3

Fravadona · Answer 2 · 2025-03-03T23:03:02+08:00

Best Answer

Fravadona

2025-03-03T23:03:02+08:002025-03-03T23:03:02+08:00

你可以链接一些标准实用程序：

_{编辑：感谢@Kusalananda 提醒我们grep -c使用grep | wc -l}

<file.txt tr ':' '\n' | grep -c '^$'

或使用awk：

<file.txt awk -F: '{for (i=1; i<=NF; i++) n+=($i=="")} END {print n}'

也就是说，只要输入字段不包含任何LF或:字符。

1

Schmaehgrunza · Answer 3 · 2025-03-03T10:53:36+08:00

您想要一个纯 bash 解决方案吗？

awk 示例，它是 POSIX！

awk 'BEGIN { counter=0; } { text=$0; while (spaceI=index(text,"::")) { text=substr(text,spaceI+2); counter++; }} END { print counter; }' < your_file

或者

echo - n 'EmpID:Name:Designation:UnitName:Location:DateofJoining:Salary
1001:Thomson:SE:IVS:Mumbai:10-Feb-1999:60000
1002:Johnson:TE::Bangalore:18-Jun-2000:50000
1003:Jackson:DM:IMS:Hyderabad:23-Apr-1985:90000
1004:BobGL::ETA:Mumbai:05-Jan-2004:55000
1005:Alice:PA:::26-Aug-2014:25000
1006:LilySE::IVS:Bangalore:17-Dec-2015:40000
1007:Kirsten:PM:IMS:Mumbai:26-Aug-2014:45000
1004:BobGL::ETA:Mumbai:05-Jan-2021:55000' | awk 'BEGIN { counter=0; } { text=$0; while (spaceI=index(text,"::")) { text=substr(text,spaceI+2); counter++; }} END { print counter; }'

重击：

{ counter=0; while IFS= read -r line; do doIT=1; while ((doIT > 0)); do line_L=${#line}; line=${line#*::}; if ((line_L > ${#line})); then ((counter++)); else doIT=0; fi; done; done; echo -n "$counter" ; } < your_file

David G. · Answer 4 · 2025-03-03T11:46:00+08:00

这里有一个sed和wc实现，以及一个纯bash实现，以及调用两者的示例代码。我推荐前者。

#!/bin/bash

sedwc() {
    local v=( $( sed <$1 -e 's/^/:/;s/$/:/;s/[^:][^:]*/x/g;s/::/:y:/g;s/::/:y:/g;s/[x:]//g' | wc ) )
    echo $(( ${v[2]} - ${v[0]} ))
}

purebash() {
    local line count=0 mod
    while read line
    do
        while true
        do
            mod="${line/::/:}"
            [[ "$line" = "$mod" ]] && break
            : $(( count++ ))
            line="$mod"
        done
    done <"$1"
    echo $count
}

a=$( sedwc sample )
b=$( purebash sample )

echo sedwc = "$a" purebash = "$b"

您的输入格式暗示但您没有指定的一件事是，行首和行末可能会有空白条目。sedwc 实现通过在每行的开头和结尾添加一个额外的冒号来处理这些空白。如果这些空白不应计算在内，您可以删除文本s/^/:/;s/$/:/;。

我认为值得解释一下其sed wc实现方式：

命令	意义	示例内容
		1005：爱丽丝：PA:::2014 年 8 月 26 日：25000
s/^/:/;	添加额外的前导 :，以捕获第一个字段为空的情况	:1005:爱丽丝:PA:::2014 年 8 月 26 日:25000
s/$/:/;	添加额外的尾随 :，以捕获最后一个空字段	:1005:爱丽丝:PA:::2014 年 8 月 26 日:25000:
s/[^:][^:]*/x/g;	将所有非空字段的主体更改为“x”	：x：x：x：x：x：x：
s/::/:y:/g；	将其他所有空白字段更改为包含“y”	：x：x：x：y：：x：x：
s/::/:y:/g；	将其他空白字段更改为包含“y”	：x：x：x：y：y：x：x：
s/[x:]//g	消除所有“x”和“：”值，只留下“y”。	年年

wc然后输出总行数、总字数和总字符数。这可解释为：总记录数、包含任何空白的记录数以及总记录数加总空白数。然后进行一些简单的数学运算，输出总空白数。

jubilatious1 · Answer 5 · 2025-03-03T14:39:39+08:00

使用Raku（以前称为 Perl_6）

~$ BEGIN my $i; m:overlap/ [ ^ ":" || "::" || ":" $ ] { ++$i } /; END say $i;'    file

Raku 是 Perl 家族中的一种编程语言，如果您处理 Unicode/UTF-8 文件，它是一个不错的选择。

上面我们在命令行中使用类似 awk 的-ne非自动打印逐行标志调用 Raku。我们BEGIN通过声明一个计数器变量来实现$i。为了确保正确计数相邻的冒号，我们使用:overlap修饰符 (named-argument)。

示例输入：

EmpID:Name:Designation:UnitName:Location:DateofJoining:Salary
1001:Thomson:SE:IVS:Mumbai:10-Feb-1999:60000
1002:Johnson:TE::Bangalore:18-Jun-2000:50000
1003:Jackson:DM:IMS:Hyderabad:23-Apr-1985:90000
1004:BobGL::ETA:Mumbai:05-Jan-2004:55000
1005:Alice:PA:::26-Aug-2014:25000
1006:LilySE::IVS:Bangalore:17-Dec-2015:40000
1007:Kirsten:PM:IMS:Mumbai:26-Aug-2014:45000
1004:BobGL::ETA:Mumbai:05-Jan-2021:55000

示例输出：6

如果您想查看匹配项，只需添加一个say调用，++$并=>提供行号：

~$ raku -ne 'BEGIN my $i; say ++$, " => ",  m:overlap/ [ ^ ":" || "::" || ":" $ ] { ++$i } /; END say "total blank fields: $i";'  file
1 => ()
2 => ()
3 => (｢::｣)
4 => ()
5 => (｢::｣)
6 => (｢::｣ ｢::｣)
7 => (｢::｣)
8 => ()
9 => (｢::｣)
total blank fields: 6

https://raku.org

如何计算 Unix 中分隔文件中的空白字段

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

如何计算 Unix 中分隔文件中的空白字段

5 个回答

相关问题