根据第一个逗号之前的匹配删除重复行数

Question

Asked: 2023-02-25 06:07:24 +0800 CST2023-02-25 06:07:24 +0800 CST 2023-02-25 06:07:24 +0800 CST

用awk捕获三个区域

772

我希望能够使用正则表达式匹配文件中的以下行

## FAML [ASMB]

## FAML [ASMB] KYA

## FAML [ASMB] KYA,KYB

然后能够捕获的值FAML，ASMB以及逗号分隔的关键字的序列KYA,KYB。

用户提供FAML, ASMB, 以及他们想要匹配的任何关键字KYA,KYB等。

我在做

BEGIN {
  kw=".*" ; ebl="[[]" ; ebr="[]]" ; spc="[[:space:]]*"
  pn_ere = "^[[:space:]]*([#;!]+|@c|//)[[:space:]]+"
  fm = "%s(%s) %s(%s)%s(%s)%s$"
  beg_ere = sprintf(fm, pn_ere, faml, ebl, asmb, ebr, kw, spc)
}

$0 ~ beg_ere {
  fml = gensub(beg_ere, "\\2", 1, $0)
  asm = gensub(beg_ere, "\\3", 1, $0)
  kyw = gensub(beg_ere, "\\4", 1, $0)
 }

where(%s)用于捕获fml、asm和kyw出现在文件中以匹配faml、asmb和的任何用户输入kw。

##将在以双注释字符, ;;, !!, //,开头的注释部分中对源代码文件执行行匹配@c。

因此用户可以调用

awk -f densel -v faml="HD" -v asmb="OPCON" galex.el

例如，考虑一个 emacs lisp 文件galex.el。

;; HD [TEST]

(defun galex-insert (n)
  "Copy line N at current point.
N is the numeric prefix arg"
  (interactive "p")
  (save-excursion
    (goto-char (point-min))
    (forward-line (1- n))
    (kill-ring-save (line-beginning-position) (line-end-position))))

;; HD [OPCON]

(message "\nGALEX")

;; HD [OPCON] elisp,resource

(message "\nGALEX")

然后正则表达式将匹配行;; HD [OPCON]和;; HD [OPCON] elisp,resource。

如果用户指定

awk -f densel -v faml="HD" -v asmb="OPCON" -v kw="resource"  galex.el

只有以下行会匹配

;; HD [OPCON] elisp,resource

1 个回答

Voted

Ed Morton · Answer 1 · 2023-02-25T08:02:09+08:00

您的问题不清楚，但这可能是您想要做的（使用 GNU awk 作为第三个参数match()）：

$ cat tst.awk
BEGIN {
    re = "#+ ([^ ]+) ([[][^]]*]) *(.*)"
}
match($0,re,a) {
    for (i=1; i in a; i++) {
        print i, a[i]
    }
    print ""
}

$ awk -f tst.awk file
1 FAML
2 [ASMB]
3

1 FAML
2 [ASMB]
3 KYA

1 FAML
2 [ASMB]
3 KYA,KYB

显然，只需将您喜欢的任何变量分配给等的内容a[1]即可。

更改正则表达式以满足您的需要，这只是为了以最小的方式展示我认为的问题和解决方案，并向您展示如果/当您将来需要提出其他问题时如何创建一个最小可重现的示例。

请参阅match()https://www.gnu.org/software/gawk/manual/gawk.html#String-Functions了解该函数的作用。

用awk捕获三个区域

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

用awk捕获三个区域

1 个回答

相关问题