grep 从 $START 到 $END 的一组行并且在 $MIDDLE 中包含匹配项

Question

Teddy C

Asked: 2021-09-13 06:19:03 +0800 CST2021-09-13 06:19:03 +0800 CST 2021-09-13 06:19:03 +0800 CST

从文件中提取第一块连续匹配的行？

772

所以我有一个这样的文件：

echo 'this line is added for demo purpose'
echo 'do not extract this line and the line above'

#!/usr/bin/env bash
# header: add, replace, and delete header lines.
# 
# Example usage:
# $ seq 10 | header -a 'values'
# $ seq 10 | header -a 'VALUES' | header -e 'tr "[:upper:]" "[:lower:]"'
# $ seq 10 | header -a 'values' | header -d
# $ seq 10 | header -a 'multi\nline' | header -n 2 -e "paste -sd_"
#
# See also: body
#

# Author: http://jeroenjanssens.com

usage () {
cat << EOF
header: add, replace, and delete header lines.

usage: header OPTIONS

OPTIONS:
...
}

# i don't want
# these comments

# even if 
# these lines match

我想提取所有匹配 regex 的行^(#.*)|(\s*)$，从文件中匹配的第一行，连续到匹配的最后一行。

提取的期望结果应该是


#!/usr/bin/env bash
# header: add, replace, and delete header lines.
# 
# Example usage:
# $ seq 10 | header -a 'values'
# $ seq 10 | header -a 'VALUES' | header -e 'tr "[:upper:]" "[:lower:]"'
# $ seq 10 | header -a 'values' | header -d
# $ seq 10 | header -a 'multi\nline' | header -n 2 -e "paste -sd_"
#
# see also: body
#
# Author: http://jeroenjanssens.com

我该怎么做呢？

我想我可以在多行模式下用正则表达式提取所有连续匹配的行，但我只想要匹配的第一部分。

更新：

我想要正则表达式^(#.*)|(\s*)$匹配

行首带有 a#的注释
空行（如后面的那一行# Author）
行只包含空格

2 个回答

Voted

Sundeep · Answer 1 · 2021-09-13T21:35:47+08:00

Best Answer

Sundeep

2021-09-13T21:35:47+08:002021-09-13T21:35:47+08:00

与awk：

$ awk '/^#/{f=1} f && !/^#|^[[:space:]]*$/{exit} f' ip.txt
#!/usr/bin/env bash
# header: add, replace, and delete header lines.
# 
# Example usage:
# $ seq 10 | header -a 'values'
# $ seq 10 | header -a 'VALUES' | header -e 'tr "[:upper:]" "[:lower:]"'
# $ seq 10 | header -a 'values' | header -d
# $ seq 10 | header -a 'multi\nline' | header -n 2 -e "paste -sd_"
#
# See also: body
#

# Author: http://jeroenjanssens.com

这将在找到第一个注释时开始提取行，并继续打印，只要一行是注释或具有零个或多个空格的行。

1

nezabudka · Answer 2 · 2021-09-13T22:32:23+08:00

nezabudka

2021-09-13T22:32:23+08:002021-09-13T22:32:23+08:00

GNU sed。没有尾随空格：

sed '/^#/,$!d;:1;/^\s*$/N;/\S/!b1;/^#/M!Q' file

/^#/,$!d- 在评论开始前截断行。
:1;/^\s*$/N;/\S/!b1- 如果有空行或只有空格，则添加到缓冲区（模式空间）。
/^#/M!Q'- 如果遇到不以注释标记开头的行，则退出脚本（M- 锚在多行缓冲区中有效）。

带有尾随空格：

sed '/^#/,$!d;/^#\|^\s*$/!Q' file

1

从文件中提取第一块连续匹配的行？

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

从文件中提取第一块连续匹配的行？

2 个回答

相关问题