Linux grep文件1中的内容在文件2中[重复]

Question

annahri

Asked: 2022-02-13 04:01:01 +0800 CST2022-02-13 04:01:01 +0800 CST 2022-02-13 04:01:01 +0800 CST

此 sed 语法不会删除空行

772

我有这个输入文件：

...
https://long-url/something?value1=999&something=xyz?value2=555
https://long-url/something?value1=534&something=xyz?value2=2312


https://long-url/something?value1=534&something=xyz?value2=233
https://long-url/something?value1=534
...

我想捕获 value1 和 value2 并将它们输出为 csv，并删除任何不匹配的行：

...
999,555
534,2312
534,233
...

我在捕获值方面没有问题，但我在删除任何不需要的行时遇到了问题：

sed 's/.*categoryid=\([0-9]*\).*courseid=\([0-9]*\).*/\1,\2/g;/^[^0-9]\+/d' input-file

基本上，/^[^0-9]\+/d它没有按预期工作。我在想它会删除任何不以任何数字开头的行，但相反，它给了我：

我的 sed 版本：sed (GNU sed) 4.7

3 个回答

Voted

they · Answer 1 · 2022-02-13T04:13:54+08:00

they

2022-02-13T04:13:54+08:002022-02-13T04:13:54+08:00

您的表达式^[^0-9]\+强制匹配至少一个非数字，这意味着空行不会匹配它，因为它们不包含非数字。

就个人而言，我会这样做：

sed -e '/.*categoryid=\([0-9]*\).*courseid=\([0-9]*\).*/!d' \
    -e 's//\1,\2/' input-file

这首先会删除所有与您的特定正则表达式不匹配的行（例如，空行）。第二个表达式执行替换。当使用空模式时（如第二个表达式中的替换），最近使用的模式将被重新使用。

请注意，您不需要/g在替换命令的末尾，因为您只希望每个输入行匹配一次模式。

3

Stewart · Answer 2 · 2022-02-13T04:49:01+08:00

Best Answer

Stewart

2022-02-13T04:49:01+08:002022-02-13T04:49:01+08:00

您正在使用替代品，然后是删除：

sed -e 's/.../.../g' -e '/.../d'

这有点不稳定，因为您/.../d可能会不小心匹配文件内容中的其他内容。

相反，我只会打印受替代品影响的行。这可以通过-n（默认情况下避免打印）来完成，然后添加p到行尾以打印匹配的行。这避免了第二个sed声明的需要。

sed -ne 's/.../.../gp'

我还将删除尾随g，因为每行不需要超过一个匹配项：

sed -ne 's/.../.../p'

结果是：

sed -ne 's/.*categoryid=\([0-9]*\).*courseid=\([0-9]*\).*/\1,\2/p' input-file

在行动：

$ sed -ne 's/.*value1=\([0-9]*\).*value2=\([0-9]*\).*/\1,\2/p' << EOF
https://long-url/something?value1=999&something=xyz?value2=555
https://long-url/something?value1=534&something=xyz?value2=2312


https://long-url/something?value1=534&something=xyz?value2=233
https://long-url/something?value1=534
EOF

输出

999,555
534,2312
534,233

3

choroba · Answer 3 · 2022-02-13T04:13:32+08:00

choroba

2022-02-13T04:13:32+08:002022-02-13T04:13:32+08:00

要匹配/^[^0-9]\+/，该行必须至少包含一个字符，即不能为空。

只是不要删除以数字开头的行：

/^[0-9]/!d

1

此 sed 语法不会删除空行

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

此 sed 语法不会删除空行

3 个回答

相关问题