Linux grep文件1中的内容在文件2中[重复]

Question

Asked: 2019-10-21 08:42:01 +0800 CST2019-10-21 08:42:01 +0800 CST 2019-10-21 08:42:01 +0800 CST

sed：删除非第一次出现的行和前行

772

这更好地与一个例子（是的，来自 .srt 文件）：

231
00:13:35,230 --> 00:13:37,120
- Oh, my sister got me into it.

232
00:13:37,129 --> 00:13:38,269
- Yeah?

233
00:13:37,129 --> 00:13:38,269
Is that her?

234
00:13:40,049 --> 00:13:41,090
- Yeah.

该线00:13:37,129 --> 00:13:38,269出现两次，我想连接这两个部分。所以它必须像这样工作：

检查所有包含“-->”的行
如果它与先前的此类发现相匹配，则删除此行和上面的两行

所以结果是：

231
00:13:35,230 --> 00:13:37,120
- Oh, my sister got me into it.

232
00:13:37,129 --> 00:13:38,269
- Yeah?
Is that her?

234
00:13:40,049 --> 00:13:41,090
- Yeah.

这远远超出了我的sed技能。它可能适用于内部缓冲区和模式空间？好吧，我什至不知道如何处理这个......

2 个回答

Voted

user309777 · Answer 1 · 2019-10-21T11:07:22+08:00

我会为此使用 awk ：

$ cat tst.awk
(!NF) {                # blank line
    b = ""; f = 1      # empty buffer, start buffering
}
/-->/ {                # timestamp
    f = 0              # stop buffering
    if (p == $0) {     # same timestamp
        next           # discard buffer, start over
    }
    p = $0             # save timestamp
    printf "%s", b     # print buffer
}
f {                    # buffering enabled
    b = (b $0 ORS)     # buffer line
    next               # start over
}
1                      # print line

输出：

$ awk -f tst.awk file
231
00:13:35,230 --> 00:13:37,120
- Oh, my sister got me into it.

232
00:13:37,129 --> 00:13:38,269
- Yeah?
Is that her?

234
00:13:40,049 --> 00:13:41,090
- Yeah.

Gyula Kokas · Answer 2 · 2019-10-21T12:05:44+08:00

我认为 awk 版本要好得多，但这里是一个 bash 版本，只是为了好玩 :)

out="";
while read line;
do
    if [ "$prevtime" != "$line" ];then
        out="${out}${line}\n";
    else
        out="$(echo -e "${out}"|head -n -2)\n";
    fi ;
    echo  "${line}" |grep -q  "\-\->" &&  prevtime=$line  ;
done <test.srt ; echo -e "$out"

sed：删除非第一次出现的行和前行

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

sed：删除非第一次出现的行和前行

2 个回答

相关问题