如何查找和计算两个文件中 ID 列的匹配数据？

Question

d-b

Asked: 2024-05-29 02:35:42 +0800 CST2024-05-29 02:35:42 +0800 CST 2024-05-29 02:35:42 +0800 CST

wc 获取文件的字符数但排除每行和文件第一行的初始字符？

772

我有一些文本文件，看起来像这样：

Introduction and some meta data
[00:00.000 --> 00:04.380]  Lorem ipsum dolor sit amet, consectetur adipiscing elit.
[00:04.980 --> 00:07.200]  Sed mattis varius ligula vel egestas.

我想统计字符但排除第一行和时间戳，即只统计其中的字符Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed mattis varius ligula vel egestas.

时间戳的长度各不相同（也可能有小时，在上面的示例中只有分钟）。

我该怎么做呢？

2 个回答

Voted

Andy Dalton · Answer 1 · 2024-05-29T03:02:01+08:00

一种选择是将问题分解成多个部分，然后解决这些部分。

我将使用您的示例输入：

$ cat input
Introduction and some meta data
[00:00.000 --> 00:04.380]  Lorem ipsum dolor sit amet, consectetur adipiscing elit.
[00:04.980 --> 00:07.200]  Sed mattis varius ligula vel egestas.

我想跳过第一行

一种选择是使用tail：

$ tail -n +2 input
[00:00.000 --> 00:04.380]  Lorem ipsum dolor sit amet, consectetur adipiscing elit.
[00:04.980 --> 00:07.200]  Sed mattis varius ligula vel egestas.

意思-n +2是“打印从第 2 行开始的所有内容”

我想省略时间戳

一种选择是使用类似sed修剪它的东西：
```
$ tail -n +2 input | sed 's/^\[[^]]*]  //'
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Sed mattis varius ligula vel egestas.
```
该选项的sed意思是“替换以该开头的所有内容，后面[不跟任何内容（后跟两个空格）。”]] ]
我想获取字符数

现在解决了前两部分，获取字符数是一个简单的应用wc
```
$ tail -n +2 input | sed 's/^\[[^]]*]  //' | wc -m
95
```

user unknown · Answer 2 · 2024-05-29T08:39:52+08:00

user unknown

2024-05-29T08:39:52+08:002024-05-29T08:39:52+08:00

echo "Introduction and some meta data
[00:00.000 --> 00:04.380]  Lorem ipsum dolor sit amet, consectetur adipiscing elit.
[00:04.980 --> 00:07.200]  Sed mattis varius ligula vel egestas." | sed -r "1d; s/^[^]]+]//" | wc -m 
99

或者如果数据位于文件 FILE 中

sed -r "1d; s/^[^]]+]//" FILE | wc -m

-r 允许使用括号表达式和 +，无需伪装
1d 删除第一行。
的替补，锚定在行的开头，将所有直到结束括号的内容都替换为空。
wc -m 计算字符数

0

wc 获取文件的字符数但排除每行和文件第一行的初始字符？

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

wc 获取文件的字符数但排除每行和文件第一行的初始字符？

2 个回答

相关问题