多操作系统环境的首选电子邮件客户端

Question

Boaz

Asked: 2010-04-20 00:53:25 +0800 CST2010-04-20 00:53:25 +0800 CST 2010-04-20 00:53:25 +0800 CST

如何在 Linux 中显示文本文件中的某些行？

772

我想每个人都知道有用的 Linux 命令行实用程序head和tail. head允许您打印文件的前 X 行，tail执行相同但打印文件末尾。打印文件中间的好命令是什么？类似的东西middle --start 10000000 --count 20（打印第 10'000'000 行直到第 10'000'010 行）。

我正在寻找可以有效处理大文件的东西。我试过tail -n 10000000 | head 10了，速度太慢了。

11 个回答

Voted

Dennis Williamson · Answer 1 · 2010-04-20T01:11:59+08:00

sed -n '10000000,10000020p' filename

您可能可以像这样加快速度：

sed -n '10000000,10000020p; 10000021q' filename

在这些命令中，该选项-n会导致sed“抑制模式空间的自动打印”。命令“p打印 [s] 当前模式空间”和q命令“立即退出 [s] sed 脚本而不处理任何输入......”引号来自sed man页面。

顺便说一句，你的命令

tail -n 10000000 filename | head -n 10

从文件末尾的第 10 行开始，而您的“中间”命令似乎从开头的第 10 行开始，这相当于：

head -n 10000010 filename | tail -n 10

问题是对于具有可变长度行的未排序文件，任何进程都必须通过文件计数换行符。没有捷径可走。

但是，如果文件已排序（例如，带有时间戳的日志文件）或具有固定长度的行，则您可以根据字节位置查找文件。在日志文件示例中，您可以像我在此处的 Python 脚本* 那样执行一定范围内的二进制搜索。在固定记录长度文件的情况下，这真的很容易。您只需linelength * linecount在文件中查找字符。

^{* 我一直想发布对该脚本的另一个更新。也许我会在这些日子里解决它。}

Dox · Answer 2 · 2013-06-18T10:22:15+08:00

Dox

2013-06-18T10:22:15+08:002013-06-18T10:22:15+08:00

我发现了以下用途sed

sed -n '10000000,+20p'  filename

希望它对某人有用！

35

Dennis · Answer 3 · 2014-05-24T04:11:40+08:00

Dennis

2014-05-24T04:11:40+08:002014-05-24T04:11:40+08:00

这是我第一次在这里发帖！无论如何，这很容易。假设您想从名为 file.txt 的文件中提取第 8872 行。这是您的操作方法：

cat -n 文件.txt | grep '^ *8872'

现在的问题是在这之后找到 20 行。要做到这一点，你做

cat -n 文件.txt | grep -A 20 '^ *8872'

有关周围或之前的行，请参阅 grep 手册中的 -B 和 -C 标志。

5

Charles Stewart · Answer 4 · 2010-04-20T07:08:25+08:00

Charles Stewart

2010-04-20T07:08:25+08:002010-04-20T07:08:25+08:00

丹尼斯的 sed 答案是要走的路。但是在 bash 下只使用 head & tail：

中间 () { 头 -n $[ $1 + $2 ] | 尾 -n $2; }

这会扫描前 $1+$2 行两次，因此比丹尼斯的回答差得多。但是你不需要记住所有那些 sed 字母来使用它......

1

newbie13 · Answer 5 · 2015-04-18T11:48:22+08:00

newbie13

2015-04-18T11:48:22+08:002015-04-18T11:48:22+08:00

使用以下命令获取特定范围的行

awk 'NR < 1220974{next}1;NR==1513793{exit}' debug.log | tee -a test.log

这里 debug.log 是我的文件，其中缺少行，我曾经将行号从 1220974 到 1513793 的行打印到文件 test.log。希望它有助于捕捉线条的范围。

1

Peter V. Mørch · Answer 6 · 2018-05-23T04:24:08+08:00

Peter V. Mørch

2018-05-23T04:24:08+08:002018-05-23T04:24:08+08:00

Perl 为王：

perl -ne 'print if ($. == 10000000 .. $. == 10000020)' filename

1

shardan · Answer 7 · 2014-05-24T04:58:30+08:00

shardan

2014-05-24T04:58:30+08:002014-05-24T04:58:30+08:00

红宝石单线版本。

ruby -pe 'next unless $. > 10000000 && $. < 10000020' < filename.txt

它可能对某人有用。Dennis 和 Dox 提供的 'sed' 解决方案非常好，即使它看起来更快。

0

Ajay · Answer 8 · 2014-11-01T11:35:49+08:00

Ajay

2014-11-01T11:35:49+08:002014-11-01T11:35:49+08:00

您可以使用“nl”。

nl filename | grep <line_num>

0

Hrvoje Špoljar · Answer 9 · 2014-11-01T14:02:45+08:00

Hrvoje Špoljar

2014-11-01T14:02:45+08:002014-11-01T14:02:45+08:00

例如，这个 awk 将打印 20 到 40 之间的行

awk '{if ((NR > 20) && (NR < 40)) print $0}' /etc/passwd

0

Dagelf · Answer 10 · 2016-03-24T05:36:43+08:00

Dagelf

2016-03-24T05:36:43+08:002016-03-24T05:36:43+08:00

如果您知道行号，假设您想从文件中获取第 1、3 和 5 行，例如 /etc/passwd：

perl -e 'while(<>){if(++$l~~[1,3,5]){print}}' < /etc/passwd

0

如何在 Linux 中显示文本文件中的某些行？

新安装后 postgres 的默认超级用户用户名/密码是什么？

SFTP 使用什么端口？

从 IP 地址解析主机名

如何按大小对 du -h 输出进行排序

命令行列出 Windows Active Directory 组中的用户？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

如何在 Linux 中显示文本文件中的某些行？

11 个回答

相关问题