AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 133692
Accepted
Boaz
Boaz
Asked: 2010-04-20 00:53:25 +0800 CST2010-04-20 00:53:25 +0800 CST 2010-04-20 00:53:25 +0800 CST

如何在 Linux 中显示文本文件中的某些行?

  • 772

我想每个人都知道有用的 Linux 命令行实用程序head和tail. head允许您打印文件的前 X 行,tail执行相同但打印文件末尾。打印文件中间的好命令是什么?类似的东西middle --start 10000000 --count 20(打印第 10'000'000 行直到第 10'000'010 行)。

我正在寻找可以有效处理大文件的东西。我试过tail -n 10000000 | head 10了,速度太慢了。

linux command-line-interface tail sed
  • 11 11 个回答
  • 303512 Views

11 个回答

  • Voted
  1. Best Answer
    Dennis Williamson
    2010-04-20T01:11:59+08:002010-04-20T01:11:59+08:00
    sed -n '10000000,10000020p' filename
    

    您可能可以像这样加快速度:

    sed -n '10000000,10000020p; 10000021q' filename
    

    在这些命令中,该选项-n会导致sed“抑制模式空间的自动打印”。命令“p打印 [s] 当前模式空间”和q命令“立即退出 [s] sed 脚本而不处理任何输入......”引号来自sed man页面。

    顺便说一句,你的命令

    tail -n 10000000 filename | head -n 10
    

    从文件末尾的第 10 行开始,而您的“中间”命令似乎从开头的第 10 行开始,这相当于:

    head -n 10000010 filename | tail -n 10
    

    问题是对于具有可变长度行的未排序文件,任何进程都必须通过文件计数换行符。没有捷径可走。

    但是,如果文件已排序(例如,带有时间戳的日志文件)或具有固定长度的行,则您可以根据字节位置查找文件。在日志文件示例中,您可以像我在此处的 Python 脚本* 那样执行一定范围内的二进制搜索。在固定记录长度文件的情况下,这真的很容易。您只需linelength * linecount在文件中查找字符。

    * 我一直想发布对该脚本的另一个更新。也许我会在这些日子里解决它。

    • 137
  2. Dox
    2013-06-18T10:22:15+08:002013-06-18T10:22:15+08:00

    我发现了以下用途sed

    sed -n '10000000,+20p'  filename
    

    希望它对某人有用!

    • 35
  3. Dennis
    2014-05-24T04:11:40+08:002014-05-24T04:11:40+08:00

    这是我第一次在这里发帖!无论如何,这很容易。假设您想从名为 file.txt 的文件中提取第 8872 行。这是您的操作方法:

    cat -n 文件.txt | grep '^ *8872'

    现在的问题是在这之后找到 20 行。要做到这一点,你做

    cat -n 文件.txt | grep -A 20 '^ *8872'

    有关周围或之前的行,请参阅 grep 手册中的 -B 和 -C 标志。

    • 5
  4. Charles Stewart
    2010-04-20T07:08:25+08:002010-04-20T07:08:25+08:00

    丹尼斯的 sed 答案是要走的路。但是在 bash 下只使用 head & tail:

    中间 () { 头 -n $[ $1 + $2 ] | 尾 -n $2; }
    

    这会扫描前 $1+$2 行两次,因此比丹尼斯的回答差得多。但是你不需要记住所有那些 sed 字母来使用它......

    • 1
  5. newbie13
    2015-04-18T11:48:22+08:002015-04-18T11:48:22+08:00

    使用以下命令获取特定范围的行

    awk 'NR < 1220974{next}1;NR==1513793{exit}' debug.log | tee -a test.log
    

    这里 debug.log 是我的文件,其中缺少行,我曾经将行号从 1220974 到 1513793 的行打印到文件 test.log。希望它有助于捕捉线条的范围。

    • 1
  6. Peter V. Mørch
    2018-05-23T04:24:08+08:002018-05-23T04:24:08+08:00

    Perl 为王:

    perl -ne 'print if ($. == 10000000 .. $. == 10000020)' filename
    
    • 1
  7. shardan
    2014-05-24T04:58:30+08:002014-05-24T04:58:30+08:00

    红宝石单线版本。

    ruby -pe 'next unless $. > 10000000 && $. < 10000020' < filename.txt
    

    它可能对某人有用。Dennis 和 Dox 提供的 'sed' 解决方案非常好,即使它看起来更快。

    • 0
  8. Ajay
    2014-11-01T11:35:49+08:002014-11-01T11:35:49+08:00

    您可以使用“nl”。

    nl filename | grep <line_num>
    
    • 0
  9. Hrvoje Špoljar
    2014-11-01T14:02:45+08:002014-11-01T14:02:45+08:00

    例如,这个 awk 将打印 20 到 40 之间的行

    awk '{if ((NR > 20) && (NR < 40)) print $0}' /etc/passwd

    • 0
  10. Dagelf
    2016-03-24T05:36:43+08:002016-03-24T05:36:43+08:00

    如果您知道行号,假设您想从文件中获取第 1、3 和 5 行,例如 /etc/passwd:

    perl -e 'while(<>){if(++$l~~[1,3,5]){print}}' < /etc/passwd
    
    • 0

相关问题

  • 多操作系统环境的首选电子邮件客户端

  • 你最喜欢的 Linux 发行版是什么?[关闭]

  • 更改 PHP 的默认配置设置?

  • 保护新的 Ubuntu 服务器 [关闭]

  • (软)Ubuntu 7.10 上的 RAID 6,我应该迁移到 8.10 吗?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve