AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 519203
Accepted
SHW
SHW
Asked: 2019-05-16 23:05:21 +0800 CST2019-05-16 23:05:21 +0800 CST 2019-05-16 23:05:21 +0800 CST

对文件的一部分进行排序

  • 772

是否可以在大文件中的两个字符串之间进行排序?

例如,当前文件为:

    0cf  Front Brake
    0d0  Rear Brake
    0ce  Handle Bars
HUT 03  VR Controls
    009  Vest
    001  Belt
    002  Body Suit
    020  Stereo Enable
    003  Flexor
    007  Hand Tracker
    004  Glove
    006  Head Mounted Display
    008  Oculometer
    00a  Animatronic Device
    000  Unidentified
    021  Display Enable
    005  Head Tracker
HUT 04  Sport Controls
    000  Unidentified
    002  Golf Club
    001  Baseball Bat

所需的输出如下:

    0ce  Handle Bars
    0cf  Front Brake
    0d0  Rear Brake
HUT 03  VR Controls
    000  Unidentified
    001  Belt
    002  Body Suit
    003  Flexor
    004  Glove
    005  Head Tracker
    006  Head Mounted Display
    007  Hand Tracker
    008  Oculometer
    009  Vest
    00a  Animatronic Device
    020  Stereo Enable
    021  Display Enable
HUT 04  Sport Controls
    000  Unidentified
    001  Baseball Bat
    002  Golf Club

在这里,HUT 03 VR Controls和HUT 04 Sports Controls部分进行了整理。

在给定的文件中,节标题以非空格字符开头,而节内容始终以空格或制表符开头。由于此文件有 100 多个部分,因此在脚本/命令中硬编码部分名称是不可行的

sort
  • 5 5 个回答
  • 714 Views

5 个回答

  • Voted
  1. Best Answer
    Stephen Kitt
    2019-05-16T23:56:45+08:002019-05-16T23:56:45+08:00

    在 Python 中:

    #!/usr/bin/python3
    
    with open("file.txt", "r") as ins:
        lines = []
        for line in ins:
            if line.startswith((" ", "\t")):
                lines.append(line)
            else:
                lines.sort()
                print(*lines, end = "", sep = "")
                print(line, end = "")
                lines = []
        lines.sort()
        print(*lines, end = "", sep = "")
    

    这会对所有部分(单独)进行排序,而不仅仅是两个特定行之间的部分。

    • 7
  2. Kusalananda
    2019-05-17T00:26:19+08:002019-05-17T00:26:19+08:00
    $ awk 'BEGIN { OFS="\t"; s=0 } /^[^[:blank:]]/ { print ++s "\b", $0; next } { print s, $0 }' file | sort -n | cut -f 2-
        0ce  Handle Bars
        0cf  Front Brake
        0d0  Rear Brake
    HUT 03  VR Controls
        000  Unidentified
        001  Belt
        002  Body Suit
        003  Flexor
        004  Glove
        005  Head Tracker
        006  Head Mounted Display
        007  Hand Tracker
        008  Oculometer
        009  Vest
        00a  Animatronic Device
        020  Stereo Enable
        021  Display Enable
    HUT 04  Sport Controls
        000  Unidentified
        001  Baseball Bat
        002  Golf Club
    

    这用于awk在与该行所在的部分相对应的每一行前面添加一个数字(和一个制表符分隔符)。对于节标题,我们添加一个数字后跟一个退格字符(仅因为退格在制表符之前排序)。然后我们在删除它们和添加的制表符分隔符之前简单地对这些数字的结果数据进行排序。

    通过在行首查找非空白字符来检测节标题。

    • 7
  3. jlliagre
    2019-05-17T00:13:01+08:002019-05-17T00:13:01+08:00

    为了好玩,这是一种使用以下方法对单个部分进行排序的方法ex:

    ex file <<%
    /HUT
    +1,/HUT/-1!sort
    w file.sorted
    q
    %
    
    • 6
  4. iruvar
    2019-05-17T09:12:59+08:002019-05-17T09:12:59+08:00

    你可以得到awk并sort合作完成工作。

    awk '
        /^[[:blank:]]/{print | "sort"; next}
        {close("sort"); print}; 
        END{close("sort")}
    ' file
    
    • 将每个内容行通过管道传输到sort
    • 遇到节标记时close调用;sort这会导致sort将其输出刷新到标准输出并退出
    • 打印部分标记
    • 节标记之后的内容行的新实例sort接管
    • 最后调用close以sort处理尾随内容
    • 3
  5. MarcDefiant
    2019-05-17T14:15:40+08:002019-05-17T14:15:40+08:00

    对于这样的任务,我经常发现编写脚本很乏味。vim如果只需要执行一次并且可能只需要几个文件,那么如果您打开文件并键入以下内容,则可以使用宏很好地完成:

    • GoFAKE SECTION<ESC>:在最后添加一个假部分,并确保它位于行首(您可能拥有cindent或autoindent启用)。这也是对最后一部分进行排序所必需的。
    • gg:返回到文件的开头,然后文件从一个部分开始向下一行j
    • qq: 开始录制宏来注册 q
    • v: 开始选择
    • /^\S\+<Enter>: 搜索下一节的开头
    • k: 上一行
    • :!sort<Enter: 对部分进行排序
    • nj: 转到下一节的第一个元素
    • q: 停止录制宏
    • @q: 重复宏
    • 100@@:重复宏几次(直到没有剩余部分)
    • dd:删除文件的最后一行(FAKE SECTION)

    您可能希望:set lazyredraw加快宏的执行速度。

    • 1

相关问题

  • 使用单个命令行命令,我将如何搜索数据库中的每个文本文件以找到 10 个最常用的单词?

  • 数字排序无法正确排序文件

  • 如何对文件中每个日期的行数进行排序?

  • 列出根据特定内容行排序的文件

  • 读取带有单词的文本文件及其出现次数和排序的打印输出

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve