AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 533277
Accepted
Philippos
Philippos
Asked: 2019-08-01 22:36:15 +0800 CST2019-08-01 22:36:15 +0800 CST 2019-08-01 22:36:15 +0800 CST

在没有 GNU -z 选项的情况下,如何在 sed 的一个缓冲区中处理整个文件?

  • 772

对于某些问题,例如在未知行数上匹配模式或“替换...的最后一次出现” -z,GNU的选项sed非常有用。我怎样才能实现同样的便携?

示例:我有一个文件

yellow, green,
blue, black, purple,
orange,
white, red, brown
are some colours

我想用 . 替换文件的最后一个逗号and。请注意,逗号在哪一行或该行中的哪个位置是未知的。使用 GNU sed,我可以做到

sed -z 's/\(.*\),/ \1 and/'

获得所需的输出

yellow, green,
blue, black, purple,
orange,
white, red and brown
are some colours

我怎样才能以可移植的方式做到这一点,这将与任何 POSIX 一起运行sed?

text-processing sed
  • 2 2 个回答
  • 935 Views

2 个回答

  • Voted
  1. Best Answer
    Philippos
    2019-08-01T22:36:15+08:002019-08-01T22:36:15+08:00

    在纯 POSIXsed中,您必须自己粘贴所有行。虽然有些人N在循环中执行此操作,但最简单的方法是使用以下模式附加到保持空间H;1h;$!d;x:

    • H将每一行附加到保持空间。不幸的是,附加第一行会在缓冲区的开头添加一个换行符,所以
    • 1h将覆盖第一行的保留空间以避免错误的换行符。
    • $!d将结束对除最后一行之外的所有行的处理。它们不需要打印,因为它们存储在容纳空间中
    • x将仅在最后一行之后执行(对于所有其他行,d确实停止了进一步的命令处理)并且它将x更改保持空间和模式空间,因此在此命令之后,收集在保持空间中的整个文件将在模式空间中,就像使用-zGNU 选项一样sed。当然你也可以使用g代替x,但这会产生大量的复制,所以x速度更快。

    因此,该示例的脚本将如下所示:

    sed 'H;1h;$!d;x;s/\(.*\),/\1 and/'
    

    请注意,处理这样的文件对于非常大的文件不是一个好主意,因为这将使用大量 RAM。

    • 2
  2. Ed Morton
    2019-08-03T18:29:22+08:002019-08-03T18:29:22+08:00

    sed 用于对单个字符串执行简单的 s/old/new,仅此而已。几乎任何时候你发现自己使用了除 s、g 和 p(带 -n)之外的结构,当然任何时候你发现自己在谈论“保持空间”时,你都在使用错误的工具。对于比 s/old/new 更复杂的任务,比如这个任务,你应该只使用 awk 来代替。以下将在任何 UNIX 机器上的任何 shell 中使用任何 awk 工作,不会将整个文件存储在内存中,并且如果/当您想对文本另外做任何其他事情时,调整它是微不足道的:

    $ cat tst.awk
    /,/ { printf "%s", prev; prev="" }
    { prev = prev $0 ORS }
    END {
        if ( match(prev,/.*,/) ) {
            prev = substr(prev,1,RLENGTH-1) " and" substr(prev,RLENGTH+1)
        }
        printf "%s", prev
    }
    
    $ awk -f tst.awk file
    yellow, green,
    blue, black, purple,
    orange,
    white, red and brown
    are some colours
    

    您可以在 awk 中更简单地完成这项工作,方法是将整个文件放入内存并编写这个神秘的符文:

    $ awk '{r=r$0 ORS} END{h=r;sub(/,[^,]+$/,"",h);sub(/.*,/,"",r);printf "%s and%s",h,r}' file
    yellow, green,
    blue, black, purple,
    orange,
    white, red and brown
    are some colours
    

    但关键是,与 sed 不同,您不必这样做。

    • 0

相关问题

  • 如何删除两行之间的单行

  • 重新排列字母并比较两个单词

  • 在awk中的两行之间减去相同的列

  • 多行文件洗牌

  • 如何更改字符大小写(从小到大,反之亦然)?同时[重复]

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve