AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 786805
Accepted
Gao
Gao
Asked: 2024-11-18 19:36:04 +0800 CST2024-11-18 19:36:04 +0800 CST 2024-11-18 19:36:04 +0800 CST

如何打印 INI 文件中某些部分的所有键值对?

  • 772

INI 文件是 Firefox 的配置文件.ini。我想打印下面的所有内容,包括部分标题,其中是非负整数,每个部分之间用空行分隔。还有一个可选键,它与配置文件部分下的键不同,如果存在,我也想打印它。基本上,shell 脚本只是和之前(打印、以及可选的键和值),但如果添加或删除键,这将失败,并且grep 选项不可移植。[Profilen]nDefault[Install*]Defaultgrep -E 'Default=[^1]' profiles.inigrep -A4 '^\[Profile' profiles.iniNameIsRelativePathDefault-A

下面是我的一个 hack 解决方案,它既不是惯用的 AWK,也不是健壮的 AWK:

/^[[]Profile[0123456789]{1,}[]]$/ {
    print
    while ((getline) > 0) {
        if ($0 ~ /^$/) { # Should really break on new sections.
            print ""
            break
        } else {
            print
        }
    }
}
/^Default=/ {
    print # Default profile path given in the Install* section.
}

示例输入:

[Profile2]
Name=default-test
IsRelative=0
Path=/home/user/ffprofiles/f9bwn86n.default-test

[Profile1]
Name=default
IsRelative=1
Path=x64qf7nv.default
Default=1

[Profile0]
Name=default-release
IsRelative=1
Path=9hv1fbkk.default-release-3426201712696

[General]
StartWithLastProfile=1
Version=2

[Install22379532B4E49482]
Default=9hv1fbkk.default-release-3426201712696
Locked=1

示例输出:

[Profile2]
Name=default-test
IsRelative=0
Path=/home/user/ffprofiles/f9bwn86n.default-test

[Profile1]
Name=default
IsRelative=1
Path=x64qf7nv.default
Default=1

[Profile0]
Name=default-release
IsRelative=1
Path=9hv1fbkk.default-release-3426201712696

Default=9hv1fbkk.default-release-3426201712696

我怎样才能更简洁、更正确地做到这一点?解决方案实际上不必使用 AWK,但我认为 awk 比 sed 或任何其他 Unix 实用程序更适合这种情况。但是,解决方案必须是可移植的并且符合 POSIX 标准。提前谢谢您。

awk
  • 6 6 个回答
  • 501 Views

6 个回答

  • Voted
  1. grawity
    2024-11-18T20:37:55+08:002024-11-18T20:37:55+08:00

    awk 能够在不需要 getline() 的情况下保持行之间的状态。如果您需要基于 awk 的解决方案,最简单的方法是:

    cat profiles.ini | awk '
        /^\[/                 {ok=0}
        /^\[Install\]$/       {ok=1; header=$0}
        ok && /^Default=/     {print header; print}
    '
    cat profiles.ini | awk '
        /^\[/                 {ok=0}
        /^\[Profile[0-9]*\]$/ {ok=1}
        ok                    {print}
    '
    

    作为单个 awk 脚本,这可能会起作用:

    /^\[/                 {ok=0}
    /^\[Profile[0-9]*\]$/ {ok=1}
    /^\[Install\]$/       {ok=2; header=$0}
    ok==1                 {print}
    ok==2 && /^Default=/  {print header; print}
    

    总是保存标题并进行字符串比较可能会使其更清晰,但也可能产生相反的结果。(我根本没有测试过这个版本。)

    /^\[/                 {hdr=""}
    /^\[Profile[0-9]*\]$/ {hdr=$0}
    /^\[Install\]$/       {hdr=$0}
    hdr ~ /\[Profile/               {print}
    hdr ~ /\[Install/ && /Default=/ {print hdr; print}
    
    • 3
  2. Best Answer
    Ed Morton
    2024-11-18T23:16:25+08:002024-11-18T23:16:25+08:00

    使用任何 awk:

    $ awk '
        /^\[/ { sect = substr($0,2) }
        (sect ~ /^Profile/) || ( (sect ~ /^Install/) && /^Default=/ )
    ' profiles.ini
    [Profile2]
    Name=default-test
    IsRelative=0
    Path=/home/user/ffprofiles/f9bwn86n.default-test
    
    [Profile1]
    Name=default
    IsRelative=1
    Path=x64qf7nv.default
    Default=1
    
    [Profile0]
    Name=default-release
    IsRelative=1
    Path=9hv1fbkk.default-release-3426201712696
    
    Default=9hv1fbkk.default-release-3426201712696
    
    • 3
  3. Marcus Müller
    2024-11-18T19:59:31+08:002024-11-18T19:59:31+08:00

    您所描述的是一种具有上下文的结构化文本文件格式。

    awk可能(将)能够提取特定的部分,但它需要做出很多假设,这些假设不是基于文件格式的实际工作方式,而是基于您想到的具体示例的样子(从“简单”开始解决诸如“大写是否重要”之类的问题,到更有趣的事情,例如“我如何处理两个具有相同名称和重叠键的部分?”)。

    因此,不要使用awk或sed任何其他主要与上下文无关的解析器方法来解析 ini 文件之类的文件。请使用了解格式的解析器。

    顺便说一下,这里的格式是TOML 。

    您使用posix,这表示您可以使用 C99 编译器(这是与 一样 POSIX 的工具awk!)。因此,不要使用awk基于 的 TOML 解析器,而要使用成熟且运行良好的 TOML 库。toml-c是一个您可以直接将其作为头文件放在 .c 文件旁边的库。 该examples/目录有两个示例,您可以直接将其调整到您的用例;只需将其替换toml_parse(char*,…)为toml_parse_file(FILE*,…),然后打开您传递的文件argv[1];很简单。

    不会因为您认为 POSIX 实用程序是实现可移植性的途径而提供完整的 C99 解决方案 —— 坦率地说,遗憾的是事实并非如此;同一 POSIX 实用程序的不同实现在平台之间的不兼容性通常比 Python 解释器更严重,并且您预装的每个平台awk很可能也有一个python。

    说到 Python,它附带一个 toml 解析器,下面是您的 9 行脚本,包括使用帮助,用于打印给定部分的所有键/值。由于当您给它一个输入中不存在的部分名称时,它会出错并返回非零值,因此可以使用一个简单的 shell 循环来处理Profile0, Profile1... 直到ProfileN+1不再存在。更优雅的做法是实际在 Python 本身中执行此操作,但这留给读者作为示例,因为那将非常具体,而此工具更普遍有用:

    #!/usr/bin/env python3
    import tomllib
    from sys import argv, stdin, stderr, exit
    
    if len(argv != 2):
      stderr.print(f"USAGE: {argv[0]} SECTION-NAME < inputfile.ini\n")
      stderr.print(f"Prints all key/value pairs from a section in a INI\n")
      stderr.print(f"(or generally, TOML) file, separated by a sheep.\n")
      exit(127)
    
    ini = tomllib.load(stdin)
    section = ini[argv[1]]
    for key, value in section.items():
      print(f"{key} 🐑 {value}")
    
    • 2
  4. userene
    2024-11-19T02:36:21+08:002024-11-19T02:36:21+08:00

    只要您愿意一次提取一个密钥块,就可以使用单个 awk 命令。每个块的结尾很方便地是另一个 [key],或文件结尾。

    下面是提取 [Profile0] 的命令:

    $ awk '/^\[Profile0/{p=1; print; next} /^\[/{p=0}; p>0{print}' ini.txt 
    [Profile0]
    Name=default-release
    IsRelative=1
    Path=9hv1fbkk.default-release-3426201712696
    

    或者提取以 [General] 开头的块:

    $ awk '/^\[Gen/{p=1; print; next} /^\[/{p=0}; p>0{print}' ini.txt 
    [General]
    StartWithLastProfile=1
    Version=2
    

    在这些示例中,我使用了[Gen和[Profile0。请用您想要的 [key] 中足够的字符替换它们,以唯一地标识该块。

    文件 ini.txt 是您的输入,即:

    $ cat ini.txt 
    [Profile2]
    Name=default-test
    IsRelative=0
    Path=/home/user/ffprofiles/f9bwn86n.default-test
    
    [Profile1]
    Name=default
    IsRelative=1
    Path=x64qf7nv.default
    Default=1
    
    [Profile0]
    Name=default-release
    IsRelative=1
    Path=9hv1fbkk.default-release-3426201712696
    
    [General]
    StartWithLastProfile=1
    Version=2
    
    [Install22379532B4E49482]
    Default=9hv1fbkk.default-release-3426201712696
    Locked=1
    
    • 1
  5. Prabhjot Singh
    2024-11-19T17:28:03+08:002024-11-19T17:28:03+08:00

    使用awk:

    $ awk 'BEGIN{RS="";ORS="\n\n"} 
      /^\[Profile/; 
      /^\[Install/ && match($0,/\nDefault=[^[:space:]]+/){
        print substr($0,RSTART,RLENGTH)
       }' file
    
    • 0
  6. Kusalananda
    2024-11-19T23:40:14+08:002024-11-19T23:40:14+08:00

    以下两个命令可移植到任何能够运行Andrey Kislyuk 的无处不在的JSON 解析器的tomlq包装器jq的 Unix 系统,我相信这比可以运行 Firefox 的系统更广泛。

    我唯一的假设是,a 之后的任何字符串=已经是充分编码的 TOML 字符串(不带双引号)。

    首先,可以通过引用所有值将输入转换为标准 TOML 格式:

    sed 's/=\(.*\)/="\1"/' input
    

    然后我们可以提取以下Profile部分:

    sed 's/=\(.*\)/="\1"/' input |
    tomlq -t 'with_entries(select(.key | startswith("Profile")))'
    

    鉴于问题中的例子,这应该给我们

    [Profile2]
    Name = "default-test"
    IsRelative = "0"
    Path = "/home/user/ffprofiles/f9bwn86n.default-test"
    
    [Profile1]
    Name = "default"
    IsRelative = "1"
    Path = "x64qf7nv.default"
    Default = "1"
    
    [Profile0]
    Name = "default-release"
    IsRelative = "1"
    Path = "9hv1fbkk.default-release-3426201712696"
    

    如果您不喜欢等号周围的空格或添加的引号,请通过将输出传递过去来删除它们sed 's/ = "\(.*\)"/=\1/'。

    然后,我们可以单独获取该Install部分的Default值(如果存在):

    sed 's/=\(.*\)/="\1"/' input |
    tomlq -r 'with_entries(select((.key | startswith("Install")) and (.value | has("Default"))))[].Default'
    

    ...或者,如果你不介意为不存在的数据获取一个空行,那么

    sed 's/=\(.*\)/="\1"/' input |
    tomlq -r 'with_entries(select((.key | startswith("Install"))))[].Default'
    

    鉴于您的示例输入,这应该为您提供简单的值

    9hv1fbkk.default-release-3426201712696
    

    (我们不能将这两个命令结合起来,因为 TOML 不能在顶层表示非对象。)


    使用这种方法,您可以轻松提取具有与该部分的Path值相对应的值的部分(在示例中):InstallDefaultProfile0

    sed 's/=\(.*\)/="\1"/' input |
    tomlq -t 'with_entries(select(.key | startswith("Install")))[].Default as $default | map_values(select(.Path == $default))'
    
    • 0

相关问题

  • 根据第一个逗号之前的匹配删除重复行数

  • 在另一个文件之后逐行追加行

  • 如何删除两行之间的单行

  • 重新排列字母并比较两个单词

  • 多行文件洗牌

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve