AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 769898
Accepted
Olivier Dulac
Olivier Dulac
Asked: 2024-02-23 00:14:17 +0800 CST2024-02-23 00:14:17 +0800 CST 2024-02-23 00:14:17 +0800 CST

awk(和 gawk):当 N 个输入文件中有 1 个不可读时如何避免致命错误

  • 772

测试用例:(使用非 root 用户,因为 root 会忽略 000 权限...)

#in a clean directory:
[ -f file_1 ] && chmod 600 file_? # for repeat tests...
for i in file_1 file_2 file_3; do
    printf 'A\nB\n' > "$i" 
    # we need at least 1 char : awk/gawk silently skips empty files...
done
chmod 000 file_2
awk '(FNR==1) { print FILENAME }' file_? 
  # tried with : regular (old unixes) awk on AIX. and gawk on Linux.
  # the fatal "permission denied" on file_2 stops [g]awk.

有没有办法捕获该致命错误并继续处理下一个文件?

(否则我觉得这很令人担忧:对一堆文件使用 awk 并不能保证处理所有文件,因为如果其中任何一个文件不可读,它将致命地退出)

如果可以的话请:回答

  • 对于常规 awk,
  • 和傻瓜
  • 还有其他相关的 awk 版本吗?(诺克?等)
awk
  • 2 2 个回答
  • 380 Views

2 个回答

  • Voted
  1. Stephen Kitt
    2024-02-23T00:29:49+08:002024-02-23T00:29:49+08:00

    与 GAWK 一起:

    gawk 'BEGINFILE { if (ERRNO) nextfile } (FNR==1) { print FILENAME }' file_?
    

    如果文件成功打开,则BEGINFILE块中为空,可用于跳到下一个并避免因错误而退出。ERRNOnextfile

    我认为 AWK 的其他实现不支持这一点。

    可移植的是,您可以迭代所有参数,检查它们是否指向不可读的文件,如果是,则在 AWK 开始处理它们之前将它们从参数中删除;GAWK 手册有一个示例实现。然而,这是很危险的,因为使用此循环检查的文件可能在 AWK 开始处理它之前变得不可读(反之亦然)。

    • 9
  2. Best Answer
    Ed Morton
    2024-02-23T06:27:59+08:002024-02-23T06:27:59+08:00

    正如 @StephenKitt 和 @ilkkachu 已经指出的那样,gawk 手册包含一些代码,这些代码将从ARGV[]该BEGIN部分中删除不可读的文件,但在测试文件和 awk 实际尝试读取其内容之间存在竞争条件,这可能会很多如果前面的文件很大,请稍后再执行。

    如果您有 gawk 或 gawk 手册中的脚本,我会使用 @StephenKitt 的答案中的脚本,否则除非您确实认为可能存在竞争条件问题,因为 gawk 手册脚本更清晰、更简短、更简单、更高效等。比下面的要好,不需要临时文件和全局变量,但对于那些担心竞争条件的人来说 - 这是一个更复杂的脚本,可以在任何 awk 中工作,并依赖于创建一个临时文件以在尝试之前立即打开打开任何真实文件,然后测试即将到来的真实文件是否可读。

    $ cat skip.awk
    function addTmp(        cmd, oArgv, i, j) {
        cmd = "mktemp"
        cmd | getline TmpChkFile
        close(cmd)
    
        if ( TmpChkFile != "" ) {
            print "" > TmpChkFile
            close(TmpChkFile)
    
            for (i in ARGV) {
                oArgv[i] = ARGV[i]
            }
            oArgc = ARGC
    
            ARGC = 1
            for (i = 1; i < oArgc; i++) {
                if ( ! (oArgv[i] ~ /^[a-zA-Z_][a-zA-Z0-9_]*=.*/ \
                        || oArgv[i] == "-" || oArgv[i] == "/dev/stdin") ) {
                    # not assignment or standard input so a file name
                    ARGV[ARGC] = TmpChkFile
                    ArgFileNames[++j] = oArgv[i]
                    ArgFileIndices[j] = ++ARGC
                }
                ARGV[ARGC++] = oArgv[i]
            }
        }
    }
    
    function rmvTmp() {
        system("rm -f \047" TmpChkFile "\047")
    }
    
    function chkTmp(        stderr, line) {
        if ( (FNR == 1) && (FILENAME == TmpChkFile) ) {
            ++TmpFileNr
            if ( (getline line < ArgFileNames[TmpFileNr]) < 0 ) {
                stderr = "cat>&2"
                printf "Warning: skipping unreadable file \"%s\"\n", ArgFileNames[TmpFileNr] | stderr
                close(stderr)
                delete ARGV[ArgFileIndices[TmpFileNr]]
            }
            close(ArgFileNames[TmpFileNr])
            next
        }
    }
    
    BEGIN { addTmp() }
    END { rmvTmp() }
    { chkTmp() }
    

    如果您的 awk 支持多个-f参数(例如POSIX的要求)或同时执行多个脚本的任何其他方式(例如 GNU awk 有@include),那么您可以使用该方法将上述内容与您的实际脚本一起包含(否则复制/粘贴上面到同一个文件中),例如假设您有一个如下脚本:

    $ cat tst.awk
    FNR == 1 { print FILENAME, $0 }
    

    和文件如:

    $ ls file_{1..3}
    ls: cannot access 'file_2': No such file or directory
    file_1  file_3
    

    然后使用任何 POSIX awk(以及大多数(如果不是全部)其他),您可以执行以下操作:

    $ awk -f skip.awk -f tst.awk file_{1..3}
    file_1 A
    Warning: skipping unreadable file "file_2"
    file_3 C
    

    上面的大部分工作都是在BEGIN第一个输入文件打开之前调用一次,以确保ARGV[]每个实际输入文件之前都存在一个可读的临时文件,然后chkTmp()为每一行输入调用,但仅在它是第一个输入时才执行某些操作(也是唯一)临时文件的行,并且尝试打开ARGV[]. 然后END只需删除临时文件。因此,真正的额外开销是对每个输入行的调用chkTmp()和测试FNR==1。

    我正在创建一个临时文件而不是使用现有文件,因为没有任何文件可以保证在所有 Unix 机器上都存在,即使有,它也必须正好 1 行长,以避免增加额外的开销chkTmp()必须读取该文件的每一行,因为并非所有 awks 都支持nextfile(或者我们可以调用它而不是nextinside chkTmp())。

    • 3

相关问题

  • 根据第一个逗号之前的匹配删除重复行数

  • 在另一个文件之后逐行追加行

  • 如何删除两行之间的单行

  • 重新排列字母并比较两个单词

  • 多行文件洗牌

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve