AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 760448
Accepted
kjo
kjo
Asked: 2023-11-02 23:05:24 +0800 CST2023-11-02 23:05:24 +0800 CST 2023-11-02 23:05:24 +0800 CST

如何单次获取字节数和 sha1sum?

  • 772

我想获取命令输出的字节数和 sha1sum。

原则上,人们总是可以做这样的事情:

BYTES="$( somecommand | wc -c )"
DIGEST="$( somecommand | sha1sum | sed 's/ .*//' )"

...但是,对于我感兴趣的用例,somecommand相当耗时,并且会产生大量输出,所以我宁愿只调用它一次。

我想到的一种方法是这样的

evil() {
  {
    somecommand | \
      tee >( wc -c | sed 's/^/BYTES=/' ) | \
      sha1sum | \
      sed 's/ .*//; s/^/DIGEST=/'
  } 2>&1
}

eval "$( evil )"

...这似乎有效,但让我内心有点死了。

我想知道是否有更好(更稳健、更通用)的方法来将管道不同段的输出捕获到单独的变量中。

编辑:我目前正在解决的问题是bash,所以我最感兴趣的是这个 shell 的解决方案,但我也做了很多zsh编程,所以我对这些解决方案也有一些兴趣。

EDIT2:我尝试将 Stéphane Chazelas 的解决方案移植到bash,但它不太有效:

#!/bin/bash

cmd() {
    printf -- '%1000s'
}

bytes_and_checksum() {
    local IFS
    cmd | tee >(sha1sum > $1) | wc -c | read bytes || return
    read checksum rest_ignored < $1 || return
}

set -o pipefail
unset bytes checksum
bytes_and_checksum "$(mktemp)"
printf -- 'bytes=%s\n' $bytes
printf -- 'checksum=%s\n' $checksum

当我运行上面的脚本时,我得到的输出是

bytes=
checksum=96d89030c1473585f16ec7a52050b410e44dd332

的值checksum是正确的。bytes我不明白为什么没有设置的值。

EDIT3:好的,感谢@muru 的提示,我解决了问题:

#!/bin/bash

cmd() {
    printf -- '%1000s'
}

bytes_and_checksum() {
    local IFS
    read bytes < <( cmd | tee >(sha1sum > $1) | wc -c ) || return
    read checksum rest_ignored < $1 || return
}

set -o pipefail
unset bytes checksum
bytes_and_checksum "$(mktemp)"
printf -- 'bytes=%s\n' $bytes
printf -- 'checksum=%s\n' $checksum

现在:

bytes=1000
checksum=96d89030c1473585f16ec7a52050b410e44dd332

不幸的是...

...当产生的输出比上面的玩具示例中的情况多得多时,我的bytes_and_checksum函数就会停止(死锁?) 。cmd

回到绘图板...

bash
  • 2 2 个回答
  • 515 Views

2 个回答

  • Voted
  1. Best Answer
    Stéphane Chazelas
    2023-11-02T23:15:35+08:002023-11-02T23:15:35+08:00

    使用临时文件会更容易。在zsh:

    (){set -o localoptions -o pipefail; local IFS
      {cmd} > >(sha1sum > $1) | wc -c | read bytes || return
      read checksum rest_ignored < $1 || return
    } =()
    

    请注意,许多wc实现在其输出的数字周围包含空格。read默认值是$IFS剥离它们。

    请注意, 的退出状态sha1sum会丢失。

    创建临时文件时=()根本不输出任何内容。当提供给该临时文件的命令(此处为匿名函数)返回时,该临时文件将自动删除。

    在cmd > file | other-cmd,cmd的输出tee内部由 d 进行处理,zsh因为它被重定向了两次,所以这里都是 tosha1sum和 to wc。我们cmd进行包装{...}以确保 zsh 等待进程重定向完成。

    sha1sum这里作为两者的输出,wc保证不大于几个字节,它们也可以发送到管道,并且您不必同时从这些管道中读取(zsh 可以做到这一点,因为它有一个 / 的接口select(),poll()但是不是bash)。这可以按顺序完成,而不会导致死锁,因此它是tee 到不同变量的简单版本。

    在基于 Linux 的系统上(当管道的 fd 的行为类似于命名管道时)/dev/fd/x:x

    {
      IFS=$' \t' read bytes < <(cmd 3<&- | tee >(sha1sum > /dev/fd/3) | wc -c)
      IFS=$' \t' read sum rest <&3
    } 3< <(:)
    

    (甚至可以在 bash 中工作)。

    有关较大输出时遇到的死锁的详细信息,另请参阅tee + cat:多次使用输出,然后连接结果。

    • 7
  2. legolegs
    2023-11-03T16:26:38+08:002023-11-03T16:26:38+08:00

    我正在使用一个备份bash脚本,该脚本具有以下帮助程序“中间”函数,这些函数将“假定的文件名”作为参数(请参见下面的 tar.gz 示例):

    function pipesum
    {
      tee >(sha1sum | awk --assign F="${1##*/}" '$2=F' > "${1?}.sha1")
    }
    function pipelen
    {
      tee >(wc -c > "${1?}.len")
    }
    function pipesumlen
    {
      tee >(sha1sum | awk --assign F="${1##*/}" '$2=F' > "${1?}.sha1") >(wc -c > "${1?}.len")
    }
    function pipechecksum
    {
      tee >(sha1sum --quiet -c <(awk '$2="-"' "${1?}") >&2)
    }
    

    例子:

    $ echo 123 | pipesumlen filename
    123
    $ ls filename*
    filename.len  filename.sha1
    $ cat filename*
    4
    a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0 filename
    $ echo 123 | pipechecksum filename.sha1
    123
    $ echo 1234 | pipechecksum filename.sha1
    1234
    -: FAILED
    sha1sum: WARNING: 1 computed checksum did NOT match
    

    我在一个非常耗时、CPU 和 IO 消耗的脚本中使用它,如下所示:

    tar | 
      pipesumlen mybackup.tar | 
      gzip > mybackup.tar.gz
    <mybackup.tar.gz gunzip | 
      pipechecksum mybackup.tar.sha1 | 
      xz > mybackup.tar.xz
    

    因此,我根据随机内存/磁盘位翻转检查了我的备份。它创建“mybackup.tar.sha1”文件,就像实际创建“mybackup.tar”并进行校验和一样,而实际上在此示例中,未压缩的数据从未写入磁盘上。

    警告:pipechecksum即使出现错误,也不会终止脚本set -euo pipefail。pipechecksum在校验和不匹配时返回非零的替代方案:

    function pipechecksum
    {
      { tee /dev/fd/$N | sha1sum --quiet -c <(awk '$2="-"' filename.sha1) >&2; } {N}>&1
    }
    

    看起来不错,但我今天才带来它,还不能认为它已得到证实。

    • 2

相关问题

  • 通过命令的标准输出以编程方式导出环境变量[重复]

  • 从文本文件传递变量的奇怪问题

  • 虽然行读取保持转义空间?

  • `tee` 和 `bash` 进程替换顺序

  • 运行一个非常慢的脚本直到它成功

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve