AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 719281
Accepted
DEKKER
DEKKER
Asked: 2022-10-01 04:20:46 +0800 CST2022-10-01 04:20:46 +0800 CST 2022-10-01 04:20:46 +0800 CST

将 bash 变量写入文件的最快方法

  • 772

我想为一些实验生成一些大文件。

这是我的脚本。它创建一个文件,然后将其读取到一个变量中,然后尝试将其写入文件中循环中定义的多次:

#! /usr/bin/env bash

set -e
set -u

< /dev/urandom tr -dc "\t\n [:alnum:]" | head -c32768 > temp.txt
data=$(cat ./temp.txt)

for testdir in "$@"; do
    echo "create directory '$testdir'"
    mkdir -p $testdir
    for i in {1..3}; do
        counter=$(printf %02d $i)
        testfile=$testdir/test_${testdir##*/}_$counter.txt
        echo "create file '$testfile'"
        echo "$data" > $testfile
    done
done

如果我尝试使用此脚本创建 3000 个文件(每个文件夹将有 3 个文件),则在我的系统上大约需要 19 秒:

时间 generateUserData.sh TEST{0..1000}

create directory 'TEST999'
create file 'TEST999/test_TEST999_01.txt'
create file 'TEST999/test_TEST999_02.txt'
create file 'TEST999/test_TEST999_03.txt'
create directory 'TEST1000'
create file 'TEST1000/test_TEST1000_01.txt'
create file 'TEST1000/test_TEST1000_02.txt'
create file 'TEST1000/test_TEST1000_03.txt'

real    0m19.333s
user    0m14.791s
sys     0m4.784s

我侦察echo可能是这里的缓慢部分。任何想法我怎样才能让他尽可能快?

bash shell-script
  • 2 2 个回答
  • 90 Views

2 个回答

  • Voted
  1. Best Answer
    Stéphane Chazelas
    2022-10-01T04:51:06+08:002022-10-01T04:51:06+08:00

    更慢的是分叉进程和执行外部命令,例如mkdir

    counter=$(printf %02d $i)
    

    还在 bash 中分叉了一个进程。这可以通过将其编写为来避免:

    printf -v counter %02d "$i"
    

    或者:

    printf -v testfile %s/%s_%02d.txt "$testdir" "${testdir##*/}" "$i"
    

    mkdir使用一次调用 ( mkdir -p -- "$@"; 不要忘记)创建所有目录,而不是每个文件--运行一个。mkdir

    也不需要临时文件:

    data=$(< /dev/urandom tr -dc "\t\n [:alnum:]" | head -c32768; echo .)
    data=${data%.}
    

    如果您想保证包含 32768 个字节,则添加.是必要的,因为命令替换会删除所有尾随换行符。另请注意,不加一回。应该使用而不是无论如何用于任意数据:$dataecho-nprintfecho

    还要注意head -c 32768给你 32768 字节,而不是字符,所以可以在中间剪切字符。

    printf %s "$data" > "$file"
    
    • 3
  2. bxm
    2022-10-01T05:37:29+08:002022-10-01T05:37:29+08:00

    接受Stéphane Chazelas在他们的精彩回答中所说的一些内容,并进行一些调整。

    #!/usr/bin/env bash
    
    set -e
    set -u
    
    main() {
      < /dev/urandom tr -dc "\t\n [:alnum:]" | dd iflag=fullblock of=./temp.txt bs=32K count=1
      mkdir -p -- "${@:?}"
      for testdir in "$@"; do
        for i in {1..3}; do
          printf "%s/%s_%02d.txt\n" "$testdir" "${testdir##*/}" "$i"
        done
      done | xargs -n1 -P${proc:-16} cp ./temp.txt
    }
    
    time main "${@}"
    
    
    • dd- 获取确切字节数的替代方法(尽管这种情况只发生一次,但无论哪种方式都不会产生太大影响)
    • 所有这些echo在我结束时增加了大约 3 秒,计数为 1000
    • 多线程,在运行时可调整(通过proc变量)——四处寻找适合您系统的最佳值

    例如

    proc=32 bash ./foo.sh {1..1000}
    

    注意 - 假设您关于填充变量的原始问题是XY 问题的一个实例......如果这是一个硬性要求,那么我的回答在书面上是无效的。

    这种改变应该做到这一点:

    data="$(< /dev/urandom tr -dc "\t\n [:alnum:]" | dd iflag=fullblock bs=32K count=1)"
    dd iflag=fullblock bs=32K count=1 of=./temp.txt <<<"${data}"
    

    第二个dd是确保我们只获得生成的数据,没有它,介于两者之间$( ),<<<我们似乎从某个地方找到了一个额外的字节(隐含的换行符?)。很高兴对此进行更正。我承认看起来有点麻烦,如果随机数据的大小是任意的或不重要的,你可以简化这个我敢肯定

    • 1

相关问题

  • 从文本文件传递变量的奇怪问题

  • 虽然行读取保持转义空间?

  • MySQL Select with function IN () with bash array

  • `tee` 和 `bash` 进程替换顺序

  • 运行一个非常慢的脚本直到它成功

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve