过滤脚本输出并将其打印在屏幕上，同时将其重定向到文件中

Question

Asked: 2022-12-02 07:39:45 +0800 CST2022-12-02 07:39:45 +0800 CST 2022-12-02 07:39:45 +0800 CST

GNU Parallel --joblog 仅记录 for 循环中的第一行命令

772

我沿着这样的for循环使用 GNU Parallel：

for BAND in $(seq 1 "$BANDS") ;do
   # Do not extract, unscale and merge if the scaled map exists already!
   SCALED_MAP="era5_and_land_${VARIABLE}_${YEAR}_band_${BAND}_merged_scaled.nc"
   MERGED_MAP="era5_and_land_${VARIABLE}_${YEAR}_band_${BAND}_merged.nc"
   if [ ! -f "${SCALED_MAP+set}" ] ;then
       echo "log $LOG_FILE Action=Merge, Output=$MERGED_MAP, Pixel size=$OUTPUT_PIXEL_SIZE_X $OUTPUT_PIXEL_SIZE_Y, Timestamp=$(timestamp)"
       echo "gdalmerge_and_clean $VARIABLE $YEAR $BAND $OUTPUT_PIXEL_SIZE_X $OUTPUT_PIXEL_SIZE_Y"
   else
       echo "warning "Scaled map "$SCALED_MAP" exists already! Skipping merging.-""
   fi
done |parallel -j 20 --joblog "parallel.${JOB_CLUSTER_PROCESS}.log"
log "$LOG_FILE" "Action=Merge, End=$(timestamp)"

（记录：${JOB_CLUSTER_PROCESS}"HTCondor 给出的变量）。

在日志中，我只看到第一个命令的条目

echo "log $LOG_FILE Action=Merge, Output=$MERGED_MAP, Pixel >size=$OUTPUT_PIXEL_SIZE_X $OUTPUT_PIXEL_SIZE_Y, Timestamp=$(timestamp)"

这实际上是一种自定义方式，通过以下方式记录此循环期间的操作：

# tell what you are doing
function log {
    echo "${@: 2}" 2>&1 >> "$1" ;
}
export -f log

是否有可能获得第二行

echo "gdalmerge_and_clean $VARIABLE $YEAR $BAND $OUTPUT_PIXEL_SIZE_X >$OUTPUT_PIXEL_SIZE_Y"

仅或与第一个一起包含在由--joblog?创建的 .log 文件中

1 个回答

Voted

Ole Tange · Answer 1 · 2022-12-09T04:48:16+08:00

--joblog仅在作业完成时添加到作业日志。

您正在为 GNU Parallel 提供两项工作：

log ...
gdalmerge_and_clean ...

log快速完成并添加到作业日志中，但gdalmerge_and_clean可能需要更长的时间才能运行。

我认为你应该考虑将你的工作重写为一个函数并调用它：

doit() {
   BAND=$1
   # Do not extract, unscale and merge if the scaled map exists already!
   SCALED_MAP="era5_and_land_${VARIABLE}_${YEAR}_band_${BAND}_merged_scaled.nc"
   MERGED_MAP="era5_and_land_${VARIABLE}_${YEAR}_band_${BAND}_merged.nc"
   if [ ! -f "${SCALED_MAP+set}" ] ;then
       log $LOG_FILE Action=Merge, Output=$MERGED_MAP, Pixel size=$OUTPUT_PIXEL_SIZE_X $OUTPUT_PIXEL_SIZE_Y, Timestamp=$(timestamp)
       gdalmerge_and_clean $VARIABLE $YEAR $BAND $OUTPUT_PIXEL_SIZE_X $OUTPUT_PIXEL_SIZE_Y
   else
       warning "Scaled map "$SCALED_MAP" exists already! Skipping merging.-"
   fi
}
export -f doit

seq 1 "$BANDS" |
  parallel -j 20 --joblog "parallel.${JOB_CLUSTER_PROCESS}.log" doit {}
log "$LOG_FILE" "Action=Merge, End=$(timestamp)"

--dry-run如果 GNU Parallel 做了一些你不期望的事情，我建议你试试。它会告诉你它打算运行什么命令。

如果您阅读 GNU Parallel 2018 的第 1+2 章（https://www.lulu.com/shop/ole-tange/gnu-parallel-2018/paperback/product-23558902.html或下载地址：https ://doi.org/10.5281/zenodo.1146014 ）

只需不到 20 分钟的时间，您的命令行就会爱上它。

GNU Parallel --joblog 仅记录 for 循环中的第一行命令

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

GNU Parallel --joblog 仅记录 for 循环中的第一行命令

1 个回答

相关问题