从文本文件传递变量的奇怪问题

Question

Basil

Asked: 2021-12-12 23:57:59 +0800 CST2021-12-12 23:57:59 +0800 CST 2021-12-12 23:57:59 +0800 CST

如果数据可用，如何获取文件名

772

我的输入文件是file_1.txt, file_2.txt,file_3.txt等等。这些文件包含数据，例如

$ head log_file_reset_*.txt
==> file_1.txt <==
Test #1
data

Test #2
data

Test #3

Test #4
data

==> file_2.txt <==
Test #1

Test #2
data

Test #3

Test #4
data


==> file_3.txt <==
Test #1
data

Test #2
data

Test #3

Test #4

Test只有当Test输入文件中每个可用的数据是：

#!/bin/bash
#################################################################################################
CWD=$(pwd)


  for j in {1..5} 
  
      do
sed -n '
    /^Test #/ {
      s///
      =
      p
    }
    $=
  ' file_$j.txt \
| paste - - \
| awk -F '\t' '
    NR > 1 && $1 - prevLine > ($2 ? 2 : 0) {print prev} 
    {prevLine = $1; prev = $2}
  ' >> 1_val.txt

我从此代码中获得的输出存储在1_val.txt：

1_val.txt
1
2
4
2
4
1
2

我可以知道如何修改代码以获取列出的数据的文件名（只是数字）1_val.txt并将其存储在另一个名为的文件中2_val.txt吗？

预期输出：

2_val.txt
1
1
1
2
2
3
3

2 个回答

Voted

Ed Morton · Answer 1 · 2021-12-13T07:10:07+08:00

当你使用 awk 时，你永远不需要 sed。以下是您应该如何在每个 Unix 机器上使用任何 shell 中的任何 awk 来真正执行问题中的 shell 脚本所做的事情（我能说的最好）：

$ cat tst.awk
FNR==1 {
    testId = ""
}
testId != "" {
    if (NF) {
        print testId
    }
    testId = ""
}
sub(/^Test #/,"") {
    testId = $0
}

$ awk -f tst.awk file_*.txt
1
2
4
2
4
5
1
2

然后将上面的内容打印到 1 个输出文件并将文件编号打印到另一个文件就是这个调整：

$ cat tst.awk
FNR==1 {
    testId = ""
    split(FILENAME,f,/[_.]/)
    fileId = f[2]
}
testId != "" {
    if (NF) {
        print testId > "1_val.txt"
        print fileId > "2_val.txt"
    }
    testId = ""
}
sub(/^Test #/,"") {
    testId = $0
}

$ awk -f tst.awk file_*.txt

$ head *_val.txt
==> 1_val.txt <==
1
2
4
2
4
5
1
2

==> 2_val.txt <==
1
1
1
2
2
2
3
3

编辑以解决来自 OP 的以下评论：如果您不希望将上述 awk 脚本存储在单独的文件中，以下是如何在 shell 脚本中内联使用上述 awk 脚本：

$ cat tst.sh
#!/usr/bin/env bash

awk '
    FNR==1 {
        testId = ""
        split(FILENAME,f,/[_.]/)
        fileId = f[2]
    }
    testId != "" {
        if (NF) {
            print testId > "1_val.txt"
            print fileId > "2_val.txt"
        }
        testId = ""
    }
    sub(/^Test #/,"") {
        testId = $0
    }
' "${@:--}"

然后您将shell脚本称为：

$ ./tst.sh file_*.txt

guest_7 · Answer 2 · 2021-12-13T03:53:59+08:00

guest_7

2021-12-13T03:53:59+08:002021-12-13T03:53:59+08:00

如果你有 GNU sed，可以这样完成：

sed -nsE '
  /#/N;/\n./F
  s/.*#([0-9]+)\n.+/\1/w1_val.txt
' file_?*.txt |
sed '/\n/P;y/_./\n\n/;D' > 2_val.txt

head [12]_val.txt
==> 1_val.txt <==
1
2
4
2
4
1
2

==> 2_val.txt <==
1
1
1
2
2
3
3

分行：

调用没有自动打印 (-n) 选项的 sed，因为我们对快速打印模式不感兴趣，而只对文件名感兴趣。
使用单独的流 (-s) 选项调用 sed。通常 sed 将所有文件视为一个流。
假设数据行不能包含 # 字符，我们加入下一行并检查它是否为非空。在那种情况下，使用 F 命令打印当前文件名。
第二个 sed 打印 _ 和点之间的字符串。

1

如果数据可用，如何获取文件名

模块 i915 可能缺少固件 /lib/firmware/i915/*

无法获取 jessie backports 存储库

如何将 GPG 私钥和公钥导出到文件

我们如何运行存储在变量中的命令？

如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域？

dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

如何从 systemctl 服务日志中查看最新的 x 行

Nano - 跳转到文件末尾

grub 错误：你需要先加载内核

如何下载软件包而不是使用 apt-get 命令安装它？

如果数据可用，如何获取文件名

2 个回答

相关问题