(macOS Bash) 2个看似相同的字符串并不相等，仅通过“set -x”显示差异

Question

dancesWithCycles

Asked: 2024-09-03 16:31:33 +0800 CST2024-09-03 16:31:33 +0800 CST 2024-09-03 16:31:33 +0800 CST

如何从 CSV 文件中提取列，并根据提取和处理结果处理并创建 CSV 文件？

772

这是从源 CSV 文件中截取的片段。

%status,date,job,project,start,end,description
%
//,18.03.2021,sib,sib-dede,07:00,15:00,dede-mongo
%
//,11.06.2021,sib,sib-dede,07:00,15:00,dede-mongo
%
//,24.06.2021,sib,sib-dede,07:00,15:00,dede-mongo
%
?,02.08.2021,sib,sib-accounting,14:35,16:35,business-plan
%
?,13.10.2021,sb,sb-accounting,11:30,12:00,e-mail-pump

我喜欢从源 CSV 文件中提取第 5 列的开始时间和第 6 列的结束时间。

接下来，根据开始和结束时间，我喜欢以小时或分钟为单位处理持续时间（不介意）。

最后，我喜欢抓取源 CSV 文件，在现有的第 6 列和第 7 列之间插入一个带有处理持续时间的新列，并将此添加内容保存在结果 CSV 文件中。

有谁知道如何在 GNU Debian Linux 命令行上应对这一挑战吗？

我知道我可以cut从这样的 CSV 文件中指定列。

cut -d, -f5,6 < ./source.csv > ./result.csv

但是，我仍然缺少持续时间处理和结果 CVS 文件创建。

PS：我更喜欢 Bash。

PPS：有类似的相关问题，但我发现没有与此问题相关的问题。

2 个回答

Voted

pmf · Answer 1 · 2024-09-03T17:18:00+08:00

Best Answer

pmf

2024-09-03T17:18:00+08:002024-09-03T17:18:00+08:00

我偏爱 Bash

但是您可以一次性完成所有操作，例如使用mktimeGNU Awk（假设%样本中的符号（或后续换行符）只是一个拼写错误，并且第 6 列中的时间高于第 5 列中的时间，否则结果为负数）：

awk -F , -v OFS=, '{
  $8=$7; $7=(
    mktime(sprintf("0 0 0 %d %d 0", substr($6,1,2), substr($6,4,2))) - 
    mktime(sprintf("0 0 0 %d %d 0", substr($5,1,2), substr($5,4,2)))
  ) / 60; print
}' source.csv

1

Ed Morton · Answer 2 · 2024-09-03T20:56:25+08:00

假设：

时间戳都是同一天，因为您的输入中没有任何日期指示，因此没有可靠的方法来处理可能超过 24 小时的持续时间，
时间戳代表标准时间，因此不需要考虑夏令时而改变小时数，
你确实有几行，后面%跟着以//或?开头的行，并且
您还希望修改标题行以包含要diff添加的列的标题

然后使用任何 awk：

$ awk '
    BEGIN { FS=OFS="," }
    NF > 1 {
        if ( NR == 1 ) {
            diff = "diff"
        }
        else {
            split($5, b, ":")
            split($6, e, ":")
            beg = b[1]*60 + b[2]
            end = e[1]*60 + e[2]
            diff = end - beg
        }
        $6 = $6 OFS diff
        print
    }
' file
%status,date,job,project,start,end,diff,description
//,18.03.2021,sib,sib-dede,07:00,15:00,480,dede-mongo
//,11.06.2021,sib,sib-dede,07:00,15:00,480,dede-mongo
//,24.06.2021,sib,sib-dede,07:00,15:00,480,dede-mongo
?,02.08.2021,sib,sib-accounting,14:35,16:35,120,business-plan
?,13.10.2021,sb,sb-accounting,11:30,12:00,30,e-mail-pump

无需grep先运行 - 将 grep 管道传输到 awk 是一种反模式，请参阅https://porkmail.org/era/unix/award#grep。

如何从 CSV 文件中提取列，并根据提取和处理结果处理并创建 CSV 文件？

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏