AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 672890
Accepted
Aayush Jain
Aayush Jain
Asked: 2021-10-13 04:39:52 +0800 CST2021-10-13 04:39:52 +0800 CST 2021-10-13 04:39:52 +0800 CST

通过 bash 脚本在 CSV 文件中移动日期

  • 772

目前我有一个包含这样记录的文件:

D20211011,S0519,306668,1
D20211004,S1600,306668,1
D20211009,S1604,306668,1
D20211010,S1605,306668,1
D20211006,S1610,306668,1
D20211011,S1611,306668,1

假设当前日期是20211011,我只需要对日期小于当前日期的行应用转换,并且日期在过去的行应该更新为当前日期。

在上面共享的示例中,应该对第 2 到 5 行进行转换。

D20211004,S1600,306668,1 -> D20211011,S1600,306668,1
D20211009,S1604,306668,1 -> D20211011,S1604,306668,1
D20211010,S1605,306668,1 -> D20211011,S1605,306668,1
D20211006,S1610,306668,1 -> D20211011,S1610,306668,1
text-processing date
  • 5 5 个回答
  • 158 Views

5 个回答

  • Voted
  1. AdminBee
    2021-10-13T05:25:32+08:002021-10-13T05:25:32+08:00

    在您的情况下,您的优势是日期以 ISO 样式给出,这意味着它们可以被解释为整数值,并使用算术运算符(和)进行简单比较<,同时仍然产生正确的顺序。=>

    因此,您可以使用以下awk程序:

    awk -v cur="20211011" 'BEGIN{FS=OFS=","} {ldate=substr($1,2); if (ldate<cur) $1="D" cur} 1' input.csv
    

    当前日期定义为awk变量cur。一开始,输入和输出的字段分隔符设置为,。然后,对于每一行,行日期是通过从行的字段 1 中删除第一个字符来确定的。如果结果“整数”小于cur,则该字段将被 的串联D和 的内容覆盖cur。1规则块之外的看似“杂散”指示awk打印当前行,包括任何可能的修改。

    • 5
  2. Best Answer
    pLumo
    2021-10-13T05:25:23+08:002021-10-13T05:25:23+08:00

    尝试awk:

    awk -v today=$(date +%Y%m%d) '
        BEGIN{FS=OFS=","}
        substr($1,2)<today{$1="D"today;}
    1' file
    
    • -v today=$(date +%Y%m%d)使用当前日期设置变量。
    • BEGIN{FS=OFS=","}设置输入 ( FS) 和输出 ( OFS) 字段分隔符。
    • substr($1,2)<today从第一个字段中截取D并将其与当前日期进行比较。
    • $1="D"today;用当前日期替换第一个字段
    • 1总是评估为真,因此打印该行
    • 4
  3. Ed Morton
    2021-10-13T07:04:18+08:002021-10-13T07:04:18+08:00
    $ awk -v d='D20211011' 'BEGIN{FS=OFS=","} $1<d{$1=d} 1' file
    D20211011,S0519,306668,1
    D20211004,S1600,306668,1
    D20211009,S1604,306668,1
    D20211010,S1605,306668,1
    D20211006,S1610,306668,1
    D20211011,S1611,306668,1
    

    $ awk -v d="$(date +'D%Y%m%d')" 'BEGIN{FS=OFS=","} $1<d{$1=d} 1' file
    D20211012,S0519,306668,1
    D20211012,S1600,306668,1
    D20211012,S1604,306668,1
    D20211012,S1605,306668,1
    D20211012,S1610,306668,1
    D20211012,S1611,306668,1
    
    • 2
  4. guest_7
    2021-10-13T21:59:19+08:002021-10-13T21:59:19+08:00
    $ perl -sF, -pale 's/.*?,/$d,/ if $F[0] lt $d' -- -d="D20211011" ./file
    
    D20211011,S0519,306668,1
    D20211011,S1600,306668,1
    D20211011,S1604,306668,1
    D20211011,S1605,306668,1
    D20211011,S1610,306668,1
    D20211011,S1611,306668,1
    

    在扩展正则表达式模式下运行的 GNU sed 也可以获得所需的输出。日期比较是通过查看两个日期中第一个不匹配的 MSD 来完成的。

    n=$(printf '%d' {0..9})
    d=D20211011
    sed -En "/\n/ba
      s/.*/$d\n&\n$n/
      /^(.*)(.).*\n\1(.).*\n.*\2.*\3/D
      s/\n[^,]*//;:a;P
    " file
    
    • 1
  5. jubilatious1
    2021-10-15T08:21:34+08:002021-10-15T08:21:34+08:00

    使用 Raku(以前称为 Perl_6)

    raku -pe 's/ ^^ D <(\d*?)> \, /20211011/;'
    

    正如@StéphaneChazelas 在对您的 OP 的评论中指出的那样,尚不清楚“未来日期”是否会出现在您的第一列中。如果不是,那么一个简单的s///替换就足够了,这就是上面的 Raku 代码所完成的(替换它找到的所有日期数字,而不管数字< = >比较如何)。

    但是,如果您希望将第一列更新为基于数值< = >比较的值,则可以使用下面的 Raku 代码,该代码在操作符的替换部分执行包含 Raku 的三元运算符的块s///:

    raku -pe 'my Int $d=20211011; s/ ^^ D (\d*?) \, /D{$0 < $d ?? $d !! $0},/;'
    

    样本输入:

    D20211011,S0519,306668,1
    D20211004,S1600,306668,1
    D20211009,S1604,306668,1
    D20211010,S1605,306668,1
    D20211006,S1610,306668,1
    D20211011,S1611,306668,1
    

    示例输出(对于上述任一 Raku 代码示例):

    D20211011,S0519,306668,1
    D20211011,S1600,306668,1
    D20211011,S1604,306668,1
    D20211011,S1605,306668,1
    D20211011,S1610,306668,1
    D20211011,S1611,306668,1
    

    对于第二个 Raku 代码示例,请注意变量$d是类型约束的,Int以进一步检查正确性。正如@AdminBee 指出的那样,您很幸运,第一列包含可以与< = > 运算符进行比较的 ISO 日期,并且仍然给出正确的结果。

    关于上面 Raku 代码的(简单)第二行,您应该注意没有检查$0捕获以确保有效日期(例如,确保没有出现第 13 个月或第 32 天)。甚至没有代码可以排除不完整的日期(例如,没有年份的月/日)。

    OTOH,添加适当的日期验证检查应该相对容易,使用 Raku 的内置支持Date和DateTime对象(不需要额外的模块;示例和链接如下)。

    $ echo "2020-02-29" | raku -ne '.Date.raku.say'
    Date.new(2020,2,29)
    
    $ echo "2021-02-29" | raku -ne '.Date.raku.say'
    Day out of range. Is: 29, should be in 1..28
      in block <unit> at -e line 1
    

    https://docs.raku.org/language/temporal#index-entry-Date_and_time_functions
    https://raku.org

    • 0

相关问题

  • grep 从 $START 到 $END 的一组行并且在 $MIDDLE 中包含匹配项

  • 重新排列字母并比较两个单词

  • 在awk中的两行之间减去相同的列

  • 多行文件洗牌

  • 如何更改字符大小写(从小到大,反之亦然)?同时[重复]

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    模块 i915 可能缺少固件 /lib/firmware/i915/*

    • 3 个回答
  • Marko Smith

    无法获取 jessie backports 存储库

    • 4 个回答
  • Marko Smith

    如何将 GPG 私钥和公钥导出到文件

    • 4 个回答
  • Marko Smith

    我们如何运行存储在变量中的命令?

    • 5 个回答
  • Marko Smith

    如何配置 systemd-resolved 和 systemd-networkd 以使用本地 DNS 服务器来解析本地域和远程 DNS 服务器来解析远程域?

    • 3 个回答
  • Marko Smith

    dist-upgrade 后 Kali Linux 中的 apt-get update 错误 [重复]

    • 2 个回答
  • Marko Smith

    如何从 systemctl 服务日志中查看最新的 x 行

    • 5 个回答
  • Marko Smith

    Nano - 跳转到文件末尾

    • 8 个回答
  • Marko Smith

    grub 错误:你需要先加载内核

    • 4 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Martin Hope
    user12345 无法获取 jessie backports 存储库 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl 为什么大多数 systemd 示例都包含 WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky 如何将 GPG 私钥和公钥导出到文件 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll systemctl 状态显示:“状态:降级” 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim 我们如何运行存储在变量中的命令? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S 为什么 /dev/null 是一个文件?为什么它的功能不作为一个简单的程序来实现? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 如何从 systemctl 服务日志中查看最新的 x 行 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - 跳转到文件末尾 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla 为什么真假这么大? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve