AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / ubuntu / 问题 / 1201064
Accepted
saaga
saaga
Asked: 2020-01-07 08:25:47 +0800 CST2020-01-07 08:25:47 +0800 CST 2020-01-07 08:25:47 +0800 CST

在bash脚本中从csv中选择特定日期的行

  • 772

我有一个test.csv包含这些值的 CSV 文件:

A,table,20191229 16:41:58  
B,table2,20191222 16:41:58  
C,table3,20191223 16:40:58  
D,table4,20191228 16:41:58  
E,table5,20191227 16:41:58  
F,table6,20191226 16:40:58 

我只想选择星期几的那些行,日期是YYYYMMDD HH:MM:SS格式的。

scripts bash csv
  • 4 4 个回答
  • 2032 Views

4 个回答

  • Voted
  1. steeldriver
    2020-01-07T08:51:13+08:002020-01-07T08:51:13+08:00

    给定

    $ cat test.csv
    A,table,20191229 16:41:58
    B,table2,20191222 16:41:58
    C,table3,20191223 16:40:58
    D,table4,20191228 16:41:58
    E,table5,20191227 16:41:58
    F,table6,20191226 16:40:58
    

    然后使用米勒

    $ mlr --csvlite --implicit-csv-header --headerless-csv-output filter '
        strftime(strptime($3,"%Y%m%d %H:%M:%S"), "%w") == "0"
      ' test.csv
    A,table,20191229 16:41:58
    B,table2,20191222 16:41:58
    
    • 2
  2. Ictus
    2020-05-01T09:41:52+08:002020-05-01T09:41:52+08:00

    这个单线可以提供预期的结果以及通过管道使用扩展它的可能性:

    $ cat test.csv | (while read line; do day=$(date -d "$(echo $line|cut -d, -f3)" +%a); echo "$line,$day"; done;) | grep ',Sun$' | cut -d, -f1-3
    A,table,20191229 16:41:58
    B,table2,20191222 16:41:58
    

    主要逻辑 (while read line; do day=$(date -d "$(echo $line|cut -d, -f3)" +%a); echo "$line,$day"; done;) 类似于waltinator 的,但是,我不是在循环内过滤,而是连接星期几并允许进一步处理:

    $ cat test.csv | (while read line; do day=$(date -d "$(echo $line|cut -d, -f3)" +%a); echo "$line,$day"; done;) 
    A,table,20191229 16:41:58,Sun
    B,table2,20191222 16:41:58,Sun
    C,table3,20191223 16:40:58,Mon
    D,table4,20191228 16:41:58,Sat
    E,table5,20191227 16:41:58,Fri
    F,table6,20191226 16:40:58,Thu
    

    现在,您可以使用grep过滤,如果需要grep ',Sun$',包括不同的日子grep -E ',(Sun|Sat)$':

    $ cat test.csv | (while read line; do day=$(date -d "$(echo $line|cut -d, -f3)" +%a); echo "$line,$day"; done;) | grep -E ',(Sun|Sat)$'
    A,table,20191229 16:41:58,Sun
    B,table2,20191222 16:41:58,Sun
    D,table4,20191228 16:41:58,Sat
    

    最后,

    然后只选择 3 个原始字段cut -d, -f1-3(在这里您也可以自由更改):

    $ cat test.csv | (while read line; do day=$(date -d "$(echo $line|cut -d, -f3)" +%a); echo "$line,$day"; done;) | grep -E ',(Sun|Sat)$' | cut -d, -f1-3
    A,table,20191229 16:41:58
    B,table2,20191222 16:41:58
    D,table4,20191228 16:41:58
    
    • 2
  3. Best Answer
    waltinator
    2020-01-07T08:44:18+08:002020-01-07T08:44:18+08:00

    阅读man date,并执行以下操作:

    while read line ; do 
        echo "line=$line">&2
        din=$(echo "$line" | cut -d, -f3 | cut "-d " -f1)
        echo "din=$din">&2
        dayofweek=$(date --date=$din +%a)
        echo "dow=$dayofweek">&2
        if [[ "$dayofweek" = "Sun" ]] ; then  
          echo "$line"
        fi
    done <test.csv 2>/dev/null
    

    去掉final2>/dev/null就可以看到调试输出了。

    • 1
  4. user986805
    2020-05-01T12:33:08+08:002020-05-01T12:33:08+08:00

    使用 Sakamoto 的方法匹配多个工作日。

    #!/bin/bash
    
    #    64 32 16  8  4  2  1
    #     1  0  0  0  0  0  1 = 65 (Sat, Sun)
    # Sat ´  |  |  |  |  |  |
    # Fri ---´  |  |  |  |  |
    # Thu ------´  |  |  |  |
    # Wed ---------´  |  |  |
    # Tue ------------´  |  |
    # Mon ---------------´  |
    # Sun ------------------´
    
    a=(0 3 2 5 0 3 5 1 4 6 2 4)
    
    IFS=$'\n'
    for b in $(<test.csv); do
      ((c=10#${b:(-17):4})) # year
      ((d=10#${b:(-13):2})) # month
      ((e=10#${b:(-11):2})) # day
      (((1 << ((((c -= ((d < 3)))) + c / 4 - c / 100 + c / 400 + ${a[((d - 1))]} + e) % 7)) & 65)) && printf %s\\n "$b"
    done
    

    参考:

    • 星期几的确定
    • 坂本算法的正确性
    • 0

相关问题

  • 如何每 5 秒运行一次脚本?

  • 如何将必须从其自己的目录中运行的程序添加到面板或主菜单?

  • 如何编写 shell 脚本来安装应用程序列表?

  • Mac OS X Automator 的替代品?

  • 备份 bash 脚本未压缩其 tarball

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何运行 .sh 脚本?

    • 16 个回答
  • Marko Smith

    如何安装 .tar.gz(或 .tar.bz2)文件?

    • 14 个回答
  • Marko Smith

    如何列出所有已安装的软件包

    • 24 个回答
  • Marko Smith

    无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗?

    • 25 个回答
  • Martin Hope
    Flimm 如何在没有 sudo 的情况下使用 docker? 2014-06-07 00:17:43 +0800 CST
  • Martin Hope
    Ivan 如何列出所有已安装的软件包 2010-12-17 18:08:49 +0800 CST
  • Martin Hope
    La Ode Adam Saputra 无法锁定管理目录 (/var/lib/dpkg/) 是另一个进程在使用它吗? 2010-11-30 18:12:48 +0800 CST
  • Martin Hope
    David Barry 如何从命令行确定目录(文件夹)的总大小? 2010-08-06 10:20:23 +0800 CST
  • Martin Hope
    jfoucher “以下软件包已被保留:”为什么以及如何解决? 2010-08-01 13:59:22 +0800 CST
  • Martin Hope
    David Ashford 如何删除 PPA? 2010-07-30 01:09:42 +0800 CST

热门标签

10.10 10.04 gnome networking server command-line package-management software-recommendation sound xorg

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve