AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 412329
Accepted
Noah Goodrich
Noah Goodrich
Asked: 2017-12-22 10:03:04 +0800 CST2017-12-22 10:03:04 +0800 CST 2017-12-22 10:03:04 +0800 CST

使用 awk 打破时间戳并格式化

  • 772

对于这样的文件名:

fileLoad.xml2017-12-21_10_55_53-153.txt
otherFile.xml2017-12-20-11_23_01-87899.txt
someFile.xml2017-11-30-21_00_59-1.txt

我想要完成的awk是隔离文件名.xml,然后隔离和格式化时间戳以在 csv/数据库中使用。

我有以下内容:

NR==1 {
    fn=substr(FILENAME, 0, FILENAME-5);
    ts=fn;                                                                                                                                                                                                
    sub(/[0-9]{4}.*$/,"",fn);                                                                                      
    sub(/^\w+\.xml/,"",ts);
} {
     printf "fn\tts"
}

我可以从最后去掉'-',但之后我不知道如何在 awk 中将剩余的时间戳转换为2017-11-30 21:00:59.

awk text-formatting
  • 1 1 个回答
  • 363 Views

1 个回答

  • Voted
  1. Best Answer
    Lizardx
    2017-12-22T12:20:33+08:002017-12-22T12:20:33+08:00

    这行得通,虽然我个人不会为此使用 awk,但我会使用 gawk,它有一些重要的特性可以使这种精确的类型操作变得容易,gensub()..

    echo 'fileLoad.xml2017-12-21_10_55_53-153.txt
    otherFile.xml2017-12-20-11_23_01-87899.txt
    someFile.xml2017-11-30-21_00_59-1.txt' | awk '{
      gsub(/^.*\.xml|-[0-9]+\.txt/,"",$0);
      date=$0; 
      time=$0; 
      sub(/[-_][0-9]{2}_[0-9]{2}_[0-9]{2}$/,"",date); 
      sub(/^[0-9]{4}-[0-9]{2}-[0-9]{2}[-_]/,"",time);
      gsub(/_/,":",time);
      print date " "  time 
    }'
    2017-12-21 10:55:53
    2017-12-20 11:23:01
    2017-11-30 21:00:59
    

    由于您指定了 awk,因此这是一种方法,虽然有点基本。

    请注意,由于没有 gensub,我将 0 美元的价值转移给了两个持有者,所以我可以去掉一个的开头和另一个的结尾。

    如您所见,剥离初始启动器/结束器很容易,这样您就只剩下日期/时间数据来进一步处理了。

    使用 gawk 和 gensub 更容易。

    echo 'fileLoad.xml2017-12-21_10_55_53-153.txt
    otherFile.xml2017-12-20-11_23_01-87899.txt
    someFile.xml2017-11-30-21_00_59-1.txt' | gawk '{
      gsub(/^.*\.xml|-[0-9]+\.txt/,"",$0);
      datetime = gensub(/^([0-9-]{10})[-_]([0-9_]{8})$/,"\\1 \\2",1,$0);
      gsub(/_/,":",datetime);
      print datetime 
    }'
    2017-12-21 10:55:53
    2017-12-20 11:23:01
    2017-11-30 21:00:59
    

    请注意,开始/结束模式做同样的事情,一个采用实际模式并复制它,第二个只是说,给我前 10 个匹配到 [0-9-] 和最后 8 个匹配到 [0-9_] ,这取决于哪个更容易阅读。

    真正的问题是,如果您使用 Perl 来完成这项工作是否会更好。

    • 2

相关问题

  • 根据第一个逗号之前的匹配删除重复行数

  • 在另一个文件之后逐行追加行

  • 如何删除两行之间的单行

  • 重新排列字母并比较两个单词

  • 多行文件洗牌

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    JSON数组使用jq来bash变量

    • 4 个回答
  • Marko Smith

    日期可以为 GMT 时区格式化当前时间吗?[复制]

    • 2 个回答
  • Marko Smith

    bash + 通过 bash 脚本从文件中读取变量和值

    • 4 个回答
  • Marko Smith

    如何复制目录并在同一命令中重命名它?

    • 4 个回答
  • Marko Smith

    ssh 连接。X11 连接因身份验证错误而被拒绝

    • 3 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Marko Smith

    systemctl 命令在 RHEL 6 中不起作用

    • 3 个回答
  • Marko Smith

    rsync 端口 22 和 873 使用

    • 2 个回答
  • Marko Smith

    以 100% 的利用率捕捉 /dev/loop -- 没有可用空间

    • 1 个回答
  • Marko Smith

    jq 打印子对象中所有的键和值

    • 2 个回答
  • Martin Hope
    EHerman JSON数组使用jq来bash变量 2017-12-31 14:50:58 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Drux 日期可以为 GMT 时区格式化当前时间吗?[复制] 2017-12-26 11:35:07 +0800 CST
  • Martin Hope
    AllisonC 如何复制目录并在同一命令中重命名它? 2017-12-22 05:28:06 +0800 CST
  • Martin Hope
    Steve “root”用户的文件权限如何工作? 2017-12-22 02:46:01 +0800 CST
  • Martin Hope
    Bagas Sanjaya 为什么 Linux 使用 LF 作为换行符? 2017-12-20 05:48:21 +0800 CST
  • Martin Hope
    Cbhihe 将默认编辑器更改为 vim for _ sudo systemctl edit [unit-file] _ 2017-12-03 10:11:38 +0800 CST
  • Martin Hope
    showkey 如何下载软件包而不是使用 apt-get 命令安装它? 2017-12-03 02:15:02 +0800 CST
  • Martin Hope
    youxiao 为什么目录 /home、/usr、/var 等都具有相同的 inode 编号 (2)? 2017-12-02 05:33:41 +0800 CST
  • Martin Hope
    user223600 gpg —list-keys 命令在将私钥导入全新安装后输出 uid [未知] 2017-11-26 18:26:02 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve