AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / unix / 问题 / 409085
Accepted
WashichawbachaW
WashichawbachaW
Asked: 2017-12-06 19:02:20 +0800 CST2017-12-06 19:02:20 +0800 CST 2017-12-06 19:02:20 +0800 CST

文本处理 - 如何对具有来自不同目录的重复文件名的查找输出进行唯一排序?

  • 772

我想在任何目录中对 find 命令的输出进行唯一排序,而不需要重复的文件名。

find /path/to/first_directory/* /path/to/second_directory/* /path/to/third_directory/* -mtime -1 -name "filename_pattern*"

示例输出:

/path/to/first_directory/sample_file1_2017Dec25.dat
/path/to/first_directory/sample_file2_2017Nov01.dat
/path/to/first_directory/sample_file3_2017Oct08.dat
/path/to/first_directory/archive/sample_file1_2017Dec25.dat.Z
/path/to/first_directory/archive/sample_file2_2017Nov01.dat.Z
/path/to/second_directory/sample_file4_2017Sep11.dat
/path/to/second_directory/sample_file5_2017Oct05.dat
/path/to/third_directory/sample_file1_2017Dec25.dat
/path/to/third_directory/sample_file2_2017Nov01.dat
/path/to/third_directory/sample_file3_2017Oct08.dat
/path/to/third_directory/sample_file4_2017Sep11.dat
/path/to/third_directory/sample_file5_2017Oct05.dat
/path/to/third_directory/sample_file6_2017July04.dat
/path/to/third_directory/sample_file6_2017June12.dat
/path/to/third_directory/sample_file7_2017May01.dat

从输出中您可以看到 and 中有重复的文件名,/first_directory/并且/first_directory/archive/所有文件都来自/first_directory/*and/second_directory/*也在 inside 中/third_directory/*。意思就是说/third_directory/*是和中找到的所有文件的归档目录,/first_directory/*但/second_directory/*也有只能在/third_directory/*( check sample_file6and sample_file7)中找到的文件

我想要打印的是按此顺序从/first_directory/到/first_directory/archive/到/second_directory/到的文件/third_directory/,没有重复,并且还按日期排序。

期望的输出:

/path/to/first_directory/sample_file1_2017Dec25.dat
/path/to/first_directory/sample_file2_2017Nov01.dat
/path/to/first_directory/sample_file3_2017Oct08.dat
/path/to/second_directory/sample_file4_2017Sep11.dat
/path/to/second_directory/sample_file5_2017Oct05.dat
/path/to/third_directory/sample_file6_2017July04.dat
/path/to/third_directory/sample_file6_2017June12.dat
/path/to/third_directory/sample_file7_2017May01.dat
text-processing find
  • 1 1 个回答
  • 274 Views

1 个回答

  • Voted
  1. Best Answer
    John1024
    2017-12-06T19:17:31+08:002017-12-06T19:17:31+08:00

    如果您的 find 命令的输出保存在名为 的文件中filelist,请尝试:

    $ awk -F/ '{f=$NF; sub(/\.Z$/,"",f)} !a[f]++' filelist
    /path/to/first_directory/sample_file1_2017Dec25.dat
    /path/to/first_directory/sample_file2_2017Nov01.dat
    /path/to/first_directory/sample_file3_2017Oct08.dat
    /path/to/second_directory/sample_file4_2017Sep11.dat
    /path/to/second_directory/sample_file5_2017Oct05.dat
    /path/to/third_directory/sample_file6_2017July04.dat
    /path/to/third_directory/sample_file6_2017June12.dat
    /path/to/third_directory/sample_file7_2017May01.dat
    

    如果你想在不创建文件的情况下做同样的事情:

    find /path/to/first_directory/* /path/to/second_directory/* /path/to/third_directory/* -mtime -1 -name "filename_pattern*" | awk -F/ '{f=$NF; sub(/\.Z$/,"",f)} !a[f]++'
    

    或者,您更喜欢将命令分散到多行中,使用:

    find /path/to/first_directory/* /path/to/second_directory/* \
      /path/to/third_directory/* -mtime -1 -name "filename_pattern*" |
        awk -F/ '{f=$NF; sub(/\.Z$/,"",f)} !a[f]++'
    

    我们添加\到第一行末尾的地方,因为那是 bash 的行继续字符。因为第二行以 结尾|,所以不需要续行符。

    这个怎么运作

    find首先,按照您的优先顺序在命令中列出目录很重要。我看到你已经这样做了。

    1. -F/

      这告诉 awk/用作字段分隔符。这意味着文件名将是最后一个字段,$NF.

    2. f=$NF; sub(/\.Z$/,"",f)

      这会将文件名分配给变量f,然后如果存在则.Z从中删除最终名称。f

    3. !a[f]++'

      如果f以前没有见过,打印这一行。

    更新 1:删除其他扩展

    根据评论,.Z不是唯一需要删除的扩展。可能还有其他扩展名.dat.edi,.dat.bak应该用简单.dat的 . 在这种情况下:

    awk -F/ '{f=$NF; sub(/\.dat.*/,".dat",f)} !a[f]++' filelist
    

    更新 2:显示按时间戳排序的文件:

    awk -F/ '{f=$NF; sub(/\.dat.*/,".dat",f)} !a[f]++' filelist | xargs -d'\n' -r ls -t
    
    • 1

相关问题

  • GNU find:在-exec中获取绝对和相对路径

  • 重新排列字母并比较两个单词

  • 在awk中的两行之间减去相同的列

  • 多行文件洗牌

  • 如何更改字符大小写(从小到大,反之亦然)?同时[重复]

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    JSON数组使用jq来bash变量

    • 4 个回答
  • Marko Smith

    日期可以为 GMT 时区格式化当前时间吗?[复制]

    • 2 个回答
  • Marko Smith

    bash + 通过 bash 脚本从文件中读取变量和值

    • 4 个回答
  • Marko Smith

    如何复制目录并在同一命令中重命名它?

    • 4 个回答
  • Marko Smith

    ssh 连接。X11 连接因身份验证错误而被拒绝

    • 3 个回答
  • Marko Smith

    如何下载软件包而不是使用 apt-get 命令安装它?

    • 7 个回答
  • Marko Smith

    systemctl 命令在 RHEL 6 中不起作用

    • 3 个回答
  • Marko Smith

    rsync 端口 22 和 873 使用

    • 2 个回答
  • Marko Smith

    以 100% 的利用率捕捉 /dev/loop -- 没有可用空间

    • 1 个回答
  • Marko Smith

    jq 打印子对象中所有的键和值

    • 2 个回答
  • Martin Hope
    EHerman JSON数组使用jq来bash变量 2017-12-31 14:50:58 +0800 CST
  • Martin Hope
    Christos Baziotis 在一个巨大的(70GB)、一行、文本文件中替换字符串 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Drux 日期可以为 GMT 时区格式化当前时间吗?[复制] 2017-12-26 11:35:07 +0800 CST
  • Martin Hope
    AllisonC 如何复制目录并在同一命令中重命名它? 2017-12-22 05:28:06 +0800 CST
  • Martin Hope
    Steve “root”用户的文件权限如何工作? 2017-12-22 02:46:01 +0800 CST
  • Martin Hope
    Bagas Sanjaya 为什么 Linux 使用 LF 作为换行符? 2017-12-20 05:48:21 +0800 CST
  • Martin Hope
    Cbhihe 将默认编辑器更改为 vim for _ sudo systemctl edit [unit-file] _ 2017-12-03 10:11:38 +0800 CST
  • Martin Hope
    showkey 如何下载软件包而不是使用 apt-get 命令安装它? 2017-12-03 02:15:02 +0800 CST
  • Martin Hope
    youxiao 为什么目录 /home、/usr、/var 等都具有相同的 inode 编号 (2)? 2017-12-02 05:33:41 +0800 CST
  • Martin Hope
    user223600 gpg —list-keys 命令在将私钥导入全新安装后输出 uid [未知] 2017-11-26 18:26:02 +0800 CST

热门标签

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve