AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 1036338
Accepted
Klun
Klun
Asked: 2020-10-05 06:02:33 +0800 CST2020-10-05 06:02:33 +0800 CST 2020-10-05 06:02:33 +0800 CST

IBM GPFS:递归删除文件非常慢

  • 772

要在我们的 IBM GPFS 集群中递归删除文件,我们使用简单的 unix 命令,例如:

rm /my/directories -fr

然而,删除的时间很长。

问题是我们的分布式应用程序(基于 Spark)one hour需要完成。但是,它也会took about an other hour删除由 Spark 等分布式应用程序生成的临时文件。

因此,全局工作负载非常低效。可能是因为该rm命令必须列出每个子目录..

无论如何,您知道使用 GPFS 有效删除整个目录(和子目录)的方法吗?

可能是 IBM 给出了一个特殊的命令来做到这一点?

ibm parallel-computing
  • 2 2 个回答
  • 719 Views

2 个回答

  • Voted
  1. Best Answer
    BaronSamedi1958
    2020-10-05T06:37:59+08:002020-10-05T06:37:59+08:00

    我不认为你可以加快这个过程,因为“rm”会触发分布式文件系统的大量元数据更新,而且它们需要相当长的时间才能完成。您可以尝试向同一文件系统中的某个临时文件夹发出“mv”(!!!)并在后台执行实际的“rm”。

    • 7
  2. Guang Lei Li
    2020-10-22T06:12:30+08:002020-10-22T06:12:30+08:00

    您可以使用比“rm”快得多的 gpfs​​ 策略。

    这是一个示例,例如,我想删除 /gpfs2/mysql/performance_schema/ 下的所有文件

    策略文件是:

    RULE 'my_del' DELETE DIRECTORIES_PLUS WHERE PATH_NAME LIKE '/gpfs2/mysql/performance_schema/%'

    然后我可以运行策略:

    mmapplypolicy /gpfs2/mysql -P del.pol

    您可以参考这两个链接以获取有关策略和 DELETE 规则的一些说明:

    https://www.ibm.com/support/knowledgecenter/STXKQY_5.0.5/com.ibm.spectrum.scale.v5r05.doc/bl1adv_polextip.htm

    https://www.ibm.com/support/knowledgecenter/STXKQY_5.0.5/com.ibm.spectrum.scale.v5r05.doc/bl1adv_rule_syntaxdiagrams.htm

    实际上在 /usr/lpp/mmfs/samples/ilm 下有一个“mmfile”工具。您需要首先通过 :make -f mmfindUtil_processOutputFile.sampleMakefile 编译 mmfindUtil_processOutputFile

    mmfile 的语法与“find”完全相同,但它使用 GPFS 策略,因此它的运行速度比 GPFS 文件系统的 find 快得多。例如,您可以使用:mmfind sub1/ | xargs rm -f 删除文件。

    您也可以在@guanglei_li 关注我,并且您可以在“https://www.ibm.com/mysupport/s/”获得更多支持。

    • 0

相关问题

  • 关于 Broadcom Teaming 的困惑

  • IBM x346 不会发布

  • IBM BladeCenter 操作技巧?[关闭]

  • IBM Cognos for BI Reporting [关闭]

  • RAID 控制器通常是否存在 SATA 驱动器品牌兼容性问题?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve