AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / server / Perguntas / 1036338
Accepted
Klun
Klun
Asked: 2020-10-05 06:02:33 +0800 CST2020-10-05 06:02:33 +0800 CST 2020-10-05 06:02:33 +0800 CST

IBM GPFS: muito lento para remover arquivos recursivamente

  • 772

Para excluir arquivos recursivamente em nosso cluster IBM GPFS, usamos o comando unix simples como:

rm /my/directories -fr

No entanto, as exclusões são muito longas para serem feitas.

O problema é que nossos aplicativos distribuídos (baseados no Spark) demoraram muito one hourpara serem feitos. Mas também took about an other hourpara descartar arquivos temporários gerados por aplicativos distribuídos como o Spark.

Portanto, as cargas de trabalho globais são muito ineficientes. Pode ser porque o rmcomando tem que listar todos os subdiretórios ..

De qualquer forma, você conhece maneiras de eliminar com eficiência um diretório inteiro (e subdiretórios) com o GPFS?

A IBM pode dar um comando especial para fazer isso?

ibm parallel-computing
  • 2 2 respostas
  • 719 Views

2 respostas

  • Voted
  1. Best Answer
    BaronSamedi1958
    2020-10-05T06:37:59+08:002020-10-05T06:37:59+08:00

    Eu não acho que você possa acelerar esse processo, pois “rm” aciona muitas atualizações de metadados para os sistemas de arquivos distribuídos, e elas levam algum tempo para serem concluídas. O que você pode tentar é emitir “mv” para alguma pasta temporária dentro do mesmo sistema de arquivos (!!!) e fazer um “rm” real em segundo plano.

    • 7
  2. Guang Lei Li
    2020-10-22T06:12:30+08:002020-10-22T06:12:30+08:00

    Você pode usar a política gpfs ​​que é muito mais rápida que 'rm'.

    Aqui está um exemplo, por exemplo, eu quero remover todos os arquivos em /gpfs2/mysql/performance_schema/

    O arquivo de política é:

    REGRA 'my_del' DELETE DIRECTORIES_PLUS WHERE PATH_NAME LIKE '/gpfs2/mysql/performance_schema/%'

    Então eu posso executar a política com:

    mmapplypolicy /gpfs2/mysql -P del.pol

    Você pode consultar estes dois links para obter algumas explicações sobre a política e a regra DELETE:

    https://www.ibm.com/support/knowledgecenter/STXKQY_5.0.5/com.ibm.spectrum.scale.v5r05.doc/bl1adv_polextip.htm

    https://www.ibm.com/support/knowledgecenter/STXKQY_5.0.5/com.ibm.spectrum.scale.v5r05.doc/bl1adv_rule_syntaxdiagrams.htm

    Na verdade, existe uma ferramenta 'mmfile' em /usr/lpp/mmfs/samples/ilm. Você precisa primeiro compilar mmfindUtil_processOutputFile por :make -f mmfindUtil_processOutputFile.sampleMakefile

    mmfile tem exatamente a mesma sintaxe que 'find', mas usa a política GPFS para que seja executado muito mais rápido do que find para o sistema de arquivos GPFS. por exemplo, você pode usar: mmfind sub1/ | xargs rm -f para remover os arquivos.

    Você também pode me seguir em @guanglei_li e obter suporte adicional em "https://www.ibm.com/mysupport/s/".

    • 0

relate perguntas

  • Os controladores RAID costumam ter problemas de compatibilidade de marca de unidade SATA?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

    • 5 respostas
  • Marko Smith

    Ping uma porta específica

    • 18 respostas
  • Marko Smith

    Verifique se a porta está aberta ou fechada em um servidor Linux?

    • 7 respostas
  • Marko Smith

    Como automatizar o login SSH com senha?

    • 10 respostas
  • Marko Smith

    Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

    • 30 respostas
  • Marko Smith

    Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

    • 5 respostas
  • Marko Smith

    Qual porta o SFTP usa?

    • 6 respostas
  • Marko Smith

    Linha de comando para listar usuários em um grupo do Windows Active Directory?

    • 9 respostas
  • Marko Smith

    O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

    • 3 respostas
  • Marko Smith

    Como determinar se uma variável bash está vazia?

    • 15 respostas
  • Martin Hope
    Davie Ping uma porta específica 2009-10-09 01:57:50 +0800 CST
  • Martin Hope
    kernel O scp pode copiar diretórios recursivamente? 2011-04-29 20:24:45 +0800 CST
  • Martin Hope
    Robert ssh retorna "Proprietário incorreto ou permissões em ~/.ssh/config" 2011-03-30 10:15:48 +0800 CST
  • Martin Hope
    Eonil Como automatizar o login SSH com senha? 2011-03-02 03:07:12 +0800 CST
  • Martin Hope
    gunwin Como lidar com um servidor comprometido? 2011-01-03 13:31:27 +0800 CST
  • Martin Hope
    Tom Feiner Como posso classificar a saída du -h por tamanho 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent Como determinar se uma variável bash está vazia? 2009-05-13 09:54:48 +0800 CST

Hot tag

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve