AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 674938
Accepted
Teatree
Teatree
Asked: 2021-10-27 22:31:57 +0800 CST2021-10-27 22:31:57 +0800 CST 2021-10-27 22:31:57 +0800 CST

Localizar: Use regex para obter todos os arquivos com nome de diretório específico no caminho, mas sem outro nome de diretório específico no caminho

  • 772

Estou tentando usar find para retornar todos os nomes de arquivos que tenham um diretório específico em seu caminho, mas não tenham outro diretório específico em nenhum lugar no caminho do arquivo. Algo como:

myRegex= <regex> 
targetDir= <source directory>
find $targetDir -regex $myRegex -print

Eu sei que também posso fazer isso canalizando um comando find para outro, mas gostaria de saber como fazer isso com uma única expressão regular.

Por exemplo, eu quero todo arquivo que tenha o diretório "good" em seu caminho, mas não tenha o diretório "bad" em nenhum lugar em seu caminho, não importa a combinação. Alguns exemplos:

/good/file_I_want.txt #Captured
/good/bad/file_I_dont_want.txt #Not captured

/dir1/good/file_I_want.txt #Captured
/dir2/good/bad/file_I_dont_want.txt #Not captured

/dir1/good/dir2/file_I_want.txt #Captured
/dir1/good/dir2/bad/file_I_want.txt #Not captured

/bad/dir1/good/file_I_dont_want.txt #Not captured

Tenha em mente que alguns nomes de arquivos podem conter "bom" ou "ruim", mas eu só quero considerar nomes de diretórios.

/good/bad.txt #Captured
/bad/good.txt #Not captured

Minha pesquisa sugere que eu deveria usar um Negative Lookahead e um Negative Lookbehind. No entanto, nada que tentei funcionou até agora. Alguma ajuda seria apreciada. Obrigado.

find command-line
  • 3 3 respostas
  • 4364 Views

3 respostas

  • Voted
  1. Best Answer
    Stéphane Chazelas
    2021-10-27T23:07:43+08:002021-10-27T23:07:43+08:00

    Como Inian disse, você não precisa -regex(o que não é padrão, e a sintaxe varia muito entre as implementações que suportam -regex¹).

    Você pode usar -pathpara isso, mas também pode dizer findpara não inserir diretórios chamados bad, o que seria mais eficiente do que descobrir todos os arquivos neles para depois filtrá-los com -path:

    LC_ALL=C find . -name bad -prune -o -path '*/good/*.txt' -type f -print
    

    ( LC_ALL=Centão o curinga findde 's *não engasga com nomes de arquivos com sequência de bytes não formando caracteres válidos na localidade).

    Ou para mais de um nome de pasta:

    LC_ALL=C find . '(' -name bad -o -name worse ')' -prune -o \
      '(' -path '*/good/*' -o -path '*/better/*' ')' -name '*.txt' -type f -print
    

    Com zsh, você também pode fazer:

    set -o extendedglob # best in ~/.zshrc
    print -rC1 -- (^bad/)#*.txt~^*/good/*(ND.)
    
    print -rC1 -- (^(bad|worse)/)#*.txt~^*/(good|better)/*(ND.)
    

    Ou para as listas em arrays:

    good=(good better best)
    bad=(bad worse worst)
    print -rC1 -- (^(${(~j[|])bad})/)#*.txt~^*/(${(~j[|])good})/*(ND.)
    

    Para não descer em dirs chamados bad, ou (menos eficiente como com -path '*/good/*' ! -path '*/bad/*'):

    print -rC1 -- **/*.txt~*/bad/*~^*/good/*(ND.)
    

    Em zsh -o extendedglob, ~é o operador de globbing exceto (e não) enquanto ^é o operador de negação e #é 0-ou-mais-da-coisa-anterior como regexp *. ${(~j[|])array}une os elementos da matriz com |, |sendo tratado como um operador glob em vez de um literal |com ~.

    Em zsh, você poderá usar a correspondência PCRE depois de set -o rematchpcre:

    set -o rematchpcre
    regex='^(?!.*/bad/).*/good/.*\.txt\Z'
    print -rC1 -- **/*(ND.e['[[ $REPLY =~ $regex ]]'])
    

    Mas essa avaliação do código shell para cada arquivo (incluindo aqueles em baddiretórios) provavelmente o tornará muito mais lento do que outras soluções.

    Também tome cuidado para que o PCRE (ao contrário do zsh globs) engasgue com sequências de bytes que não formam caracteres válidos na localidade e não suporta conjuntos de caracteres de vários bytes diferentes do UTF-8. Corrigir a localidade para Cgostar findacima resolveria ambos para esse padrão específico.

    Se você preferir [[ =~ ]]apenas fazer a correspondência regexp estendida como em bash, você também pode carregar o módulo pcre ( zmodload zsh/pcre) e usar [[ -pcre-match ]]em vez de [[ =~ ]]fazer a correspondência PCRE.

    Ou você pode fazer a filtragem com grep -zP(assumindo GNU grepou compatível):

    regex='^(?!.*/bad/).*/good/.*\.txt\Z'
    find . -type f -print0 |
      LC_ALL=C grep -zPe "$regex" |
      tr '\0' '\n'
    

    (embora findainda descubra todos os arquivos em todos os baddiretórios).

    Substitua tr '\0' '\n'por xargs -r0 cmdse precisar fazer algo com esses arquivos (além de imprimi-los um por linha).


    ¹ De qualquer forma, não conheço nenhuma findimplementação que suporte expressões regulares do tipo perl ou do tipo vim que você precisaria para operadores de pesquisa.

    • 8
  2. Inian
    2021-10-27T22:51:32+08:002021-10-27T22:51:32+08:00

    Você não precisa de um regex para isso, você pode usar o -pathpredicado para excluir diretórios com um nome específico em qualquer nível

    find . -type f -path '*/good/*' '!' -path '*/bad/*'
    
    • 6
  3. ti7
    2021-10-28T07:48:39+08:002021-10-28T07:48:39+08:00

    Embora seja provavelmente menos eficiente (embora eu não tenha certeza!) e menos "correto" do que finda filtragem poderosa (por exemplo, ingênuo grepaqui não funcionará para nomes contendo caracteres de nova linha, embora sejam extremamente raros e normalmente representem um erro) , geralmente é muito mais fácil empilhar algumas instâncias grepque filtram sucessivamente os resultados usando correspondências mais simples e correspondências inversas-v

    Isso exige mais cuidado com as substrings para garantir que você realmente encontre um nome de diretório, mas geralmente fornecerá uma sintaxe muito mais fácil de entender e poderá fazer tudo o que você precisa!

    find ./ | grep "/good/" | grep -v "/bad/" | grep '\.txt$'
    
    • 2

relate perguntas

  • Qual é a interface recomendada para um utilitário que requer muitos parâmetros? [fechado]

  • Execute o aplicativo X remotamente, execute a GUI no host remoto [fechado]

  • Fazendo mysql CLI me pedir uma senha interativamente

  • GNU find: obtenha caminho absoluto e relativo em -exec

  • Pub / sub de linha de comando sem um servidor?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Possível firmware ausente /lib/firmware/i915/* para o módulo i915

    • 3 respostas
  • Marko Smith

    Falha ao buscar o repositório de backports jessie

    • 4 respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    user12345 Falha ao buscar o repositório de backports jessie 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl Por que a maioria dos exemplos do systemd contém WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve