AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 454642
Accepted
benett
benett
Asked: 2018-07-12 00:43:06 +0800 CST2018-07-12 00:43:06 +0800 CST 2018-07-12 00:43:06 +0800 CST

Copia recursivamente apenas determinados diretórios que correspondem aos padrões listados em um arquivo

  • 772

Tenho um diretório com a seguinte estrutura:

-- 201893208
   └── 8Z12
          └── ko_8Z12_Full
          └── wp_we_8Z12_FullDAT
          └── 8Z12_DATFull
   └── P011
          └── P011_Full
          └── 8Z12_FullDAT
          └── P011_DATFull
   └── 9FZA
          └── kl_wt-we-w_kl9-9FZA_Full
          └── ffd-9FZA_FullDAT
          └── 8fdZ12232_9FZA_DATFull
-- 903240920
   └── P0fsa
          └── P0fsa_Full
          └── P0fsa_FullDAT
          └── P0fsa_DATFull
   └── Paaaf
          └── we-Paaaf_ww_fl_Full
          └── Paaaf_FullDAT
          └── Paaaf_DATFull
   └── 9FZATYYY
          └── 9FZATYYY_Full
          └── 9FZATYYY_FullDAT
-- wt0340291
   └── OPF1121
          └── OPF1121_Full
          └── 8Z12_DATFull
   └── KLOFJ9
          └── lop_KLOFJ9_ffj_Full
          └── powt_KLOFJ9_DATFull
   └── LP02323
          └── wr_we_LP02323_Full
          └── wr_we_LP02323_FullDAT

Existem milhares de arquivos em cada pasta listada acima. E também há muitos subdiretórios dentro de cada um. Por exemplo 8Z12, não contém apenas as três pastas listadas acima, mas também contém milhares de arquivos.

EU SÓ quero copiar diretórios que tenham _Fullno final de seu nome ( diretórios DATFull NÃO devem ser copiados ) E também contêm os padrões na lista abaixo

LP02323
KLOFJ9
Paaaf
9FZA

Em outras palavras, os diretórios que contêm uma string da lista acima E Full em seu nome (mas NÃO DAT) devem ser copiados.

Portanto, no exemplo acima, apenas os seguintes diretórios (e todos os seus conteúdos e subdiretórios) devem ser copiados:

wr_we_LP02323_Full
lop_KLOFJ9_ffj_Full
we-Paaaf_ww_fl_Full
kl_wt-we-w_kl9-9FZA_Full

No meu entendimento, rsyncnão suporta regex, portanto, isso deve ser feito findantes de tudo (corrija-me se estiver errado). Mas como posso fazer isso de forma a garantir que todos os diretórios e subdiretórios sejam verificados e todas as pastas relevantes sejam copiadas mesmo que estejam enterradas muito profundamente em vários subdiretórios (observe que o exemplo acima foi um simplificado estrutura da minha pasta original).

Então ficam duas perguntas:

  • Como posso fornecer a lista de padrões para find?
  • Como posso canalizar o resultado de findpara rsync?

Até agora, isso só me vem à mente para corresponder Full:

find . -regextype sed -regex ".*/.*[^DAT]Full$"

Mas como posso adicionar a lista de IDs a este findcomando?

find terminal
  • 1 1 respostas
  • 2048 Views

1 respostas

  • Voted
  1. Best Answer
    Kusalananda
    2018-07-12T01:24:26+08:002018-07-12T01:24:26+08:00

    Usando um arquivo de strings que precisam estar presentes nos nomes dos diretórios, um shell loop sobre eles e rsync(supondo que queremos copiar do diretório na variável $sourcee para o diretório na variável $target):

    while IFS= read -r string; do
        rsync --archive --exclude='*DAT*/' --include='*/' --include="*$string*_Full/***" --exclude='*' \
            --prune-empty-dirs "$source"/ "$target"
    done <strings.txt
    

    O que as opções rsyncfazem (o primeiro acerto em qualquer um dos padrões de exclusão/inclusão é importante):

    • --archive: Copia a propriedade, permissões, carimbos de data/hora etc.
    • --exclude='*DAT*/': Excluir qualquer diretório com DATem seu nome.
    • --include='*/': Considere todos os diretórios (exceto os excluídos pelo padrão anterior). Isso é necessário para rsyncalcançar os diretórios reais nos quais você está interessado.
    • --include="*$string*_Full/***": Considere todos os diretórios que correspondem ao padrão fornecido e tudo abaixo desse diretório. Se $stringfor parrot, isso seria --include="*parrot*_Full/***".
    • --exclude='*': Não considere nada que ainda não esteja explicitamente incluído.
    • --prune-empty-dirs: Não transfira diretórios que não tenham nada explicitamente incluído neles.

    Se você quiser ver como rsyncavalia os padrões ao executá-lo, adicione -vvà rsynclinha de comando.

    Teste:

    $ tree
    .
    |-- from
    |   `-- a
    |       `-- b
    |           |-- c_A_DATFull
    |           |   `-- file
    |           |-- c_A_DAT_Full
    |           |   `-- file
    |           |-- c_A_Full
    |           |   `-- file
    |           |-- c_B_DATFull
    |           |   `-- file
    |           |-- c_B_DAT_Full
    |           |   `-- file
    |           |-- c_B_Full
    |           |   `-- file
    |           |-- c_C_DATFull
    |           |   `-- file
    |           |-- c_C_DAT_Full
    |           |   `-- file
    |           `-- c_C_Full
    |               `-- file
    `-- strings.txt
    
    12 directories, 10 files
    
    $ cat strings.txt
    A
    B
    
    $ source=from
    $ target=to
    

    (executando o loop aqui)

    $ tree
    .
    |-- from
    [...]
    `-- to
        `-- a
            `-- b
                |-- c_A_Full
                |   `-- file
                `-- c_B_Full
                    `-- file
    
    17 directories, 12 files
    

    Com uma única invocação de rsync:

    set -- --exclude='*DAT*/' --include='*/'
    while IFS= read -r string; do
        set -- "$@" --include="*$string*_Full/***"
    done <strings.txt
    set -- "$@" --exclude='*'
    
    rsync --archive "$@" --prune-empty-dirs "$source"/ "$target"
    

    Uma findsolução:

    set --
    while IFS= read -r string; do
        set -- "$@" -o -name "*$string*_Full"
    done <strings.txt
    shift
    
    # "$@" would now be something like
    #    -name *LP02323*_Full -o -name *Paaaf*_Full -o -name ...etc
    
    find "$source" -type d '(' "$@" ')' ! -name '*DAT*' -exec sh -c '
        source=$1; target=$2; shift 2
        for pathname do
            mkdir -p "$target/${pathname#$source}"
            rsync --archive "$pathname"/ "$target/${pathname#$source}"
        done' sh "$source" "$target" {} +
    

    Isso seria usado findpara gerar uma lista dos subdiretórios que você gostaria de copiar. Estes são dados a um pequeno script embutido que faz um loop sobre eles.

    Em cada iteração do loop, o diretório correspondente no destino é criado (isso pressupõe uma cópia local) e o diretório é copiado usando rsync.

    Nunca use findpara canalizar nomes de caminho para algum outro comando, a menos que você possa organizar para que os nomes de caminho sejam delimitados com segurança.

    Relacionado:

    • Entendendo a opção -exec de `find`
    • 2

relate perguntas

  • Como posso dar uma olhada no ssh?

  • verificando se existe uma pasta em determinado diretório

  • Localizar e substituir cores em arquivos CSS na linha de comando

  • Área de memória Flash Nand de backup

  • GNU find: obtenha caminho absoluto e relativo em -exec

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    ssh Não é possível negociar: "nenhuma cifra correspondente encontrada", está rejeitando o cbc

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    Como descarregar o módulo do kernel 'nvidia-drm'?

    • 13 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Wong Jia Hau ssh-add retorna com: "Erro ao conectar ao agente: nenhum arquivo ou diretório" 2018-08-24 23:28:13 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST
  • Martin Hope
    Bagas Sanjaya Por que o Linux usa LF como caractere de nova linha? 2017-12-20 05:48:21 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve