AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / unix / Perguntas / 791558
Accepted
Andy
Andy
Asked: 2025-02-24 22:09:50 +0800 CST2025-02-24 22:09:50 +0800 CST 2025-02-24 22:09:50 +0800 CST

Obter nome de diretório e arquivos dentro de diretórios em uma única saída

  • 772

Tenho uma estrutura de diretório como esta:

dir1/
    732842342.mp4
    screenshot1.png
dir2/
    324324234.mp4
    screenshot2.png
dir3/
    121321321.mp4
    screenshot3.png

O que estou tentando fazer é gerar um arquivo CSV que tenha um formato como este:

dir_name, video_name, screenshot_file
dir1, 732842342.mp4, screenshot1.png
dir2, 324324234.mp4, screenshot2.png
dir3, 121321321.mp4, screenshot3.png

Posso obter cada nome de diretório simplesmente executandols

$ ls
dir1
dir2
dir3

Não sei como fazer a próxima parte, pois exigiria entrar em cada diretório (por exemplo, cd dir1/ && ls) e então obter o nome dos arquivos .mp4e .png. No entanto, isso é separado do primeiro comando, então não "retém" o nome do diretório ( dir1neste caso) na saída, pois são usados ​​2 comandos separados.

O ideal seria escrever um script bash reutilizável para isso, mas não tinha certeza da sintaxe. Alguém pode ajudar?

bash
  • 2 2 respostas
  • 64 Views

2 respostas

  • Voted
  1. Peter Bill
    2025-02-24T23:52:21+08:002025-02-24T23:52:21+08:00

    Usar findesed

    Primeiro crie o arquivo de saída e a linha de cabeçalho

    echo "dir_name, video_name, screenshot_file" > myfile.csv

    find dir* -print | sed 's!/!, !g'| sed 's!^.,!!' >> myfile.csv

    O findcomando imprime o conteúdo dos diretórios que começam com 'dir'.

    Existem outras possibilidades para findlidar com nomes de diretório:

    Para processar tudo dentro e sob o diretório atual

    find . -type f -print | sed 's!/!, !g'| sed 's!^.,!!' >> myfile.csv

    Para processar tudo dentro e sob um diretório nomeado

    find /path/to/mydata -type f -print | sed 's!/!, !g'| sed 's!^.,!!' >> myfile.csv

    Para pesquisar alguns diretórios nomeados

    find dir1 mydata nextdir anotherdir -type f -print | sed 's!/!, !g'| sed 's!^.,!!' >> myfile.csv

    até o limite de comprimento da linha de comando.

    Adicionei -type f(pesquisar por arquivos comuns) para que os diretórios não apareçam na saída.

    O primeiro sedsubstitui uma barra ('/') por uma vírgula e um espaço. O 'g' garante que isso aconteça para cada correspondência.

    O segundo sedcorresponde ao ponto e à vírgula no início de cada linha e não os substitui por nada.

    Não há proteção contra nenhuma das dificuldades mencionadas nos comentários - como vírgulas em nomes de arquivos ou números diferentes de arquivos por diretório.

    • 2
  2. Best Answer
    Stéphane Chazelas
    2025-02-25T16:17:41+08:002025-02-25T16:17:41+08:00

    Se todos os diretórios contiverem apenas esses 2 arquivos e o vídeo sempre for classificado antes da captura de tela, como no seu exemplo, você pode fazer:

    $ printf '%s/%s\0' dir_name/video_name _/screenshot_file dir*/* |
        mlr --icsvlite --ifs=/ --irs='\x00' --ocsv cut -xf _
    dir_name,video_name,screenshot_file
    dir1,732842342.mp4,screenshot1.png
    dir2,324324234.mp4,screenshot2.png
    dir3,121321321.mp4,screenshot3.png
    

    Caso contrário, no zsh, você pode fazer:

    for dir in *(Nn/); do
      videos=( $dir/*.mp4(N-.:t) ) screenshots=( $dir/*.png(N-.:t) )
      if (( $#videos == 1 && $#screenshots == 1 )); then
        print -rN - $dir/$videos/$screenshots
      fi
    done | mlr --icsvlite --hi --ifs=/ --irs='\x00' --ocsv rename 1,dir_name,2,video_name,3,screenshot_file
    

    Ignorando os diretórios que não têm exatamente um mp4e um pngarquivo. Como bônus, os diretórios são classificados numericamente usando o nqualificador glob para que, por exemplo, dir10venha depois de dir9and não entre dir1and dir2como aconteceria na ordem lexical padrão.

    Observe como usamos /como separador fde campo se NUL como separador rde registro sno formato de entrada CSV-lite, pois esses são os únicos dois caracteres que não podem ocorrer em um nome de arquivo ( ,e retorno de carro/nova linha, os padrões para CSV, "são tão válidos quanto qualquer outro caractere em um nome de arquivo; mlrlidaria com esses caracteres corretamente usando aspas quando necessário e escape "dentro delas, como ""nos formatos CSV mais comumente usados, como o especificado pelo RFC4180 ).

    • 2

relate perguntas

  • exportar variáveis ​​​​env programaticamente, via stdout do comando [duplicado]

  • Problema estranho ao passar variáveis ​​do arquivo de texto

  • Enquanto a linha lê mantendo os espaços de escape?

  • ordem de substituição de processos `te` e `bash`

  • Execute um script muito lento até que seja bem-sucedido

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Possível firmware ausente /lib/firmware/i915/* para o módulo i915

    • 3 respostas
  • Marko Smith

    Falha ao buscar o repositório de backports jessie

    • 4 respostas
  • Marko Smith

    Como exportar uma chave privada GPG e uma chave pública para um arquivo

    • 4 respostas
  • Marko Smith

    Como podemos executar um comando armazenado em uma variável?

    • 5 respostas
  • Marko Smith

    Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

    • 3 respostas
  • Marko Smith

    apt-get update error no Kali Linux após a atualização do dist [duplicado]

    • 2 respostas
  • Marko Smith

    Como ver as últimas linhas x do log de serviço systemctl

    • 5 respostas
  • Marko Smith

    Nano - pule para o final do arquivo

    • 8 respostas
  • Marko Smith

    erro grub: você precisa carregar o kernel primeiro

    • 4 respostas
  • Marko Smith

    Como baixar o pacote não instalá-lo com o comando apt-get?

    • 7 respostas
  • Martin Hope
    user12345 Falha ao buscar o repositório de backports jessie 2019-03-27 04:39:28 +0800 CST
  • Martin Hope
    Carl Por que a maioria dos exemplos do systemd contém WantedBy=multi-user.target? 2019-03-15 11:49:25 +0800 CST
  • Martin Hope
    rocky Como exportar uma chave privada GPG e uma chave pública para um arquivo 2018-11-16 05:36:15 +0800 CST
  • Martin Hope
    Evan Carroll status systemctl mostra: "Estado: degradado" 2018-06-03 18:48:17 +0800 CST
  • Martin Hope
    Tim Como podemos executar um comando armazenado em uma variável? 2018-05-21 04:46:29 +0800 CST
  • Martin Hope
    Ankur S Por que /dev/null é um arquivo? Por que sua função não é implementada como um programa simples? 2018-04-17 07:28:04 +0800 CST
  • Martin Hope
    user3191334 Como ver as últimas linhas x do log de serviço systemctl 2018-02-07 00:14:16 +0800 CST
  • Martin Hope
    Marko Pacak Nano - pule para o final do arquivo 2018-02-01 01:53:03 +0800 CST
  • Martin Hope
    Kidburla Por que verdadeiro e falso são tão grandes? 2018-01-26 12:14:47 +0800 CST
  • Martin Hope
    Christos Baziotis Substitua a string em um arquivo de texto enorme (70 GB), uma linha 2017-12-30 06:58:33 +0800 CST

Hot tag

linux bash debian shell-script text-processing ubuntu centos shell awk ssh

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve