Estou mesclando duas bibliotecas de filmes e estou procurando "desduplicar" manualmente por meio de script bash.
Aqui está o meu processo de pensamento até agora:
- Encontre todos os arquivos com o mesmo nome, independentemente da extensão
- Excluir arquivo menor (tenho armazenamento por dias! e prefiro qualidade!)
Eu poderia construir sobre isso, então se eu puder de alguma forma separar a parte deletada, posso construir sobre ela. Embora eu pudesse usar o ffmpeg para inspecionar o vídeo e escolher o melhor, mas acho que tamanho maior = melhor opção e mais simples de codificar.
Eu postei sobre Software Rec , mas não consegui o que queria, então percebi que o bash é minha melhor aposta, mas meu conhecimento de "encontrar" é limitado e a maioria das respostas que estou encontrando são muito complicadas, acho que isso deve ser um simples coisa.
Por exemplo: Encontre arquivos com o mesmo nome, mas conteúdo diferente?
Esta é uma boa maneira que escrevi para apenas encontrar os arquivos repetidos ignorando a extensão:
Em seguida, envolvi-o neste loop para encontrar o menor dos dois arquivos para cada um:
Por fim, mais um loop para (interativamente,
rm -i
para que haja um prompt antes de cada um) excluir todos esses arquivos:Como isso envolve fazer dois
find
s em seu diretório, certamente existe uma maneira melhor. Mas isso deve funcionar para casos simples. Ele também assume que você está trabalhando no diretório atual, se quiser executar o comando em um diferente, basta alterar o.
argumento para ambos osfind
comandos.Como acabei fazendo isso devido ao meu problema de precisar excluir arquivos .srt.
Encontre arquivos com o mesmo nome, mas extensão diferente:
Nota: Isso depende da extensão ser de 4 caracteres, por exemplo
.XYZ
, não funcionaria para mpeg, mas todos os meus filmes são mp4/mkv/m4v.Ignorar arquivos .srt:
Postei um tópico separado sobre a comparação de tamanhos de arquivo, mas a resposta de Harry faz um ótimo trabalho, exceto que percebi que tinha problemas de .srt para mitigar.
Compare dois tamanhos de arquivo e exclua o arquivo menor