Estou usando um script Bash por meio de um trabalho cron para excluir arquivos assim que eles completam 5 minutos. Existe uma abordagem melhor do que esta?
Existe - talvez - uma maneira de monitorar meu sistema de arquivos com mais eficiência e obter um retorno de chamada assim que uma determinada condição (por exemplo, "O arquivo tem mais de 5 minutos") for atendida?
Contexto : Nosso scanner não é muito "inteligente" e suporta apenas o upload de digitalizações para um servidor FTP. Embora não seja seguro, atualmente não há uma maneira melhor de fazê-lo. Para evitar que o servidor FTP se torne um tesouro de documentos potencialmente valiosos, gostaria de excluí-los assim que completarem 5 minutos.
A primeira ideia era executar um cron job a cada 5 minutos que apenas excluísse todos os arquivos desse diretório. A desvantagem óbvia é que, se alguém digitalizar um documento logo antes da execução do cronjob, ele perderá a digitalização. Pode não ser um problema, já que você pode digitalizar novamente o documento, mas é irritante.
A próxima abordagem foi executar uma tarefa cron a cada 5 minutos, que verifica se um arquivo tem mais de 5 minutos e, em caso afirmativo, o exclui. Isso daria a um arquivo uma vida útil máxima teórica de aproximadamente 10 minutos. Funciona, mas parece um hack.
Então, há uma maneira melhor?
Não há nada realmente melhor do que um cron job básico que chama um script Bash em muitos casos.
Por que você acha que usar um cron job é uma solução “ruim”? A menos que esse método esteja causando um problema real em seu sistema, alterá-lo para outra coisa apenas complicaria demais o que é - essencialmente - um processo simples.
A grande maioria dos sistemas no mundo usa trabalhos cron semelhantes a este. Usar find via Bash e via cron job é 100% bom.
Dito isso, é assim que eu lidaria com a tarefa que você descreve por meio de um trabalho de crob…
Primeiro, você poderia usar
find
assim:Então você pode testar o comando assim; trocando
rm -f
porls -la
:Procura especificamente arquivos (
-type f
) com mais de 5 minutos (-mmin +5
) com as extensões de arquivo PDF, JPG e TIFF (-regextype posix-extended -iregex '.*\.(PDF|JPG|TIFF)$
) no caminho/path/to/the/files
, procure apenas nesse diretório (-maxdepth 1
).Você pode adicionar outras extensões de arquivo conforme necessário ou apenas removê-lo completamente para apenas verificar o diretório em busca de qualquer coisa. Mas eu não recomendo isso, pois você corre o risco de deletar coisas que não deveriam ser deletadas; basta adicionar as extensões necessárias conforme necessário.
Sinta-se à vontade para testar e ajustar conforme necessário. Eu recomendaria colocar esse código em um arquivo de script Bash e, em seguida, executar esse arquivo de script Bash por meio do cron job. Algo assim:
Você pode usar
inotifiywait
para saber que um arquivo é criado em algum diretório e, em seguida, iniciar um processo em segundo plano que dorme 5 minutos e depois apaga o arquivo.No entanto, esta solução não seria muito robusta, pois se por algum motivo você perder um arquivo, ele ficará para sempre no disco. As soluções baseadas em
find
eventualmente limparão os arquivos remanescentes, mesmo que, por algum motivo, uma execução tenha falhado.Tente
logrotate
. Acredito que você pode especificar caminhos de diretório arbitrários, permitindo que sejam usados para outras coisas além de arquivos de log.