Protegendo um novo servidor Ubuntu [fechado]

Question

lonix

Asked: 2020-04-01 03:00:57 +0800 CST2020-04-01 03:00:57 +0800 CST 2020-04-01 03:00:57 +0800 CST

Impedir que vários cron jobs sejam executados simultaneamente [duplicado]

772

Meu servidor executa vários cron jobs à meia-noite. Cada trabalho cria um backup de algo, criando um tarball e compactando-o com xz.

Como xzé um porco de CPU e memória, adicionei um atraso aleatório a cada trabalho, para que eles "não deveriam" se sobrepor. Mas de vez em quando isso acontece e carrega muito o servidor.

Suposições:

Com base no meu tráfego, meia-noite é o melhor horário para fazer backups - mas ainda há tráfego (e é por isso que quero evitar carga excessiva)
Cada aplicativo voltado para o público está associado a seu próprio trabalho de backup e eles são desacoplados (eles não se conhecem) - portanto, não posso mesclar os trabalhos cron de backup em um único trabalho, pois preciso dessa granularidade
Não consigo codificar a hora de início de cada um, pois isso aumentaria a manutenção - para adicionar um aplicativo ao servidor (via ansible), basta implantá-lo e soltar um trabalho cron de backup (agendado para meia-noite) em /etc/cron.d/, e o random atraso antes do início do trabalho geralmente é bom o suficiente
Eu estrangulo os trabalhos um pouco via tar ... | pv --rate-limit ... | xz ...- mas, embora isso reduza a carga por trabalho, também diminui a velocidade de todos os trabalhos e, portanto, aumenta a probabilidade de vários trabalhos serem executados simultaneamente (que, quando somados, podem consumir 100% da CPU)

Uma solução possível é que cada trabalho crie um arquivo temporário que sinalize que está ocupado e, em seguida, exclua-o. O problema é que se um trabalho detecta esse arquivo, o que ele faz? Dorme? Por quanto tempo? Eu poderia fazê-lo dormir por um período aleatório usando at, mas se algo der errado com meus scripts de backup, eu poderia ter uma enorme fila de trabalhos competindo entre si. Mais uma dor de cabeça de manutenção.

Então, como se costuma resolver esse problema? Basicamente, uma maneira simples de agendar cron jobs relacionados, sem deixá-los atrapalhar uns aos outros e sem a necessidade de ajustar os horários de início.

3 respostas

Voted

user2768 · Answer 1 · 2020-04-01T04:33:29+08:00

user2768

2020-04-01T04:33:29+08:002020-04-01T04:33:29+08:00

Use operadores de shell , por exemplo, para executar à meia command1- command2noite, independentemente da saída anterior, use:

0 0 * * * command1 ; command2

Alternativamente, você pode executar command2apenas se command1for concluído com êxito (retorna com status de saída zero):

0 0 * * * command1 && command2

O último talvez seja mais útil quando a falha de command1provavelmente significar uma falha subjacente que impede o sucesso de command2.

2

John Mahowald · Answer 2 · 2020-04-01T04:14:08+08:00

Distribuir aleatoriamente os horários de início é bom para evitar horários de pico e é fácil de fazer com o Ansible. Mas não garante realmente que os recursos estarão disponíveis para sustentar vários trabalhos de compactação simultâneos. Existem vários métodos de como fazer backups de baixo impacto, considere alguns ou todos eles.

Execute sua lista de comandos por meio de um programa que estrangula com base na CPU. Por exemplo, o GNU paralelo --limit 100% só será executado se a média de carga estiver abaixo do número de CPUs.

Cada trabalho tenta adquirir um de um pequeno número de bloqueios. Como com flockutil-linux, Python ou Perl. Parece simples, mas manter vários deles será chato. Considero um comando wrapper com gerenciamento de tarefas integrado mais robusto, como o GNU paralelo.

Avalie seu algoritmo de compactação. zstd é moderno e rápido, para apenas um pouco mais de memória.

Distribua os trabalhos de backup por mais horas. Pense se, digamos, 00:00 às 03:00 é aceitável para seus requisitos de desempenho e backup.

Adicione CPU. Pode ser caro dimensionar para capacidade de pico, mas permite mais threads de compressão.

Descarregue os backups inteiramente para outro host. Faça uma matriz de armazenamento ou um instantâneo de discos baseado em nuvem. Apresente para um anfitrião diferente. Backup de lá.

lonix · Answer 3 · 2020-04-01T04:28:32+08:00

lonix

2020-04-01T04:28:32+08:002020-04-01T04:28:32+08:00

Dê uma olhada na resposta de @JohnMahowald para obter uma excelente lista de opções, incluindo o manuseio inteligente da contenção.

O que decidi fazer foi em vez de adicionar trabalhos de backup a /etc/cron.d, vou adicioná-los a um diretório cron personalizado, por exemplo /etc/cron.backupjobs/.

Em seguida, adicionarei um trabalho "mestre" ao /etc/cron.d/qual executa trabalhos /etc/cron.backupjobs/ sequencialmente .

1

Impedir que vários cron jobs sejam executados simultaneamente [duplicado]

Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

Ping uma porta específica

Verifique se a porta está aberta ou fechada em um servidor Linux?

Como automatizar o login SSH com senha?

Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

Qual porta o SFTP usa?

Linha de comando para listar usuários em um grupo do Windows Active Directory?

O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

Como determinar se uma variável bash está vazia?

Impedir que vários cron jobs sejam executados simultaneamente [duplicado]

3 respostas

relate perguntas