Estou montando um cluster cassandra de 16 nós (fator de replicação 2) e quero configurar uma programação para nodetool repair
. gc_grace_seconds é o padrão.
Duas questões:
- Meu primeiro impulso é configurar um trabalho cron para cada máquina e tentar randomizar manualmente o tempo em torno de um cronograma de uma semana. Existe uma maneira melhor?
- Tem
nodetool repair
que ser executado em todos os sistemas ou em todos os # sistemas/sistemas de fator de replicação ? (IE para meus 16 nós com fator de replicação 2 - 8 sistemas - um de cada par)
Eu não iria randomizar. Sua melhor aposta é agendar os reparos para que eles não esbarrem uns nos outros.
Você deve usar a opção -pr em cada nó ao executar o reparo.
Se você estiver usando o Cassandra 2.1, terá a opção de reparo incremental, o que acelerará consideravelmente as coisas.
RF=2 também é uma receita para o desastre. As consultas de quorum falharão se um nó estiver indisponível. Eu recomendo RF=3.