Estou procurando adicionar criptografia ao meu cluster Cassandra para melhor segurança de dados. Aqui estão as especificações da minha configuração e os problemas que encontrei:
Detalhes do cluster: 8 nós, cada um com TBs de dados.
Tentativas Feitas: Tentou adicionar volumes EBS criptografados e alterar o caminho dos dados, mas isso criou um atraso significativo no desempenho em todo o cluster. Adicionou novos nós configurados com criptografia (JKS para SSTable e criptografia internode), mas causou grandes interrupções e desestabilizou todo o cluster.
Desafios enfrentados: Grande atraso ao migrar para volumes EBS criptografados. Instabilidade do cluster ao introduzir novos nós com criptografia.
Pergunta: Qual é a abordagem recomendada para habilitar a criptografia (dados em repouso) em um cluster Cassandra com tempo de inatividade mínimo e sem afetar severamente o desempenho?
Quaisquer insights ou melhores práticas seriam muito apreciados!
Se entendi corretamente, cada nó no cluster tem vários terabytes de dados. Se sim, essa é possivelmente a razão pela qual o cluster sofre degradação e/ou interrupção do serviço.
A criptografia adiciona um pouco de sobrecarga na operação de um nó. Quanta sobrecarga depende de muitos fatores que incluem cifras usadas, configuração de hardware, capacidade do cluster, padrões de acesso e assim por diante. Em alguns clusters, a sobrecarga pode ser de 3-5% de CPU adicional, mas para outros pode ser significativamente maior.
Se o seu cluster estiver próximo da capacidade máxima, habilitar a criptografia pode levá-lo ao limite.
Eu sugeriria aumentar temporariamente a capacidade do cluster adicionando mais nós. Por exemplo, se você dobrar o número de nós em um data center, você efetivamente reduzirá pela metade a densidade de dados de cada nó e reduzirá a carga nele pela metade também. Idealmente, quanto mais próximo cada nó estiver de 1 TB ou menos, mais fácil será gerenciá-los, principalmente ao executar tarefas operacionais como migrar para volumes criptografados.
Com nós menos densos, o impacto da atividade de migração deve ser significativamente menor e, esperançosamente, mais provável que seja transparente para os usuários finais. Saúde!
A questão é: todos os dados precisam ser criptografados?
Eu verificaria primeiro se a criptografia pode ser feita no lado do cliente. Isso funcionou no meu caso.