Sai提出的问题 -dba

Sai

Asked: 2024-07-13 03:47:31 +0800 CST

Qual é uma opção viável de DR de baixo custo para um cluster grande?

Temos um cluster Cassandra em execução no GKE com um pool de nós de 32 CPUs e discos SSD. O tamanho atual do cluster é de quase 1 PB, com cada nó utilizando uma média de 5 TB em discos SSD alocados de 10 TB. O cluster é composto por 200 nós, cada um com discos de 10 TB, totalizando 2 PB de tamanho total alocado.

Dado o tamanho deste cluster, os custos de manutenção são substanciais. Como podemos conseguir uma recuperação de desastres de baixo custo para um cluster tão grande?

Uma opção que estou considerando é criar um novo data center em uma região diferente com fator de replicação 1 (RF1). Embora isso não seja recomendado, reduziria pelo menos o tamanho do cluster por um fator de três.

Qualquer sugestão seria muito apreciada.

Sai

Asked: 2023-08-31 06:52:08 +0800 CST

Dados inconsistentes após restaurar o banco de dados usando a atualização do nodetool no K8s Cassandra

Detalhes do ENV:

GKE (cluster do Google Kubernetes)
Delator da nuvem do Google. https://docs.datastax.com/en/cassandra-oss/3.0/cassandra/architecture/archSnitchGoogle.html
140 nós com 4 RACKs (4 statefulsets em 4 AZs em uma região)
Cada tamanho de nó é 5 TB e o tamanho do cluster é 700 TB.

Procedimento seguido para restaurar o banco de dados: restaurei um tamanho de banco de dados de 450 TB no cassandra K8s da origem ao destino usando a atualização do nodetool copiando sstables. Cada nó possui cerca de 5 a 6 TB de dados. A abordagem que tomei:

Crie um novo cluster com o mesmo número de nós, como 140 nós de origem.
Criou novos discos a partir de instantâneos de disco de origem (nuvem) e anexou esses discos a novos nós.
Tabelas de sistema limpas.
C* iniciado como um cluster de destino.
Tabelas criadas manualmente que correspondem ao cluster de origem
Estábulos copiados de tabelas antigas para tabelas recém-criadas (UUID). 7 Executei a atualização do nodetool

Observação: status do Nodetool mostrando o mesmo tamanho da origem para cada nó, cfstats também correspondendo ao tamanho das tabelas no destino e na origem.

Problema pós-migração:

Para reduzir o tamanho do cluster, comecei a descomissionar um dos nós e ele foi concluído em 10 minutos. Esperando ver pelo menos 8 horas com base na manutenção anterior do cluster de origem.
Como não se esperava que a desativação fosse executada apenas por 10 minutos, tentei adicionar um novo nó ao cluster, que deveria copiar dados de aproximadamente 5 a 6 TB, mas copiou apenas 2 TB.
Como outra verificação, tentei "limpeza do Nodetool" em outro nó que faz parte do cluster de destino e reduziu os dados de 6 TB para 2 TB. A mesma limpeza não reduz quaisquer dados no nó de origem.
Após a restauração, todo o cluster é reparado no destino usando a ferramenta Reaper e não há problemas com o reparo, mas o problema é a desativação, a limpeza e a inicialização.

Qual é uma opção viável de DR de baixo custo para um cluster grande?

Dados inconsistentes após restaurar o banco de dados usando a atualização do nodetool no K8s Cassandra

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Sai's questions