Desejo configurar um banco de dados em uma configuração de alta durabilidade no Azure. Eu confiei anteriormente em ofertas de banco de dados como serviço, mas não posso fazer isso neste caso, então gostaria de seus comentários sobre o plano abaixo. Isso é suficiente para garantir o armazenamento confiável de dados?
- Um aplicativo Web do Azure recebe dados de métrica da Web, faz alguns pequenos processamentos e amostragem e envia os dados em lotes para a VM2.
- A VM2 executa o banco de dados Clickhouse e armazena dados em um disco gerenciado do Azure
- Algum trabalho periódico tira instantâneos do disco usando a funcionalidade de backup integrada do Clickhouse e os armazena no armazenamento a frio
O backup periódico destina-se a mitigar o erro humano, ou seja, executar acidentalmente "DROP TABLE xx" nos dados errados.
A grande questão é se os discos gerenciados são um substituto aceitável para a replicação de banco de dados, para garantir a durabilidade dos dados. Os Discos Gerenciados do Azure são anunciados como formas de armazenamento muito duráveis, com replicação tripla redundante integrada. Eles são anunciados como bons para uso de banco de dados. Parece que isso deve ser suficiente para eliminar quaisquer preocupações de perda de dados devido a falha de hardware. Isso está correto? Você vê algum problema em potencial com isso?
O plano de recuperação é que, se a VM2 falhar, algum processo de monitoramento detecte isso e gere uma nova instância da VM2 anexada ao mesmo disco gerenciado. O aplicativo Web reinicia da mesma forma se falhar.
Entendo que essa configuração não é de alta disponibilidade, se uma VM falhar, haverá uma janela de tempo antes que ela possa armazenar novos dados. Isso é aceitável para mim. Mas quero garantir que os dados armazenados não sejam perdidos, ou seja, sejam armazenados de forma durável com probabilidade muito alta. Isso é suficiente para garantir isso? Você vê algum problema?