Se eu fosse configurar servidores físicos para executar um site crítico para os negócios, certamente criaria redundância nesse ambiente. Eu me esforçaria para não ter nenhum ponto único de falha e, no mínimo, executar dois servidores de cada função (dois servidores da Web, dois servidores de banco de dados, etc.). Mesmo que eu optasse por adicionar uma camada de virtualização a esses servidores, eu ainda buscaria redundância (e, nesse caso, também garantiria que, por exemplo, os bancos de dados fossem distribuídos em hosts diferentes).
No entanto, não tenho certeza se esse modo de pensar se aplica a ofertas de servidores em nuvem baseadas, por exemplo, em openstack. Primeiro, eu sempre poderia executar dois servidores da Web e dois servidores de banco de dados, mas como sei que meus dois servidores de banco de dados não são executados nos mesmos hosts físicos? Em segundo lugar, estou no escuro quando se trata de como a pilha aberta opera as máquinas virtuais. Uma única VM está vinculada a um host específico ou existe um pool de hardware físico no qual as VMs são embaralhadas?
Devo pensar em servidores de nuvem de pilha aberta apenas como outra forma de sabor de VPS/VM? Devo planejar servidores de nuvem de pilha aberta da mesma forma que planejo com servidores virtuais antigos físicos ou simples
Se você deseja redundância, ainda precisa planejá-la. Os provedores de nuvem (independentemente da plataforma) ainda apresentam interrupções nos níveis de host e datacenter.
Normalmente, há um pool de hosts e você não tem muito a dizer sobre qual VM vai para onde. Se um host morrer, você terá uma pequena interrupção enquanto a VM é movida e reiniciada. Muitos provedores permitem que você configure regras antiafinidade em suas máquinas para garantir que você não acabe com todos os seus servidores da Web no mesmo host. Os maiores permitem que você os coloque em diferentes regiões geográficas para continuar funcionando mesmo quando há uma interrupção no nível do datacenter.
O Openstack facilita a movimentação de VMs entre os hosts, portanto, uma falha do host geralmente causa menos tempo de inatividade, mas não elimina as falhas. Se a alta disponibilidade for algo de que você precisa, você ainda precisará planejá-la.