Eu tenho uma configuração de réplica de nó 2 GlusterFS 2. Estou planejando usá-lo como armazenamento de instância OpenStack, no qual a imagem de disco da VM é armazenada.
De meus testes, se o nó GlusterFS no qual o hypervisor está atualmente montado falhar (usando as configurações padrão do GlusterFS), levará cerca de 45 segundos para que a conexão expire e o cliente glusterfs falhe para o outro nó. Durante esses 45 segundos, as operações de E/S serão interrompidas, do ponto de vista da VM, o que significa que o disco não responde.
Eu sei que para o Linux, se o disco parar de responder, depois de algum tempo (não tenho certeza de quanto tempo) o kernel remontará o sistema de arquivos como somente leitura.
Também posso diminuir o valor do volume do GlusterFS network.ping-timeout
, o que reduzirá o tempo de failover.
Minha pergunta é: quanto devo definir esse valor para que a maioria dos sistemas operacionais possa tolerar o tempo sem resposta do disco virtual sem efeitos colaterais?
Para ser mais preciso, gostaria de saber o tempo de falta de resposta do disco que o Windows NTFS, FreeBSD UFS/ZFS e Linux ext4 podem tolerar. Quais são os parâmetros envolvidos? (por exemplo, /sys/block/sda/device/timeout
no Linux)
informação relacionada:
Atualização: @the-wabbit respondeu sobre Linux e Windows, também gostaria de saber o caso do FreeBSD