Eu tenho 5 nós de máquinas conectados em um sistema de dados distribuído Cassandra. Eu configurei o fator de replicação como 3.
Eu entendi que para uma replicação de 3, os dados serão distribuídos em 3 nós com base na disponibilidade dos nós coordenadores. Quando verifico nós individuais, as contagens de linhas são diferentes. Transferi cerca de 100 mil linhas de csv para cassandra. Isso significa que tenho que fazer contagens de linha para todos os nós juntos para obter os resultados? Estou usando dsbulk para verificar a contagem de linhas.
Estou perdendo alguma coisa aqui?