Quando um novo nó Cassandra é inicializado e recebe dados de tabelas existentes para as quais o Change Data Capture (CDC) está habilitado, as inserções antigas são tratadas como novos eventos do CDC? Não vejo nenhuma referência a esse comportamento na documentação do conector Debezium Kafka, nem nada descrevendo uma conexão entre os arquivos commitlog do Cassandra e seu diretório cdc_raw durante a fase de inicialização. Espero, mas não posso confirmar sem investigar os detalhes internos do Cassandra, que os dados transmitidos não acabem em cdc_raw/.
relate perguntas
-
Configuração multidatacenter Cassandra com 1 ip externo
-
Problemas de atualização/reparo do Cassandra na migração
-
Consultas do navegador Cassandra cqlsh possíveis apenas em bytes
-
Quais são as penalidades de usar muitos (milhares) de famílias de colunas ou keyspaces no Cassandra?
-
Criptografia Cassandra em repouso
Quando um nó está sendo inicializado, partes de SSTables são transmitidas para ele a partir de outras réplicas. Em outras palavras, as partições de intervalo nas SSTables cujas chaves de partição são mapeadas para intervalos de token são transferidas para o nó de adesão.
As réplicas não estão transmitindo os dados como mutações reconstruídas ou instruções
INSERT
, mas fragmentos reais das SSTables no disco.UPDATE
DELETE
Por definição, o CDC captura apenas os dados que foram alterados - e não os dados que já existem no disco - portanto, apenas novas gravações chegarão ao fluxo do CDC. Saúde!