Sincronização de dados do Cassandra em vários nós

Question

janovak

Asked: 2024-01-15 16:53:42 +0800 CST2024-01-15 16:53:42 +0800 CST 2024-01-15 16:53:42 +0800 CST

Garantindo exclusividade em dados classificados no Cassandra

772

Sou novo no Cassandra e estou tendo problemas para tentar descobrir como ordenar meus dados. Estou tentando gravar mensagens do twitch.tv para cada streamer. Eu quero algo como o seguinte

CREATE TABLE IF NOT EXISTS chat_data.twitch_chat_by_broadcaster_and_timestamp (
    broadcaster_id int,
    timestamp int,
    message text,
    PRIMARY KEY (broadcaster_id, timestamp)
) WITH CLUSTERING ORDER BY (timestamp DESC);

Embora não seja um problema para um projeto de hobby, como você resolve o problema de duas mensagens serem enviadas exatamente ao mesmo tempo. Estou ciente do TimeUUID, mas quero que as mensagens sejam classificadas pelo carimbo de data e hora de quando foram enviadas, e não parece que existam maneiras oficiais de criar um arquivo TimeUUIDdiferente do now().

Prevejo usar esse banco de dados para obter todas as mensagens em um determinado intervalo de tempo para um determinado fluxo. Sei que poderia adicionar outro UUIDcampo para garantir a exclusividade, mas isso atrapalharia minha consulta, pois preciso especificar um horário exato.

Qual é a maneira correta de ordenar esses dados para permitir consultas eficientes?

1 respostas

Voted

Aaron · Answer 1 · 2024-01-15T22:22:35+08:00

Sei que poderia adicionar outro campo UUID para garantir a exclusividade, mas isso atrapalharia minha consulta, pois preciso especificar um horário exato.

Não se você a adicionou como a última coluna de cluster:

CREATE TABLE IF NOT EXISTS chat_data.twitch_chat_by_broadcaster_and_timestamp (
    broadcaster_id int,
    timestamp int,
    message_id uuid,
    message text,
    PRIMARY KEY (broadcaster_id, timestamp, message_id)
) WITH CLUSTERING ORDER BY (timestamp DESC, message_id ASC);

Dessa forma, você poderia simplesmente gerar um novo UUID no momento da gravação. Contanto que você consulte a chave de partição de broadcaster_id, os dados ainda serão classificados por (ambos) timestamp, com message_idadição para garantir a exclusividade.

Pelo que posso ver, a consulta de mensagens por broadcaster_idnão muda:

> SELECT * FROM twitch_chat_by_broadcaster_and_timestamp WHERE broadcaster_id=68;

 broadcaster_id | timestamp     | message_id                           | message
----------------+---------------+--------------------------------------+---------------------------
             68 | 1705328231991 | ac74c7ba-1813-4b75-b873-8817c6f89a55 |            End of stream.
             68 | 1705328230499 | 0e2116d5-887c-4433-b9cc-e5c13534902d |  Next stream coming soon.
             68 | 1705327984482 | 01c52a3a-c1c3-4db4-b8a8-6f9fe3111911 |        Incoming messages!
             68 | 1705327983581 | 7a3c2444-5746-4928-9e6a-0ebaac7fbec5 | Next stream starting soon

Garantindo exclusividade em dados classificados no Cassandra

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Garantindo exclusividade em dados classificados no Cassandra

1 respostas

relate perguntas