Configuração multidatacenter Cassandra com 1 ip externo

Question

Ste

Asked: 2024-05-24 14:18:14 +0800 CST2024-05-24 14:18:14 +0800 CST 2024-05-24 14:18:14 +0800 CST

Instantâneo de carregamento em massa, sstableloader retorna "[tabela] não existe"

772

Tenho cerca de 60 GB de dados em um cluster Scylla simples e gostaria de migrá-los para Cassandra 4.1.5. Tirei um instantâneo do scylla com o comando

nodetool snapshot -t scylla-20240524 --table <table> <keystore>

Agora estou tentando importá-lo para o Cassandra executando

bin/sstableloader -d localhost -k <keystore> /mnt/scylla-20240524

Mas recebo a seguinte saída:

Established connection to initial hosts
Opening sstables and calculating sections to stream
Skipping file me-4332-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4333-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4334-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4335-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4400-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4401-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4402-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4403-big-Data.db: table <keystore>.scylla doesn't exist

Summary statistics: 
   Connections per host    : 1         
   Total files transferred : 0         
   Total bytes transferred : 0.000KiB  
   Total duration          : 3954 ms   
   Average transfer rate   : 0.000KiB/s
   Peak transfer rate      : 0.000KiB/s

Não consigo encontrar 'scylla' como tabela no esquema scylla... há algo que devo fazer para preparar o esquema cassandra? ou o que mais?

2 respostas

Voted

Erick Ramirez · Answer 1 · 2024-05-24T15:00:51+08:00

Best Answer

Erick Ramirez

2024-05-24T15:00:51+08:002024-05-24T15:00:51+08:00

O problema tem a ver com o diretório para o qual você está passando sstableloader. O formato para executar o comando é:

$ sstableloader -d host [options] /path/to/ks_name/table_name/

onde table_name/deve estar o nome da tabela que você está clonando e o subdiretório que contém os arquivos de dados. No seu caso, o caminho que você forneceu é /mnt/scylla-20240524para que o comando do carregador pense que o nome da tabela é scylla.

Você precisa copiar o conteúdo do snapshot para uma estrutura de diretórios que siga o formato ks_name/table_name/.

Se você estiver interessado, escrevi anteriormente um procedimento passo a passo para clonar dados de um cluster para outro em Como migrar dados em tabelas para um novo cluster Cassandra? . Saúde!

1

Madhavan · Answer 2 · 2024-05-24T21:56:34+08:00

Madhavan

2024-05-24T21:56:34+08:002024-05-24T21:56:34+08:00

A opção alternativa é aproveitar esta ferramenta DSBulk totalmente OSS , pois ela pode muito bem lidar com 60 GB perfeitamente para o seu caso de uso aqui.

Pode ser tão simples quanto este comando,

# './dsbulk --version' should be 1.11.0

./dsbulk unload -k origin_keyspace_name -t origin_table_name -u <USERNAME> -p <PASSWORD> | ./dsbulk load -k target_keyspace_name -t target_table_name -u <USERNAME> -p <TARGET_PASSWORD>

Observação: isso não usa armazenamento local, pois estamos usando a função pipe para aproveitar as linhas descarregadas diretamente do cluster de origem e carregá-las em nosso cluster de destino.

Recursos

Documentação caso você precise usar outras configurações avançadas
Blogs técnicos explicando usos, dicas e truques do DSBulk

1

Instantâneo de carregamento em massa, sstableloader retorna "[tabela] não existe"

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Instantâneo de carregamento em massa, sstableloader retorna "[tabela] não existe"

2 respostas

relate perguntas