具有 1 个外部 IP 的 Cassandra 多数据中心配置

Question

Asked: 2024-05-24 14:18:14 +0800 CST2024-05-24 14:18:14 +0800 CST 2024-05-24 14:18:14 +0800 CST

批量加载快照，sstableloader返回“[table]不存在”

772

我在一个简单的 scylla 集群上有大约 60GB 的数据，我想将它们迁移到 Cassandra 4.1.5。我已经用命令在 scylla 上拍摄了快照

nodetool snapshot -t scylla-20240524 --table <table> <keystore>

我现在尝试将其导入 Cassandra 运行

bin/sstableloader -d localhost -k <keystore> /mnt/scylla-20240524

但我得到以下输出：

Established connection to initial hosts
Opening sstables and calculating sections to stream
Skipping file me-4332-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4333-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4334-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4335-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4400-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4401-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4402-big-Data.db: table <keystore>.scylla doesn't exist
Skipping file me-4403-big-Data.db: table <keystore>.scylla doesn't exist

Summary statistics: 
   Connections per host    : 1         
   Total files transferred : 0         
   Total bytes transferred : 0.000KiB  
   Total duration          : 3954 ms   
   Average transfer rate   : 0.000KiB/s
   Peak transfer rate      : 0.000KiB/s

我在 scylla 模式中找不到“scylla”作为表...我应该做些什么来准备 cassandra 模式？或者还有什么？

2 个回答

Voted

Erick Ramirez · Answer 1 · 2024-05-24T15:00:51+08:00

问题与您传递到的目录有关sstableloader。运行命令的格式为：

$ sstableloader -d host [options] /path/to/ks_name/table_name/

其中table_name/必须是您正在克隆的表的名称以及包含数据文件的子目录。在您的情况下，您提供的路径是/mnt/scylla-20240524这样的，加载器命令认为表名称是scylla。

您需要将快照的内容复制到遵循格式的目录结构中ks_name/table_name/。

如果您感兴趣，我之前在如何将表中的数据迁移到新的 Cassandra 集群？中编写了将数据从一个集群克隆到另一个集群的分步过程。。干杯!

Madhavan · Answer 2 · 2024-05-24T21:56:34+08:00

另一种选择是利用这个完全 OSS DSBulk工具，因为它可以很好地为您的用例无缝处理 60GB。

它可以像这个命令一样简单，

# './dsbulk --version' should be 1.11.0

./dsbulk unload -k origin_keyspace_name -t origin_table_name -u <USERNAME> -p <PASSWORD> | ./dsbulk load -k target_keyspace_name -t target_table_name -u <USERNAME> -p <TARGET_PASSWORD>

注意：这不使用本地存储，因为我们使用管道函数直接利用源集群中卸载的行并将它们加载到目标集群。

资源

如果您需要使用其他高级配置，请提供文档
解释 DSBulk 用法、提示和技巧的技术博客

批量加载快照，sstableloader返回“[table]不存在”

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

批量加载快照，sstableloader返回“[table]不存在”

2 个回答

相关问题