具有 1 个外部 IP 的 Cassandra 多数据中心配置

Question

Asked: 2023-11-08 02:37:31 +0800 CST2023-11-08 02:37:31 +0800 CST 2023-11-08 02:37:31 +0800 CST

Cassandra dsbulk 加载带有空值的数据并没有实现它

772

我有一个包含 2 个字段的表：id (primary key) fld_1 text，例如1 'hello world'，我在目标表中有 1 行，并且我有包含 1 行的源 tsv 文件：1\t。加载到目标表后，我希望看到1 null，但数据没有改变，我仍然得到1 'hello world' 设置'dsbulk.schema.nullToUnset': 'false'帮助我，但在我看来，这不是最好的解决方案，是否有任何正确的方法来加载具有空值的数据或提供的解决方案可以吗？

Paul · Answer 1 · 2023-11-08T03:50:00+08:00

您所描述的是预期行为，DSBulk 默认情况下将避免插入空值，因为这些会导致 Cassandra 中出现逻辑删除。
如果不覆盖“hello world”的现有值，只需更新 id 列，它仍然会存在。

如果您打算进行任何批量加载，我强烈建议您避免使用dsbulk.schema.nullToUnset并允许其默认为 true。如果您需要覆盖某些内容，请不要插入空值，而是包含空字符串、特殊字符、字符串“null”等。但不要插入大量空值，因为您将不必要地创建大量空值。如果需要读取此数据，可能会导致问题的墓碑。

Cassandra dsbulk 加载带有空值的数据并没有实现它

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

Cassandra dsbulk 加载带有空值的数据并没有实现它

1 个回答

相关问题