如何按大小对 du -h 输出进行排序

Question

ethrbunny

Asked: 2014-11-12 05:52:50 +0800 CST2014-11-12 05:52:50 +0800 CST 2014-11-12 05:52:50 +0800 CST

cassandra 设置 - 负载不均匀 - 我做错了什么？

772

为了便于理解，我使用 Cassandra 的最新/最大（已发布）版本设置了一个 4 节点集群。这四个节点是使用几乎完全默认的设置按顺序启动的，并且似乎可以正常通信。

然后我创建了一个模式，如下所示：

CREATE KEYSPACE first WITH replication = {
  'class': 'SimpleStrategy',
  'replication_factor': '1'
};

创建一个包含 5 列的简单表并添加约 100K 行数据。一切都很好。每个客户都可以获得数据，所以我认为它是均匀分布的。

所以我正在研究一种备份策略并开始处理快照等问题。在每台机器上运行后nodetool snapshot，我想知道它创建了什么。我转到第一台机器并查看/var/lib/cassandra/data/first，发现它是空的。嗯..第二台机器..同样的事情..第三台..最后在第四台机器上，我看到数据文件夹和快照目录中的文件。

运行nodetool ring显示每个系统大约拥有25%，但负载严重偏向（似乎）最终拥有所有数据的一个系统。

所有数据真的都在这台机器上吗？我在配置中错过了哪一步？

1 个回答

Voted

Selvam Palanimalai · Answer 1 · 2015-01-27T00:15:45+08:00

Best Answer

Selvam Palanimalai

2015-01-27T00:15:45+08:002015-01-27T00:15:45+08:00

Cassandra 将令牌范围分配给集群中的每个节点。

由于您的配置中有 4 个节点，因此将 25% 的令牌分配给每个节点。

每个插入查询都会为该行数据生成一个哈希。哈希将始终属于一个且仅属于一个令牌范围，因此该行数据存储在该特定物理节点中。

在您的情况下，大多数插入查询具有相同或相似的分区键，导致相同的物理节点，即节点 4。

有关更多详细信息，请观看解释分区的 datastax 网站。

1

cassandra 设置 - 负载不均匀 - 我做错了什么？

新安装后 postgres 的默认超级用户用户名/密码是什么？

SFTP 使用什么端口？

命令行列出 Windows Active Directory 组中的用户？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

cassandra 设置 - 负载不均匀 - 我做错了什么？

1 个回答

相关问题

新安装后 postgres 的默认超级用户用户名/密码是什么？

SFTP 使用什么端口？

命令行列出 Windows Active Directory 组中的用户？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？