我将一个 16 节点的 cassandra 集群(复制因子 2)放在一起,并希望为nodetool repair
. gc_grace_seconds是默认值。
两个问题:
- 我的第一个冲动是为每台机器设置一个 cron 作业,并尝试手动随机化大约一周的时间安排。有没有更好的办法?
- 是否
nodetool repair
必须在每个系统或每个 # 系统/复制因子系统上运行?(我的 16 个节点的 IE,复制因子为 2 - 8 个系统 - 每对一个)
我将一个 16 节点的 cassandra 集群(复制因子 2)放在一起,并希望为nodetool repair
. gc_grace_seconds是默认值。
两个问题:
nodetool repair
必须在每个系统或每个 # 系统/复制因子系统上运行?(我的 16 个节点的 IE,复制因子为 2 - 8 个系统 - 每对一个)
我不会随机化它。你最好的办法是安排维修时间,这样他们就不会互相踩踏。
运行修复时,您应该在每个节点上使用 -pr 选项。
如果您使用的是 Cassandra 2.1,您可以选择增量修复,这将大大加快速度。
RF=2 也是灾难的根源。如果节点不可用,仲裁查询将失败。我推荐 RF=3。