具有 1 个外部 IP 的 Cassandra 多数据中心配置

Question

Erick Ramirez

Asked: 2023-02-17 10:58:43 +0800 CST2023-02-17 10:58:43 +0800 CST 2023-02-17 10:58:43 +0800 CST

什么可能导致节点之间的间歇性八卦问题？

772

大多数情况下运行的 Cassandra 集群有时会遇到服务中断，尤其是当一个（或多个）节点无法与集群中的其他节点进行八卦时。

症状

一个症状是节点无缘无故地随机上升和下降。system.log以下是节点的示例摘录：

INFO  [GossipTasks:1] 2016-04-29 02:47:32,559  Gossiper.java:1001 - InetAddress /10.1.2.3 is now DOWN
INFO  [GossipTasks:1] 2016-04-29 02:50:47,123  Gossiper.java:1001 - InetAddress /10.1.2.4 is now DOWN
INFO  [GossipTasks:1] 2016-04-29 02:54:59,640  Gossiper.java:1001 - InetAddress /10.1.2.5 is now DOWN
INFO  [SharedPool-Worker-2] 2016-04-29 03:01:23,828  Gossiper.java:987 - InetAddress /10.1.2.4 is now UP
INFO  [SharedPool-Worker-1] 2016-04-29 03:01:59,432  Gossiper.java:987 - InetAddress /10.1.2.5 is now UP
INFO  [SharedPool-Worker-7] 2016-04-29 03:02:01,839  Gossiper.java:987 - InetAddress /10.1.2.3 is now UP

nodetool status同样，根据运行命令的节点，不同的节点在输出中似乎已关闭，例如：

Datacenter: Cassandra
=====================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address   Load       Tokens  Owns    Host ID                               Rack
DN  10.1.2.3  8.97 GB    256     ?       a50dfef5-229d-4d15-89d9-971bec01094b  rack1
UN  10.1.2.5  8.9 GB     256     ?       a16b71a2-9b95-4669-a6bd-d7326bd279e2  rack1
DN  10.1.2.4  9.09 GB    256     ?       ac01b6f9-3cb9-47ff-83c6-0404836386eb  rack1
UN  10.1.2.6  10.65 GB   256     ?       9c0ef3a2-aad7-4d06-b015-f32ddccac750  rack1

什么可能导致这个问题？

1 个回答

Voted

Erick Ramirez · Answer 1 · 2023-02-17T10:58:43+08:00

原因

在非常小的集群中有关于此问题的孤立报告。上述症状已被确定与配置有 (GPFS) 的集群有关，但目录中有(for )GossipingPropertyFileSnitch的副本，两者都用于定义节点的机架放置。cassandra-topology.propertiesPropertyFileSnitchconf/cassandra-rackdc.properties

cassandra-topology.properties可以在启动消息日志中验证GPFS 的组合：

INFO  [main] 2013-02-17 15:31:26,039  GossipingPropertyFileSnitch.java:63 - \
  Loaded cassandra-topology.properties for compatibility

重要的是要注意这个问题是非常间歇性的，并不是所有触发问题的向量都是已知的。

解决方法

按照设计，GossipingPropertyFileSnitch回退到上PropertyFileSnitch作为cassandra-topology.properties一种允许集群迁移到 GPFS 的方法。

如果集群已经开启，即使节点没有问题，也要GossipingPropertyFileSnitch检查是否已被删除或不存在，以确保集群将来不会遇到问题。cassandra-topology.properties

有关详细信息，请参阅CASSANDRA-11508。干杯!

什么可能导致节点之间的间歇性八卦问题？

症状

原因

解决方法

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

什么可能导致节点之间的间歇性八卦问题？

症状

1 个回答

原因

解决方法

相关问题