AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题

问题[failover](dba)

Martin Hope
MichaelD
Asked: 2021-08-11 00:07:47 +0800 CST

高可用性主节点在重新联机时不会自动担任次要角色

  • 1

设置:

  • 基本高可用性

  • 2 个副本(1 个主副本,1 个辅助副本)。

    DB01 => 初始初级。

    DB02 => 初始二级

  • 两者同步提交

  • 两者都处于同步状态

  • 没有配置监听器

  • 集群类型 无

当我们使用 services.msc(模拟友好的服务器崩溃)停止 DB01(初始和当前主)SQL 服务,然后使用以下命令在 DB02(初始和当前辅助)上启动强制故障转移时:

ALTER AVAILABILITY GROUP [TestHA] FORCE_FAILOVER_ALLOW_DATA_LOSS;

辅助数据库上线,这是我们想要的。

但是,当使用 services.msc 再次启动 DB01 SQL Server 服务时,DB01 db 再次承担主要角色。

所以目前有 2 个实例可读/可写且不同步。我们期望初始主节点会检测到辅助节点已担任主要角色并承担次要角色,或者至少无法访问,因此应用程序无法处理旧数据。

相同的过程,但使用已弃用的镜像设置,确实会以这种方式运行。

sql-server failover
  • 1 个回答
  • 170 Views
Martin Hope
elBastarde
Asked: 2021-05-18 23:59:10 +0800 CST

Postgres CHECKPOINT 进程是否会影响流复制?

  • 0

Postgres CHECKPOINT 进程是否会以任何方式影响异步流复制?

如果checkpoint_timeout从 5min(默认)增加到 30min,则 CHECKPOINT 进程的触发频率将降低(其他一些参数也需要调整)。如果主节点崩溃,那么恢复可能需要更多时间。但是我已经配置了 Patroni,它会在崩溃的情况下将主节点故障转移到另一个节点。

我的问题是 - 如果旧主节点上的检查点触发频率降低,故障转移会持续更长时间吗?

我认为它不应该影响故障转移过程,因为 WAL 记录已经被复制并应用于辅助节点,但我想确认一下。

postgresql failover
  • 1 个回答
  • 274 Views
Martin Hope
Leonardo Lacerda
Asked: 2020-11-24 08:13:39 +0800 CST

REPMGR - 更改 reconnect_attempts 和 reconnect_interval 不起作用

  • 1

我使用 REPMGR 配置了 PostgreSQL 自动故障转移。但是,在我的模拟中,每次重新连接尝试的睡眠时间为 1 秒: 在此处输入图像描述

如果我查阅官方文档,重新连接间隔的默认值为 10 seconds。

#reconnect_interval=10 # 尝试重新连接到无法访问的主节点(或其他上游节点)之间的间隔

我尝试在repmgr.conf 中更改重新连接尝试和间隔的值并重新启动repmgr 服务并使用“repmgr 备用寄存器--force”但不起作用。

我的 REPMGR.CONF

node_id = 2
node_name = 'PGCluster02'
data_directory='/var/lib/postgresql/12/main'
conninfo = 'host=PGCluster02 port=1010 user=my_repmgr dbname=dbrepmgr connection_timeout=2'
use_replication_slots=1
reconnect_attempts=30
reconnect_interval=10
failover=automatic
promote_command='/usr/bin/repmgr standby promote -f /etc/repmgr.conf --log-to-file'
follow_command='/usr/bin/repmgr standby follow -f /etc/repmgr.conf --log-to-file --upstream-node-id=%n'

环境

PostgreSQL Version: 12.5
REPMGR Version: 5.2
Debian version: 10

我环境中的其他工具是 Barman(另一个 VM)和 PGBouncer(当前 VM)

如何将重新连接间隔更改为 10 或 15 秒?任何人都可以帮助我吗?我想将故障转移时间设置为 5 分钟。

谢谢!!

postgresql failover
  • 1 个回答
  • 206 Views
Martin Hope
uncaged
Asked: 2020-10-19 05:58:46 +0800 CST

故障转移和 DNS 传播延迟

  • 0

当 DBMS 在故障后故障转移时,如果它故障转移到不同且不相关的数据中心中的服务器,则该数据库的子域名的 IP 地址将需要在该名称的 DNS 服务器中更改,并且由于 DNS传播延迟,世界上所有的 DNS 服务器可能需要几天的时间才能获得新主服务器的 IP 地址,在此期间,一些客户端仍会尝试访问旧主服务器。除了更改客户端软件以从某个地方获取主服务器的 IP 地址之外,可以做些什么来处理这个问题,或者这是唯一的选择?谢谢。

replication failover
  • 1 个回答
  • 200 Views
Martin Hope
Francesco Mantovani
Asked: 2019-11-30 05:39:05 +0800 CST

如何维护一个永远运行的查询?

  • -1

我想运行一个查找素数的查询,并且我想永远运行它。

@Solomon Rutzky 在这个页面上给定范围内的素数,给我们一个关于埃拉托色尼筛的好例子。

DECLARE  @RangeStart INT = 1,
         @RangeEnd INT = 100000;
DECLARE  @HowMany INT = CEILING((@RangeEnd - @RangeStart + 1) / 2.0);

;WITH frst AS
(
    SELECT  tmp.thing1
    FROM        (VALUES (0), (0), (0), (0), (0), (0), (0), (0), (0), (0)) tmp(thing1)
), scnd AS
(
    SELECT  0 AS [thing2]
    FROM        frst t1
    CROSS JOIN frst t2
    CROSS JOIN frst t3
), base AS
(
    SELECT  TOP( CONVERT( INT, CEILING(SQRT(@RangeEnd)) ) )
            ROW_NUMBER() OVER (ORDER BY (SELECT 1)) AS [num]
    FROM        scnd s1
    CROSS JOIN  scnd s2
), nums AS
(
    SELECT  TOP (@HowMany)
            (ROW_NUMBER() OVER (ORDER BY (SELECT 1)) * 2) + 
                (@RangeStart - 1 - (@RangeStart%2)) AS [num]
    FROM        base b1
    CROSS JOIN  base b2
), divs AS
(
    SELECT  [num]
    FROM        base b3
    WHERE   b3.[num] > 4
    AND     b3.[num] % 2 <> 0
    AND     b3.[num] % 3 <> 0
)
SELECT  given.[num] AS [Prime]
FROM        (VALUES (2), (3)) given(num)
WHERE   given.[num] >= @RangeStart
UNION ALL
SELECT  n.[num] AS [Prime]
FROM        nums n
WHERE   n.[num] BETWEEN 5 AND @RangeEnd
AND     n.[num] % 3 <> 0
AND     NOT EXISTS (SELECT *
                    FROM divs d
                    WHERE d.[num] <> n.[num]
                    AND n.[num] % d.[num] = 0
                    );

所以我们可以很容易地生成一个从 0 到 100 的所有素数的列表。

但是假设我希望查询在接下来的 20 年内运行,所以我设置了一个非常大的数字:

DECLARE  @RangeStart INT = 1,
         @RangeEnd INT = 100000000000000000000000000000000000000000000000000;

这就是问题所在:我如何才能在接下来的 20 年内维护这个查询?

因为埃拉托色尼筛法有一个特点:

如果它被中断,你必须从头开始。

所以我的问题从这里开始:

  • 我如何设法更换 CPU、升级 RAM、更换硬盘等...
  • 如何管理故障转移灾难场景以避免该脚本停止?
  • 故障转移会保证查询不会停止吗?
  • 云冗余和故障转移到不同的提供商(Azure / AWS / GCE)这将确保脚本不会停止吗?
  • 如果故障转移是从 Azure 到全球 2 个不同地区的 AWS 怎么办?此故障转移会保持存储过程运行吗?

现在是灾难恢复部分:

  • 我可以备份,比如说每个月,该存储过程的状态,并最终从该映像恢复吗?
  • 如果我在虚拟机上运行存储过程并拍摄快照,我可以恢复存储过程吗?

我确信有人在这样做:这个分解素数的在线数据库http://factordb.com/status.php已经成功地从 200MB(2014 年)增加到今天(2019 年)的近 800MB。

在此处输入图像描述

t-sql failover
  • 3 个回答
  • 237 Views
Martin Hope
SQLMIKE
Asked: 2019-08-09 01:56:46 +0800 CST

集群故障转移的历史

  • 2

是否可以获得集群何时发生故障转移以及哪个节点成为活动节点的历史记录?

sql-server failover
  • 2 个回答
  • 959 Views
Martin Hope
FreedToFly
Asked: 2019-05-27 04:08:35 +0800 CST

如何防止实时服务器检测到强制故障转移?

  • 1

我们在 Windows Server 2016 上的 SQL 2017 中使用 AlwaysOn 可用性组,该组由我们主站点上的两台服务器和远程站点上的一台 DR 服务器组成。

我们最近进行了一次内部 IT 灾难恢复测试作为概念验证,在此期间公司其他人员继续使用主站点。我们隔离了远程 DR 网络以模拟主站点的灾难性故障,并测试了 DR 站点以确保我们可以启动并成功使用它。到目前为止,测试进行得非常顺利,但是在将事情恢复正常时我们遇到了一个重大问题。

由于测试期间主站点仍在使用中,我主要关心的是确保实时数据库不会被测试期间也使用的 DR 数据库损坏,所以我在打开 VPN 之前删除了 DR 数据库我希望主站点开始自动播种回 DR 站点。但是,因为我必须在 DR 站点上强制进行故障转移,所以在重新建立网络链接后,主站点检测到 DR 服务器已使用强制仲裁开关 (/fq) 启动,它基本上关闭了两个实时服务器。我无法强制故障转移回 Live 服务器,不得不重建集群。

问题:如何防止 Live 服务器检测到在 DR 站点上执行了强制故障转移?

我确实考虑在打开网络链接之前关闭 DR 服务器,但我仍然不确定当它联机时会发生什么。在任何情况下,远程数据库都需要从 Live 重新播种。

availability-groups failover
  • 1 个回答
  • 58 Views
Martin Hope
rogerdpack
Asked: 2018-05-12 14:41:36 +0800 CST

单个 AZ AWS RDS 实例可以自我修复吗?

  • 3

如果一侧出现故障,我知道“多 AZ”数据库“自动故障转移”。我的问题是,如果您只有一个 AZ RDS 数据库,并且数据库框“死了”,AWS 会自动为您启动一个新数据库吗?在这些情况下,你能预料到腐败吗?

amazon-rds failover
  • 1 个回答
  • 698 Views
Martin Hope
Sampo
Asked: 2017-09-05 01:43:15 +0800 CST

当 master 卡在 IOWait 上时 MongoDB 故障转移?

  • 2

我们在 AWS 中托管了一个具有三个节点的 MongoDB 3.4 副本集:一个主节点、一个辅助故障转移节点和一个仲裁节点。通常,如果主实例挂掉,到辅助实例的故障转移会非常快(10-30 秒)。

今天我们遇到了一个网络问题,MongoDB 主实例与包含数据库的磁盘失去连接大约 3 分钟,CPU IOWait 达到 100%。在此期间,对主节点的查询刚刚挂起并进入超时状态。可能是因为主节点仍在运行(尽管没有响应),副本集没有进行故障转移,甚至没有开始投票。

在这种情况下是否有也会产生故障转移的配置?或者是否有一些现成的工具可以在对主节点的简单查询开始花费太长时间时强制进行故障转移?

mongodb failover
  • 2 个回答
  • 754 Views
Martin Hope
logixologist
Asked: 2016-11-10 10:59:56 +0800 CST

复制使用故障转移的数据库

  • 1

我们正在尝试为来自外部供应商的数据设置复制。我们遇到的问题是他们说因为我们的供应商正在使用 SQL 故障转移集群所以他们声称无法复制数据库?这是真的吗?是否有任何解决方法。

sql-server failover
  • 3 个回答
  • 27 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve