有人可以帮我弄清楚我对以下内容的理解是否正确:
在我的可读辅助副本的 AG 仪表板上,我看到:
- 预计恢复时间(秒) - 4598
- REDO 队列 - 将近 24 GB
那么,如果我的辅助 AG 需要作为活动的一部分进行节点/故障转移或 SQL 重新启动,这到底意味着什么?
这是否意味着我的辅助将需要 4598 秒才能使用重做队列 24 GB 来启动这个数据库?
我很担心,因为我们的 prod sec 方面的大部分时间在白天重做大小为 400 GB 和从 AG 仪表板恢复时间近 10 小时。这是否意味着所谓的 DR 受到损害?
我刚刚进行了测试故障转移,正如我从错误日志消息中看到的那样,DB 进行了恢复,并看到它在 1235 秒内完成。只是好奇,因为估计恢复的数量还很遥远。这只是为了解释我的业务用户帮助他们我们正在谈论什么中断窗口。
估计恢复时间是 SQL Server 认为运行恢复过程所需的时间,以使数据库进入可读写、可用状态。4600 秒是很长的时间。你应该担心。
REDO 队列是需要重播到辅助数据库以使数据库作为主数据库联机的数据量。24GB很多。
公司的恢复点和恢复时间目标是什么?这两个指标会告诉您那些预计恢复时间和重做队列是否有问题。
来自微软的文档:
显然,重做率(可以恢复的速度)是决定辅助节点作为主节点联机的速度的决定性因素。
如果底层磁盘的速度可能会波动,就像质量较低的 HDD 或云服务一样,您可能会得到一个无法反映现实的估计值。