SQL Server - 使用聚集索引时如何存储数据页

Question

Aleksey Vitsko

Asked: 2021-01-20 06:04:32 +0800 CST2021-01-20 06:04:32 +0800 CST 2021-01-20 06:04:32 +0800 CST

如果 SQL Server 失去与 master 和 msdb 系统数据库所在的 SAN 的网络连接，它会脱机吗？

772

我有一个设置，其中 3 台服务器组合成可用性组

所有 3 台服务器都有本地直接连接的 SSD 驱动器，用户数据库文件托管在这些驱动器上

但是 AG 中每台服务器的系统数据库（master 和 msdb）都托管在通过网络访问的 SAN 设备上

尚未将它们移动到本地 SSD 驱动器

问题：

在任何服务器和 SAN 设备之间的网络连接丢失（电缆损坏、NIC 损坏、一些临时网络故障等）的假设情况下，

该服务器上的 SQL Server 服务会立即脱机或停止正常工作吗？
或者如果 master 和 msdb 在网络中断之前缓存在 RAM 中，它会继续工作一段时间？

3 个回答

Voted

J.D. · Answer 1 · 2021-01-20T06:09:43+08:00

J.D.

2021-01-20T06:09:43+08:002021-01-20T06:09:43+08:00

您不能依赖缓存在内存中的系统数据库，更有可能它们不会是因为它们相对于用户数据库的访问频率较低。

我认为您最终将处于准功能状态，您的用户数据库仍然可以访问，但服务器实例的某些功能依赖master并且msdb会抛出一些奇怪的错误，具体取决于您的服务器正在做什么。SQL Server 实例的服务应继续保持在线（“已启动”状态）。例如，如果您有任何Scheduled Agent Jobs，我敢打赌（但不能在没有测试的情况下肯定地说）他们在尝试运行时会遇到错误（无论是默默地还是明显地），因为他们的大部分元数据是存储在msdb数据库中。

如果发生这种情况，您最好尽快恢复对这些系统数据库的访问，以保证所有特性和功能的 100% 可靠性。

4

Ronaldo · Answer 2 · 2021-01-20T11:06:26+08:00

从文档

可用性组数据库级别运行状况检测故障转移选项文档的警告部分包含一些可能会改进我们对该问题的猜测的信息：

需要注意的是，Database Level Health Detection 选项当前不会导致 SQL Server 监控磁盘正常运行时间，并且 SQL Server 不会直接监控数据库文件的可用性。如果磁盘驱动器发生故障或变得不可用，则不一定会触发可用性组自动故障转移。

例如，当数据库空闲且没有活动事务且没有发生物理写入时，如果某些数据库文件变得不可访问，SQL Server 可能不会对文件执行任何读取或写入 IO，并且可能不会更改状态立即为该数据库，因此不会触发故障转移。稍后，当发生数据库检查点，或发生物理读取或写入以完成查询时，SQL Server 可能会注意到文件问题，并通过更改数据库状态以及随后设置了数据库级别健康检测的可用性组来做出反应将由于数据库运行状况更改而进行故障转移。

又例如，当SQL Server数据库引擎需要读取数据页来完成查询时，如果数据页缓存在缓冲池内存中，则可能不需要物理访问的磁盘读取来完成查询请求。因此，即使启用了数据库运行状况选项，丢失或不可用的数据文件也可能不会立即触发自动故障转移，因为数据库状态不是立即的。

来自（足够接近的）实验室测试

我将数据master和msdb日志文件放在笔式驱动器（驱动器 D:) 上——为了简洁起见，我不会描述这个过程；
启动实例并在我的实验室数据库上运行一些 DML Lab；
连接master我运行的数据库select name, state_desc from sys.databases;；
拔下笔式驱动器（没有Safely Remove Hardware and Eject Media，只是从桌面上拔下它）；
在我的实验室数据库上运行了更多的 DML——Lab一切都很好，我什至更新了一个表；
SQL Server 仅在我尝试运行时才注意到该问题CREATE DATABASE StorageOffline;。我收到以下错误消息：

消息 823，级别 24，状态 2，第 4 行操作系统在文件“D:\MSSQL\master.mdf”中的偏移量 0x0000000041c000 处读取期间向 SQL Server 返回错误 21（设备未准备好。）。SQL Server 错误日志和操作系统错误日志中的其他消息可能会提供更多详细信息。这是威胁数据库完整性的严重系统级错误情况，必须立即纠正。完成完整的数据库一致性检查 (DBCC CHECKDB)。这个错误可能是由许多因素引起的；有关详细信息，请参阅 SQL Server 联机丛书。
得到错误后，我重复了第 3 步，结果是一样的：所有数据库的状态仍然是ONLINE。因此，尽管 SQL Server 知道驱动器文件存在问题，但D:\它并没有改变数据库的状态，也没有使实例脱机；

我继续使用Lab数据库几分钟没有（明显的）主要问题，并且在我写这个答案时实例才停止工作。当然，在生产中继续工作并不是一个可靠的状态，但是下线需要一些时间。

结论

基于这些信息，我的想法是：

该服务器上的 SQL Server 服务会立即脱机或停止正常工作吗？

我会说不。我还没有使用可用性组，但是如果该功能旨在使重要的数据库保持在线状态并且它不监控磁盘正常运行时间或正在积极监控的数据库的数据库文件可用性，它不会更快地注意到问题不属于可用性组的数据库。

或者如果 master 和 msdb 在网络中断之前缓存在 RAM 中，它会继续工作一段时间？

是的，但这取决于您的环境有多忙。数据库将保持在线状态，直到 SQL Server 尝试在数据库文件上读取master或写入内容。msdb

但我同意京东的观点，你不应该依赖这种情况给你足够的时间来采取任何措施来避免你的实例下线。

Joshua · Answer 3 · 2021-01-20T14:33:59+08:00

Joshua

2021-01-20T14:33:59+08:002021-01-20T14:33:59+08:00

取决于什么样的离线。我让它自己进入一个不知道提交了哪些事务的状态，因为它看到的故障模式是写入 dbs 在块级别失败。它很好地向日志发送垃圾邮件，但在我手动退回它之前无法恢复，因为它会在遇到 IO 错误后认为内存中的副本是正确的。

我敢肯定有人会过来说这简直是疯了。我同意。这是可怕的行为。但是我在现场观察到了。当使服务器恢复正常时，SELECT观察者显示数据库已回滚。请注意，虽然任何运行 a COMMITsaw it 的人都会出错，但进一步SELECT的语句可以看到失败提交的结果，就好像他们已经通过使用语句读取它们而成功一样，SELECT直到我手动回收它为止。

呸。

3

如果 SQL Server 失去与 master 和 msdb 系统数据库所在的 SAN 的网络连接，它会脱机吗？

从文档

来自（足够接近的）实验室测试

结论

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

如果 SQL Server 失去与 master 和 msdb 系统数据库所在的 SAN 的网络连接，它会脱机吗？

3 个回答

从文档

来自（足够接近的）实验室测试

结论

相关问题