当我告诉他们我可以备份仍在运行的 SQL Server 数据库时,我的一些同事感到很惊讶,并想知道这怎么可能。我知道 SQL Server 能够在数据库仍处于联机状态时备份它,但我不知道如何解释为什么它是可能的。我的问题是这对数据库有什么影响?
如果在备份运行时修改了数据(通过插入、更新或删除),备份是否会包含这些更改,还是会在之后将其添加到数据库中?
我假设日志文件在这里起着重要作用,但我不太确定如何。
编辑:作为说明,我的案例涉及使用 SQL Server 代理备份数据库以及在此过程中数据库修改的影响。
完整备份包含数据和日志。对于数据,它只是将数据库的每个页面复制到备份中,就像它读取页面时一样。然后它将所有“相关”日志附加到备份媒体中。这至少包括备份操作开始时的 LSN 和备份操作结束时的 LSN 之间的所有日志。实际上通常有更多的日志,因为它必须包括备份开始时的所有活动事务和复制所需的日志。请参阅揭穿有关完整数据库备份的几个神话。
当数据库恢复时,所有数据页被复制到数据库文件中,然后所有日志页被复制到日志文件中。数据库此时不一致,因为它包含可能彼此不同步的数据页图像。但是现在正在运行正常的恢复。由于日志包含备份期间的所有日志,因此在恢复结束时数据库是一致的。
您不能只是复制它,因为正如您在问题中提到的那样,数据库中间副本可能会发生变化。
它必须由了解数据库功能的代理完成,然后通过操作系统功能拍摄“快照”,或者可以使用实用程序将数据库转储到安全状态(如 mysqldump,如果使用 mysql)。
否则,您会得到一个可能已损坏的备份,并且在您恢复它之前您不会知道它。我认为 Joel 和 Jeff 最近在最近的 StackOverflow 播客上谈到了一点。
你说得对,日志文件很重要。如果日志/日志文件与实际数据不同步,则恢复文件将导致损坏。
它归结为使用数据库的安全状态进行备份,通过数据库感知代理或快照应用程序或知道如何正确地将数据库挂接到删除数据而不干扰数据转储期间的更新然后备份的应用程序生成的文件。
在备份期间,将为数据库创建快照,并从该快照中读取数据以进行备份。实际的实时数据库操作不会影响备份操作。
有很多方法可以做到这一点(一般来说,不知道 MSSQL 通常是如何做到的),比如简单地将数据库转储到文件中,同时将任何更改附加到转储完成后提交的日志文件 - 利用文件系统特定的快照Windows 上的 VSS 等功能。
从Remus Rusanu的回答开始,我会说清楚并完成一些信息..
” 首先在开始备份过程之前,在事务日志文件中做一个标记,表示将开始备份。 完整备份包含数据和日志。对于数据,它只是复制数据库中所有有“记录”的页面”里面,以任何顺序,进入备份,就像它读取页面的那一刻一样,并且可以使用并行处理(模糊逻辑算法用于对页面进行排序,当它在缓存中时从内存中获取或从磁盘) 。然后它会将所有“相关”日志从开始标记附加到备份介质中,直到页面复制的最后时刻. 这至少包括备份操作开始时的 LSN 和备份操作结束时的 LSN 之间的所有日志。实际上通常有更多的日志,因为它必须包括备份开始时的所有活动事务和复制所需的日志。请参阅揭穿有关完整数据库备份的几个神话。 最后,在事务日志中完成一个新标记以指示备份过程的结束。
当需要恢复数据库时,首先该进程读取包含物理数据库组织(文件和文件组,也称为“存储”)的备份的第一页,并创建空文件的物理类似组织。然后将所有数据页复制到数据库文件中,然后将所有日志页复制到日志文件中。数据库此时不一致,因为它包含可能彼此不同步的数据页图像。但是现在正在运行正常的恢复。由于日志包含备份期间的所有日志,因此在恢复结束时数据库是一致的。
您可以采用所谓的仅复制备份。在线时不会影响数据库