我知道收缩是魔鬼:它会颠倒页面顺序并导致皮肤癌、数据碎片化和全球变暖。清单还在继续……话虽如此,假设我有一个 100 GB 的数据库,我删除了 50 GB 的数据——不是在一个表上,而是在数据库范围内对旧数据进行一般修剪,覆盖 90%表——这是否构成缩小数据库的适当用例?
如果不是,那么在从数据库中删除如此高比例的数据后,采取哪些适当的步骤来清理房屋?我可以想到两个:重建索引和更新统计信息。还有什么?
我知道收缩是魔鬼:它会颠倒页面顺序并导致皮肤癌、数据碎片化和全球变暖。清单还在继续……话虽如此,假设我有一个 100 GB 的数据库,我删除了 50 GB 的数据——不是在一个表上,而是在数据库范围内对旧数据进行一般修剪,覆盖 90%表——这是否构成缩小数据库的适当用例?
如果不是,那么在从数据库中删除如此高比例的数据后,采取哪些适当的步骤来清理房屋?我可以想到两个:重建索引和更新统计信息。还有什么?
数据库会再次增长吗?如果是这样,那么您在收缩操作中所付出的努力将是一种浪费,因为当您减小文件大小然后添加更多数据时,文件将不得不再次增长,并且交易必须等待这种增长发生。如果您有次优的自动增长设置和/或缓慢的驱动,那么这种增长活动将非常痛苦。
如果您确实缩小了数据库,您打算将释放的磁盘空间用于什么?同样,如果您只是要保留该空间以防该数据库再次增长,那么您只是在转动轮子。
既然您已经在文件中获得了所有这些可用空间,您可能会考虑做的事情是重建索引以便更好地优化它们(当您有可用空间时这样做会少得多痛苦 -考虑尝试在小壁橱和大卧室中更换毛衣)。
因此,除非这是一个主要的清理操作,并且您真的不会再次提升到相同级别的数据,否则我将保持原样并专注于其他优化领域。
真正不推荐重组和收缩。
如果您可以使数据库正在离线服务的应用程序,您可以通过在收缩之前删除所有索引和主/外键约束来加快进程并减少索引碎片(这意味着移动的数据更少,因为只有数据页面将被打乱,而不是现在不存在的索引页面,加快进程)然后重新创建所有索引和键。
在收缩之后重新创建索引意味着它们不应该被严重碎片化,并且在收缩期间它们消失意味着重建它们不会在文件中的页面分配中留下许多可能在以后引起碎片的小“洞”。
如果您可以使应用程序脱机,另一种选择是将所有数据迁移到具有相同结构的新数据库中。如果您的构建过程可靠,您应该能够快速构建该空白数据库,如果不能从当前数据库创建一个(恢复当前数据库的备份,截断/删除表中的所有内容并执行完全收缩)。
您可能仍希望删除目标中的所有索引并在之后重新创建它们,因为在更改大量索引数据(在这种情况下为 100%)时,这样做会更有效率。为了加快复制过程,将不同物理驱动器上的目标数据库的数据文件保存到源(除非您使用 SSD,在这种情况下您不需要关心减少头部移动),您可以移动它们完成后到源位置。
此外,如果将目标创建为新的(而不是通过清空源的副本)创建它,其初始大小将包含所有当前数据加上几个月的增长 - 这将使数据复制再次更快一点它不会在整个过程中时不时地分配新空间。
这可能比使用收缩更好,因为将数据迁移到新数据库会复制收缩操作的预期操作,但碎片可能要少得多(这是重组和收缩的意外结果)。收缩只是从文件末尾附近获取块并将它们放在靠近开头的第一个空间中,而不会努力将相关数据保持在一起。
我怀疑结果在空间方面也会更有效,因为之后可能会减少部分使用的页面。收缩只会移动部分使用的页面,移动数据更有可能导致完整页面,特别是如果您按照表的聚集键/索引(表有一个)的顺序插入目标并创建其他索引数据全部迁移后。
当然,如果您根本无法使应用程序脱机,那么仅执行收缩是您唯一的选择,因此如果您确实需要回收空间,那就去吧。根据您的数据、访问模式、常见工作集大小、服务器有多少 RAM 等等,额外的内部碎片最终可能并不那么重要。
对于复制操作,SSIS 或基本 T-SQL 都可以正常工作(SSIS 选项可能效率较低,但以后可能更容易维护)。如果您在最后创建 FK 关系以及索引,则无论哪种情况,您都可以执行简单的“为每个表复制”。当然,一次性收缩+重组可能也很好,但我只是想吓唬人们不要考虑定期收缩!(我知道人们每天都安排他们)。
如果您的空间不足,并且您的数据不应该变得那么大然后缩小,但是在使用允许典型增长的适当填充因子之后重建您的索引。
如果您的最终目标实际上是减少备份大小,请确保实施全面的备份策略以清除事务日志,并且在备份数据库时使用压缩选项。
我不会推荐 5GB 的自动增长,除非您通常期望经常增长 5GB。否则,您可能会遇到间歇性性能问题。您的数据大小应首先设置为您认为需要的,例如一年,并且自动增长应设置为您测试过的大小,不会影响操作性能。请参阅不要触摸 SQL Server 中的缩小数据库按钮!通过迈克沃尔什。
在收缩之前重建索引会导致索引布局错误。重建然后收缩是不好的。收缩会导致索引被破坏以恢复空间 - 因此事先重建然后收缩是没有意义的。请参阅Thomas LaRock 的何时使用 Auto Shrink。
回来晚了。尽管如此,我们也一直在思考和测试在我们的测试环境中使用收缩很长一段时间。根据主题,有时缩小是一个可行的选择。但是知道何时以及如何应用它对于长期和短期的正确执行至关重要。
在我们的场景中,我们最近对我们的大型数据库添加了许多更改,包括压缩、分区、归档和冗余数据的简单旧删除。结果,我们的主要数据文件的已使用部分已下降到不到原来的一半。但是随身携带所有这些行李有什么意义呢?特别是因为与网络上的一些文章相反,数据文件的大小与备份/恢复持续时间直接相关。这是因为与许多文章所假设的不同,现实生活场景在任何给定页面上加载的数据不仅仅是您可能删除的内容。
更重要的是,这为收缩开辟了一个很好的场景:
这样,剩下的唯一数据就是数据库的系统对象、统计信息、过程等等。收缩应该更快,更快,并且不需要对您的主要数据对象进行任何进一步的索引维护,这些数据对象将按顺序创建,并将未来碎片的风险降至最低。
我不知道这是否比缩小后重新索引更好,但另一种选择是创建一个大小合适的新数据文件并将所有数据移动到该文件。在那种情况下,我会先做一个重新索引,这样你就知道实际的数据大小是多少。一个问题是,如果这是主数据文件中的第一个文件,我认为你不能清空它。您应该能够缩小它,然后再将数据移回,这样可以避免页面反转。但是,如果您正在考虑转向固态,那无论如何都不应该有太大的不同。