AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 17277
Accepted
bumble_bee_tuna
bumble_bee_tuna
Asked: 2012-05-01 17:35:19 +0800 CST2012-05-01 17:35:19 +0800 CST 2012-05-01 17:35:19 +0800 CST

什么时候可以收缩数据库?

  • 772

我知道收缩是魔鬼:它会颠倒页面顺序并导致皮肤癌、数据碎片化和全球变暖。清单还在继续……话虽如此,假设我有一个 100 GB 的数据库,我删除了 50 GB 的数据——不是在一个表上,而是在数据库范围内对旧数据进行一般修剪,覆盖 90%表——这是否构成缩小数据库的适当用例?

如果不是,那么在从数据库中删除如此高比例的数据后,采取哪些适当的步骤来清理房屋?我可以想到两个:重建索引和更新统计信息。还有什么?

sql-server disk-space
  • 5 5 个回答
  • 67992 Views

5 个回答

  • Voted
  1. Aaron Bertrand
    2012-05-01T17:49:28+08:002012-05-01T17:49:28+08:00

    数据库会再次增长吗?如果是这样,那么您在收缩操作中所付出的努力将是一种浪费,因为当您减小文件大小然后添加更多数据时,文件将不得不再次增长,并且交易必须等待这种增长发生。如果您有次优的自动增长设置和/或缓慢的驱动,那么这种增长活动将非常痛苦。

    如果您确实缩小了数据库,您打算将释放的磁盘空间用于什么?同样,如果您只是要保留该空间以防该数据库再次增长,那么您只是在转动轮子。

    既然您已经在文件中获得了所有这些可用空间,您可能会考虑做的事情是重建索引以便更好地优化它们(当您有可用空间时这样做会少得多痛苦 -考虑尝试在小壁橱和大卧室中更换毛衣)。

    因此,除非这是一个主要的清理操作,并且您真的不会再次提升到相同级别的数据,否则我将保持原样并专注于其他优化领域。

    • 15
  2. Best Answer
    David Spillett
    2012-05-02T05:32:35+08:002012-05-02T05:32:35+08:00

    真正不推荐重组和收缩。

    如果您可以使数据库正在离线服务的应用程序,您可以通过在收缩之前删除所有索引和主/外键约束来加快进程并减少索引碎片(这意味着移动的数据更少,因为只有数据页面将被打乱,而不是现在不存在的索引页面,加快进程)然后重新创建所有索引和键。

    在收缩之后重新创建索引意味着它们不应该被严重碎片化,并且在收缩期间它们消失意味着重建它们不会在文件中的页面分配中留下许多可能在以后引起碎片的小“洞”。

    如果您可以使应用程序脱机,另一种选择是将所有数据迁移到具有相同结构的新数据库中。如果您的构建过程可靠,您应该能够快速构建该空白数据库,如果不能从当前数据库创建一个(恢复当前数据库的备份,截断/删除表中的所有内容并执行完全收缩)。

    您可能仍希望删除目标中的所有索引并在之后重新创建它们,因为在更改大量索引数据(在这种情况下为 100%)时,这样做会更有效率。为了加快复制过程,将不同物理驱动器上的目标数据库的数据文件保存到源(除非您使用 SSD,在这种情况下您不需要关心减少头部移动),您可以移动它们完成后到源位置。

    此外,如果将目标创建为新的(而不是通过清空源的副本)创建它,其初始大小将包含所有当前数据加上几个月的增长 - 这将使数据复制再次更快一点它不会在整个过程中时不时地分配新空间。

    这可能比使用收缩更好,因为将数据迁移到新数据库会复制收缩操作的预期操作,但碎片可能要少得多(这是重组和收缩的意外结果)。收缩只是从文件末尾附近获取块并将它们放在靠近开头的第一个空间中,而不会努力将相关数据保持在一起。

    我怀疑结果在空间方面也会更有效,因为之后可能会减少部分使用的页面。收缩只会移动部分使用的页面,移动数据更有可能导致完整页面,特别是如果您按照表的聚集键/索引(表有一个)的顺序插入目标并创建其他索引数据全部迁移后。

    当然,如果您根本无法使应用程序脱机,那么仅执行收缩是您唯一的选择,因此如果您确实需要回收空间,那就去吧。根据您的数据、访问模式、常见工作集大小、服务器有多少 RAM 等等,额外的内部碎片最终可能并不那么重要。

    对于复制操作,SSIS 或基本 T-SQL 都可以正常工作(SSIS 选项可能效率较低,但以后可能更容易维护)。如果您在最后创建 FK 关系以及索引,则无论哪种情况,您都可以执行简单的“为每个表复制”。当然,一次性收缩+重组可能也很好,但我只是想吓唬人们不要考虑定期收缩!(我知道人们每天都安排他们)。

    • 14
  3. GilesDMiddleton
    2012-05-01T23:07:18+08:002012-05-01T23:07:18+08:00

    如果您的空间不足,并且您的数据不应该变得那么大然后缩小,但是在使用允许典型增长的适当填充因子之后重建您的索引。

    如果您的最终目标实际上是减少备份大小,请确保实施全面的备份策略以清除事务日志,并且在备份数据库时使用压缩选项。

    • 创建完整数据库备份 (SQL Server)
    • 事务日志备份 (SQL Server)

    我不会推荐 5GB 的自动增长,除非您通常期望经常增长 5GB。否则,您可能会遇到间歇性性能问题。您的数据大小应首先设置为您认为需要的,例如一年,并且自动增长应设置为您测试过的大小,不会影响操作性能。请参阅不要触摸 SQL Server 中的缩小数据库按钮!通过迈克沃尔什。

    在收缩之前重建索引会导致索引布局错误。重建然后收缩是不好的。收缩会导致索引被破坏以恢复空间 - 因此事先重建然后收缩是没有意义的。请参阅Thomas LaRock 的何时使用 Auto Shrink。

    • 3
  4. Kahn
    2015-10-14T03:19:12+08:002015-10-14T03:19:12+08:00

    回来晚了。尽管如此,我们也一直在思考和测试在我们的测试环境中使用收缩很长一段时间。根据主题,有时缩小是一个可行的选择。但是知道何时以及如何应用它对于长期和短期的正确执行至关重要。

    在我们的场景中,我们最近对我们的大型数据库添加了许多更改,包括压缩、分区、归档和冗余数据的简单旧删除。结果,我们的主要数据文件的已使用部分已下降到不到原来的一半。但是随身携带所有这些行李有什么意义呢?特别是因为与网络上的一些文章相反,数据文件的大小与备份/恢复持续时间直接相关。这是因为与许多文章所假设的不同,现实生活场景在任何给定页面上加载的数据不仅仅是您可能删除的内容。

    更重要的是,这为收缩开辟了一个很好的场景:

    1. 创建一个脚本,它将在您的数据库中找到所有对象及其文件组(在线大量示例),使用它来创建 drop 子句以及为每个索引和约束创建定义。
    2. 创建一个新的文件和文件组,并将其设为默认值。
    3. 删除所有非聚集索引(注意,一些索引可以是约束)。
    4. 使用 DROP_EXISTING = ON 在新文件组上创建聚集索引(顺便说一句,与许多替代方法相比,这是一个非常快速、最少记录的操作)。
    5. 重新创建非聚集索引。
    6. 最后,缩小您的旧数据文件(通常是 PRIMARY)。

    这样,剩下的唯一数据就是数据库的系统对象、统计信息、过程等等。收缩应该更快,更快,并且不需要对您的主要数据对象进行任何进一步的索引维护,这些数据对象将按顺序创建,并将未来碎片的风险降至最低。

    • 2
  5. cfradenburg
    2012-05-02T04:04:27+08:002012-05-02T04:04:27+08:00

    我不知道这是否比缩小后重新索引更好,但另一种选择是创建一个大小合适的新数据文件并将所有数据移动到该文件。在那种情况下,我会先做一个重新索引,这样你就知道实际的数据大小是多少。一个问题是,如果这是主数据文件中的第一个文件,我认为你不能清空它。您应该能够缩小它,然后再将数据移回,这样可以避免页面反转。但是,如果您正在考虑转向固态,那无论如何都不应该有太大的不同。

    • 1

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何查看 Oracle 中的数据库列表?

    • 8 个回答
  • Marko Smith

    mysql innodb_buffer_pool_size 应该有多大?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    从 .frm 和 .ibd 文件恢复表?

    • 10 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve