我有一个在全球范围内安装的应用程序,它使用从 SQL Server 2008 Express 到 SQL Server 2017 企业版的 SQL 版本。
我尝试了几种方法来在一个大表上创建索引(3 列,包括 3 列),其中数据库通常处于简单恢复模式,但可以作为完全恢复模式......硬件可能与一个客户顶部有很大差异其他:
- 更改表创建索引...
- 使用新索引创建一个 tmp 表,并使用“插入”复制数据,然后是原始表的删除表和 tmp 表的重命名以替换原始表。
- 使用新索引创建一个 tmp 表,并使用 PowerShell 脚本复制数据,然后将原始表的删除表和 tmp 表重命名以替换原始表。
3 个选项中最快的是第一个选项(创建非聚集索引的传统方式),它花费了 1 小时 15 分钟,记录了超过 1.06 亿条记录(该表有 200 列......不理想,但这是我正在使用的)其他选项花费了三倍的时间甚至更多)
不幸的是,我无法使用在线功能,因为 SQL Server 版本有多种,并且在线仅适用于企业版。
在我的实验室里 1 小时 15 分钟太长了,我想尝试另一种方法来降低它,特别是在我们的下一个应用程序更新中,我们需要创建 23 个索引......而我没有没有看到需要 5-6 小时的更新,客户也不会希望等待 5-6 小时来更新软件。
此外,在更新期间,更新不需要数据库上的任何活动。
我正在寻找的只是我可以尝试在合理的时间内创建索引的想法。没有代码!只需要理论上的想法。
任何想法将不胜感激。
我将其作为答案,即使它主要是扩展评论®。
您没有提及索引定义或您尝试索引的列类型。您说该表有 200 列,但除非您正在创建聚集索引,否则这无关紧要。除非您尝试在 200 列上创建非聚集索引。如果是这样,请重新考虑。
鉴于您在许多不同的版本中执行此操作,它们很可能也都在不同的硬件上。在创建索引的情况下,硬件和现有索引将对完成所需的时间产生巨大影响。这不像您可以调整索引创建背后的查询。同样,企业版并行创建索引的能力也是一个重要因素。
除了硬件之外,系统并发性也可以通过阻塞或整体资源使用来发挥作用。你没有提到这些是否是问题,所以对于任何试图回答的人来说,这都是一个盲点。
在较新版本的 SQL Server 中,您可以选择在 tempdb 中对创建的索引进行排序。这会有所帮助,只要 tempdb 在您的不同环境中不是 Full Metal Potato©。
最后,您没有提及数据库的恢复模式。由于
CREATE INDEX
可以最低限度地记录,因此可能值得切换到SIMPLE
或BULK LOGGED
恢复模式。这将取决于您的 RPO 和 RTO 目标,以及是否可以将它们关闭以创建索引的窗口。对第 2 步的快速评论与上述评论有点相关:如果您创建一个没有索引的表,然后进行数据加载并创建索引,它可能会更快。特别是在
SIMPLE
or中BULK LOGGED
,您可以使用TABLOCK
提示来潜在地获得最少的插入日志记录以及索引创建。您的问题可能会因为过于宽泛而被关闭,但我希望您发现此 Extended Comment® 对您有所帮助。