goric Asked: 2011-01-24 11:34:39 +0800 CST2011-01-24 11:34:39 +0800 CST 2011-01-24 11:34:39 +0800 CST 什么是数据库统计信息,我如何从中受益? 772 我听说过 SQL Server 默认保留的统计信息。他们在跟踪什么,我如何使用这些信息来改进我的数据库? sql-server-2005 statistics 2 个回答 Voted Best Answer Gaius 2011-01-24T11:45:46+08:002011-01-24T11:45:46+08:00 统计数据只是帮助查询优化器做出更好决策的一种动态元数据。例如,如果一个表中只有十几行,那么去索引进行查找是没有意义的;进行全表扫描总是会更好。但是,如果同一张表增长到一百万行,那么使用索引可能会更好。但是,如果您在仅具有很少唯一值的列上查询该表(例如,它可能是仅包含“M”或“F”的“性别”列),那么实际上 FTS 可能会比这种情况更好,因为您会无论如何都需要检索块来构建结果集。现在假设您的表是 99% 的“M”而只有 1% 的“F”,我们应该在一种情况下使用 FTS,或者在另一种情况下使用索引。相同的表,相同的查询,根据表的内容,可能有四种不同的查询计划。这些东西就是“统计数据”,它们对每个数据库都是独立的——即使两个具有相同表和索引结构的数据库也会有不同的统计数据。 总之,在现代数据库引擎中,有两种查询优化:重写 SQL(基于规则的优化,就像编译器重写你的 C 以使其更高效)和选择正确的数据路径(基于成本的优化,例如在运行时识别热点的 JIT 编译器)。如果您发现查询优化器做一些明显错误的事情(例如,当您知道索引会更好时选择 FTS),您只需要担心这一点。 gbn 2011-01-24T11:40:38+08:002011-01-24T11:40:38+08:00 查询优化器(MSDN 上的白皮书)使用它们来跟踪索引和/或列中值的分布。 你唯一关心的应该是定期更新:让数据库引擎去做它的事情
统计数据只是帮助查询优化器做出更好决策的一种动态元数据。例如,如果一个表中只有十几行,那么去索引进行查找是没有意义的;进行全表扫描总是会更好。但是,如果同一张表增长到一百万行,那么使用索引可能会更好。但是,如果您在仅具有很少唯一值的列上查询该表(例如,它可能是仅包含“M”或“F”的“性别”列),那么实际上 FTS 可能会比这种情况更好,因为您会无论如何都需要检索块来构建结果集。现在假设您的表是 99% 的“M”而只有 1% 的“F”,我们应该在一种情况下使用 FTS,或者在另一种情况下使用索引。相同的表,相同的查询,根据表的内容,可能有四种不同的查询计划。这些东西就是“统计数据”,它们对每个数据库都是独立的——即使两个具有相同表和索引结构的数据库也会有不同的统计数据。
总之,在现代数据库引擎中,有两种查询优化:重写 SQL(基于规则的优化,就像编译器重写你的 C 以使其更高效)和选择正确的数据路径(基于成本的优化,例如在运行时识别热点的 JIT 编译器)。如果您发现查询优化器做一些明显错误的事情(例如,当您知道索引会更好时选择 FTS),您只需要担心这一点。
查询优化器(MSDN 上的白皮书)使用它们来跟踪索引和/或列中值的分布。
你唯一关心的应该是定期更新:让数据库引擎去做它的事情