如果我在同一列上创建两个(或更多)不同类型的索引,PostgreSQL 会如何表现?
在我的例子中,我想将 B-Tree 索引与tsvector
列上的 GIN 进行比较。我知道 GIN 专门用于tsvector
. 奇怪的是,如果我创建 B-Tree 索引,PostgreSQL 不会抱怨,但我发现查询计划器没有使用它。我还可以创建一个 GIN 索引(无需删除 B-Tree 索引),现在规划器使用新创建的索引。该列现在有两个索引,但只使用了其中一个。
即使存在两个以上的索引,用于选择一个索引类型与另一个索引类型的标准是什么?为什么 PostgreSQL 不告诉我 a 上的 B-Tree 索引tsvector
是无用的并且永远不会被规划器使用?
更新
GIN 索引仅用于某些检查条件,my_tsvector IS NOT NULL
但(显然)不用于my_tsvector @@ '...'::tsquery
.
如果索引是查询规划器可以提出的最快计划的一部分,则将使用该索引。成本估算涉及许多因素。必要条件:指数必须适用。索引绑定到运算符,而不是数据类型或函数或其他任何东西。运算符由左右操作数的运算符和数据类型定义。btree索引手册:
还有更多,请阅读手册。
相关案例更多解释:
上的 btree 索引
tsvector
并非无用。它可用于对行进行排序(隐式使用>=
或<=
运算符):或者它可以用于相等谓词:
但它不能用于谓词
my_tsvector @@ '...'::tsquery
。为此,您需要一个 GIN 或 GiST 索引。两者都默认使用运算符类tsvector_ops
(无需显式声明):那么索引就适用了。但是 Postgres 可能仍会根据表统计信息和成本设置决定使用不同的查询计划......
您可以有许多涉及相同索引列的索引。种类繁多,种类繁多,运算符种类繁多,组合方式多种多样。查询规划器只会考虑适用的索引并根据许多因素估算成本......
您甚至可以使用不同的名称多次创建相同的索引。然后 Postgres 将任意选择。您有责任不创建无意义的重复对象。