假设我有一个包含约 3000 万个条目和 40 列的 MySQL 表,我有一个高度活跃的查询(5 个查询/秒),它非常慢(平均约 20 秒)并且扫描的行数很高(平均 50.000行)。随着表的增长,性能越来越差。我想通过添加正确的复合甚至覆盖索引来解决问题。
教义查询由动态查询构建器构建,涉及以下属性(任何查询中仅使用 userId,所有其他列有时仅用于过滤):
- 总是:
user_id
int 有=
[> 1 m 用户,但单个用户可能有 > 200K 条目] - 有时:带有[7 种可能性]
status
的 varchar(20)IN()
- 有时:
expiration_timestamp
带有<
[可以是任何时间戳]的日期时间 - 有时:
type
varchar(20)( 有IN()
[7 种可能性] - 罕见:
name
varchar(255) 带有LIKE
[带有尾随通配符,很少重复] - 非常罕见:带有[前导通配符和尾随通配符] 的
tags
varchar(2000)LIKE
- 经常:
orderBy id int DESC
[id为主键,orderBy是必须的]
未经测试(将需要具有维护窗口的生产部署,包括短停机时间)我会提出以下解决方案:
CREATE INDEX listing ON items(user_id,status,type,name,expiration_timestamp,id);
这是我的推理:首先,user_id
总是与相等比较一起使用,所以这应该是第一个。status
并且type
有一个IN
子句,因此它们应该是第二个。第三个是name
,因为即使LIKE
使用尾随通配符,它也是高度选择性的。索引expiration_timestamp
将有助于显着减少结果的数量。id
由于 MySQL 使用索引进行排序,因此将 放在复合索引的末尾是有意义的。没有理由将标签放入索引中,因为带有前导通配符的 LIKE 上的索引是无用的。
这是正确的方法还是你会建议在这里改进一些东西?
还有一个我不确定的事实:如果查询没有类型或状态,MySQL 是否足够“智能”以使用我的复合索引?对 MySQL 索引还是很陌生,感谢您的帮助!