如果我只获取一行,则查询需要更长的时间:1433 毫秒对 23 毫秒
有解决办法吗?
减缓:
EXPLAIN (ANALYZE, BUFFERS) SELECT * FROM "modwork_ticket" WHERE
"modwork_ticket"."email_sender_id" = '[email protected]'
ORDER BY "modwork_ticket"."date_created" ASC limit 1;
--------------------------------------------------------------------------------------------------------------------------------------------
Limit (cost=0.43..542.14 rows=1 width=1146) (actual time=1433.128..1433.129 rows=1 loops=1)
Buffers: shared hit=1466151 read=4661
-> Index Scan using modwork_ticket_date_created on modwork_ticket (cost=0.43..606714.36 rows=1120 width=1146) (actual time=1433.125..1433
Filter: ((email_sender_id)::text = '[email protected]'::text)
Rows Removed by Filter: 1705251
Buffers: shared hit=1466151 read=4661
Planning time: 2.504 ms
Execution time: 1433.218 ms
快速地:
EXPLAIN (ANALYZE, BUFFERS) SELECT * FROM "modwork_ticket" WHERE
"modwork_ticket"."email_sender_id" = '[email protected]'
ORDER BY "modwork_ticket"."date_created" ASC;
--------------------------------------------------------------------------------------------------------------------------------------------
Sort (cost=4335.83..4338.63 rows=1120 width=1146) (actual time=23.637..23.794 rows=584 loops=1)
Sort Key: date_created
Sort Method: quicksort Memory: 732kB
Buffers: shared hit=544 read=4
-> Bitmap Heap Scan on modwork_ticket (cost=25.11..4279.11 rows=1120 width=1146) (actual time=20.479..22.595 rows=584 loops=1)
Recheck Cond: ((email_sender_id)::text = '[email protected]'::text)
Heap Blocks: exact=538
Buffers: shared hit=541 read=4
-> Bitmap Index Scan on modwork_ticket_email_sender_id_like (cost=0.00..24.83 rows=1120 width=0) (actual time=20.388..20.388 rows=
Index Cond: ((email_sender_id)::text = '[email protected]'::text)
Buffers: shared hit=3 read=4
Planning time: 0.173 ms
Execution time: 23.974 ms
版本:
PostgreSQL 9.6.3 on x86_64-suse-linux-gnu, compiled by gcc (SUSE Linux) 4.7.2 20130108 [gcc-4_7-branch revision 195012], 64-bit
我在运行上述查询之前运行“VACUUM ANALYZE”。
问题是“[email protected]”的行缺少早期 date_created 的值,但规划者不知道这一点。它认为它们是均匀分布的,所以它会在行走时早早地找到一个,
modwork_ticket_date_created
然后才能停下来。但它必须穿过其中的 1,705,251 个。你可以创建一个索引
(email_sender_id text_pattern_ops, date_created)
,它将能够直接跳转到你想要的元组。这应该比现有计划快得多。(我提议包含text_pattern_ops
纯粹是因为现有索引的名称中有“like”这个词,所以我假设它已经这样定义了——但也许你实际上有一个名为“like”的列。如果您向我们展示了定义,这样我们就不必猜测诸如此类的事情)。该索引可能会替换现有的索引,因此索引的总数可能会保持不变。如果您不想创建索引而只想使用第二个计划,您可以通过编写如下查询来强制执行它:
通过在排序之前向日期添加一些内容,它会误
PostgreSQL
认为它不能使用日期索引。一旦 v10
PostgreSQL
发布并升级到它,您可以为两列之间的功能依赖创建一个高级统计定义,这也可能足以让它选择更好的计划。modwork_ticket_email_sender_id_like
索引modwork_ticket_date_created
索引因此,它认为从有序索引上最旧的行开始直到找到具有的行
((email_sender_id)::text = '[email protected]'::text)
比收集((email_sender_id)::text = '[email protected]'::text)
索引上的所有行然后对它们进行排序以找到最旧的行要少。您可能想尝试更新统计信息,
然后再次尝试重新运行查询。如果这不起作用,您可能需要增加
(email_sender_id)::text
. 如果这不起作用,您可能需要粘贴您的两个索引,以便我们为您提供建议——或考虑合并它们(email_sender_id、date_created)。