PostgreSQL 中 UniProt 的生物序列

Question

guettli

Asked: 2017-09-13 23:45:26 +0800 CST2017-09-13 23:45:26 +0800 CST 2017-09-13 23:45:26 +0800 CST

PostgreSQL: ... LIMIT 1 比获取所有行慢得多？

772

如果我只获取一行，则查询需要更长的时间：1433 毫秒对 23 毫秒

有解决办法吗？

减缓：

EXPLAIN (ANALYZE, BUFFERS) SELECT * FROM "modwork_ticket" WHERE 
 "modwork_ticket"."email_sender_id" = '[email protected]' 
 ORDER BY "modwork_ticket"."date_created" ASC limit 1;

--------------------------------------------------------------------------------------------------------------------------------------------
 Limit  (cost=0.43..542.14 rows=1 width=1146) (actual time=1433.128..1433.129 rows=1 loops=1)
   Buffers: shared hit=1466151 read=4661
   ->  Index Scan using modwork_ticket_date_created on modwork_ticket  (cost=0.43..606714.36 rows=1120 width=1146) (actual time=1433.125..1433
         Filter: ((email_sender_id)::text = '[email protected]'::text)
         Rows Removed by Filter: 1705251
         Buffers: shared hit=1466151 read=4661
 Planning time: 2.504 ms
 Execution time: 1433.218 ms

快速地：

EXPLAIN (ANALYZE, BUFFERS) SELECT * FROM "modwork_ticket" WHERE
  "modwork_ticket"."email_sender_id" = '[email protected]' 
  ORDER BY "modwork_ticket"."date_created" ASC;


--------------------------------------------------------------------------------------------------------------------------------------------
 Sort  (cost=4335.83..4338.63 rows=1120 width=1146) (actual time=23.637..23.794 rows=584 loops=1)
   Sort Key: date_created
   Sort Method: quicksort  Memory: 732kB
   Buffers: shared hit=544 read=4
   ->  Bitmap Heap Scan on modwork_ticket  (cost=25.11..4279.11 rows=1120 width=1146) (actual time=20.479..22.595 rows=584 loops=1)
         Recheck Cond: ((email_sender_id)::text = '[email protected]'::text)
         Heap Blocks: exact=538
         Buffers: shared hit=541 read=4
         ->  Bitmap Index Scan on modwork_ticket_email_sender_id_like  (cost=0.00..24.83 rows=1120 width=0) (actual time=20.388..20.388 rows=
               Index Cond: ((email_sender_id)::text = '[email protected]'::text)
               Buffers: shared hit=3 read=4
 Planning time: 0.173 ms
 Execution time: 23.974 ms

版本：

PostgreSQL 9.6.3 on x86_64-suse-linux-gnu, compiled by gcc (SUSE Linux) 4.7.2 20130108 [gcc-4_7-branch revision 195012], 64-bit

我在运行上述查询之前运行“VACUUM ANALYZE”。

2 个回答

Voted

jjanes · Answer 1 · 2017-09-14T09:31:41+08:00

问题是“[email protected]”的行缺少早期 date_created 的值，但规划者不知道这一点。它认为它们是均匀分布的，所以它会在行走时早早地找到一个，modwork_ticket_date_created然后才能停下来。但它必须穿过其中的 1,705,251 个。

你可以创建一个索引(email_sender_id text_pattern_ops, date_created)，它将能够直接跳转到你想要的元组。这应该比现有计划快得多。（我提议包含text_pattern_ops纯粹是因为现有索引的名称中有“like”这个词，所以我假设它已经这样定义了——但也许你实际上有一个名为“like”的列。如果您向我们展示了定义，这样我们就不必猜测诸如此类的事情）。该索引可能会替换现有的索引，因此索引的总数可能会保持不变。

如果您不想创建索引而只想使用第二个计划，您可以通过编写如下查询来强制执行它：

SELECT * FROM modwork_ticket WHERE 
 modwork_ticket.email_sender_id = '[email protected]' 
 ORDER BY modwork_ticket.date_created + '0 days' ASC limit 1;

通过在排序之前向日期添加一些内容，它会误PostgreSQL认为它不能使用日期索引。

一旦 v10PostgreSQL发布并升级到它，您可以为两列之间的功能依赖创建一个高级统计定义，这也可能足以让它选择更好的计划。

Evan Carroll · Answer 2 · 2017-09-13T23:56:00+08:00

Evan Carroll

2017-09-13T23:56:00+08:002017-09-13T23:56:00+08:00

在快速查询中，查询扫描modwork_ticket_email_sender_id_like索引
在另一个它扫描modwork_ticket_date_created索引

因此，它认为从有序索引上最旧的行开始直到找到具有的行((email_sender_id)::text = '[email protected]'::text)比收集((email_sender_id)::text = '[email protected]'::text)索引上的所有行然后对它们进行排序以找到最旧的行要少。

您可能想尝试更新统计信息，

ANALYZE modwork_ticket;

然后再次尝试重新运行查询。如果这不起作用，您可能需要增加(email_sender_id)::text. 如果这不起作用，您可能需要粘贴您的两个索引，以便我们为您提供建议——或考虑合并它们（email_sender_id、date_created）。

1

PostgreSQL: ... LIMIT 1 比获取所有行慢得多？

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

PostgreSQL: ... LIMIT 1 比获取所有行慢得多？

2 个回答

相关问题