AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 331323
Accepted
Milan Ilic
Milan Ilic
Asked: 2023-09-18 23:53:14 +0800 CST2023-09-18 23:53:14 +0800 CST 2023-09-18 23:53:14 +0800 CST

Por que o número de linhas ativas buscadas pelas varreduras de índice caiu após a tabela ANALYZE?

  • 772

Usamos PostgreSQL 12 e temos uma tabela simples, event_participantarmazenando 100 GB de dados. event_participantpossui todos os índices necessários, então todas as linhas são buscadas usando-os, ou seja, nenhuma linha é buscada usando varreduras sequenciais.

Normalmente, ele busca 65 linhas/segundo, mas um dia, às 10h, executamos uma campanha planejada em que o número de linhas buscadas usando varreduras de índice saltou para 5,4 milhões de linhas/segundo. No entanto, o número de varreduras de índice permaneceu o mesmo, 200 por segundo. O conteúdo da tabela começou a mudar lentamente, mas não o suficiente para acionar a análise automática porque autovacuum_analyze_scale_factoré 0,01 ou 1% do tamanho da tabela.

Vale ressaltar que configuramos plan_cache_modeo TO force_custom_planneste banco de dados porque nosso aplicativo usa Demonstrativos Preparados e queremos evitar planos genéricos por causa de campanhas ativas.

Após 3 horas de grande carga de CPU e varreduras de índice, realizamos manualmente um ANALYZEdos event_participant, e o número de linhas ativas buscadas pelas varreduras de índice caiu imediatamente de 5,4 milhões de linhas/s para 450 linhas/s .

Estou tentando descobrir como o ANALYZEcomando afetou o número de linhas ativas obtidas pelas varreduras de índice, enquanto o número de varreduras de índice permaneceu o mesmo.

Atualização - incluindo mais detalhes sobre a estrutura e índices da tabela.

> \d+ event_participant
                            Table "public.event_participant"
  Column  |       Type       | Collation | Nullable | Default | Storage  | Stats target | Description 
----------+------------------+-----------+----------+---------+----------+--------------+-------------
 event_id | text             |           | not null |         | extended |              | 
 user_id  | bigint           |           | not null |         | plain    |              | 
 progress | text             |           | not null |         | extended |              | 
 level    | integer          |           | not null | 0       | plain    |              | 
 quality  | double precision |           |          |         | plain    |              | 
Indexes:
    "event_participant_pkey" PRIMARY KEY, btree (user_id, event_id)
    "event_participant_event_id_idx" btree (event_id)
Access method: heap

Assim, às 10h, começou a campanha com um novo evento (new event_id), e a event_participanttabela começou a crescer. A cada login do usuário, o aplicativo backend, sabendo quais eventos estão ativos, seleciona todas as entradas por user_id e event_id: SELECT * from event_participant WHERE user_id=? AND event_id=?;para acompanhar o progresso do usuário.

postgresql
  • 1 1 respostas
  • 70 Views

1 respostas

  • Voted
  1. Best Answer
    Milan Ilic
    2023-09-27T21:35:26+08:002023-09-27T21:35:26+08:00

    Mais uma vez, desde o início do evento, a event_participanttabela começou a crescer, mas não o suficiente para acionar autovacuum_analyze,o que atualizaria o plano de consulta.

    Antes do evento começar às 10h, o evento com event_id=tour2023não existia na tabela, então durante o último autovacuum_analyze, que aconteceu horas antes, o plano de consulta não tinha conhecimento tour2023, então sugeriu usar o índice event_participant_event_id_idx.. Testei a hipótese executando um EXPLAIN SELECT com event_id inexistente; ele usa o índice criado nele e filtra as linhas por user_id:

    explain select * from event_participant where user_id = 1 and event_id = 'bla';
                                                                 QUERY PLAN                                                              
    -------------------------------------------------------------------------------------------------------------------------------------
     Index Scan using event_participant_event_id_idx on event_participant  (cost=0.56..1.61 rows=1 width=1409)
       Index Cond: (event_id = 'bla'::text)
       Filter: (user_id = 1)
    

    o que significa que após tour2023o início do evento durante a execução da consulta, SELECT * from event_participant WHERE user_id=? AND event_id=?;o PostgreSQL costumava event_participant_event_id_idxbuscar todas as linhas event_id=tour2023e, em seguida, filtrar a linha desejada em user_idvez de usar o índice composto "event_participant_pkey" PRIMARY KEY, btree (user_id, event_id). Isso levou ao aumento do número de linhas buscadas pelas varreduras de índice, bem como ao enorme uso da CPU.

    Após a execução ANALYZEmanual, o plano de consulta foi atualizado e o banco de dados decidiu utilizar um índice composto. Conseqüentemente, o número de linhas buscadas nas varreduras de índice caiu para 450 linhas/s.

    Saída EXPLAIN ao usar event_id existente:

    explain select * from event_participant where user_id = 1 and event_id = 'tour2023';
                                                             QUERY PLAN                                                          
    -----------------------------------------------------------------------------------------------------------------------------
     Index Scan using event_participant_pkey on event_participant  (cost=0.56..2.58 rows=1 width=1409)
       Index Cond: ((user_id = 1) AND (event_id = 'tour2023'::text))
    

    Portanto, a resposta é que o plano de consulta estava obsoleto e o PostgreSQL decidiu usar um índice abaixo do ideal.

    Ainda estou perdendo parte do motivo pelo qual o PostgreSQL usou apenas o índice (event_id), pois esperava que o planejador de consultas favorecesse o índice composto quando user_id e event_id são especificados na consulta.

    • 2

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve