AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 329086
Accepted
sujeet
sujeet
Asked: 2023-07-09 14:17:36 +0800 CST2023-07-09 14:17:36 +0800 CST 2023-07-09 14:17:36 +0800 CST

Seleção de índice diferente e estratégia de junção entre ambientes QA e Prod no PostgreSQL

  • 772

Encontrei um cenário em que a mesma consulta em um banco de dados PostgreSQL exibe diferentes seleções de índice e estratégias de junção entre os ambientes QA e Prod. Estou tentando entender as possíveis razões por trás desse comportamento.

Aqui estão os detalhes:

Ambiente de controle de qualidade:

  • Conjunto de dados menor em comparação com o Prod
  • A consulta usa junção de loop aninhada
  • Consulta usa idx_user_id_id_customer_idíndice
  • Item de lista

Ambiente de produção:

  • Conjunto de dados maior em comparação com o controle de qualidade
  • A consulta usa junção de mesclagem
  • Consulta usa idx_customer_idíndice
  • O tamanho do idx_user_id_customer_idíndice é de 118 GB, enquanto idx_customer_ido índice é de 85 GB

Ambos os ambientes têm o mesmo conjunto de índices. As principais diferenças estão no tamanho dos dados e nos planos de execução escolhidos pelo otimizador de consultas.

Registro de explicação do produto: https://explain.depesz.com/s/28la

Registro de explicação do controle de qualidade: https://explain.depesz.com/s/zM6e

1. Quais seriam as possíveis razões para a disparidade na seleção de índices e na estratégia de junção entre os dois ambientes?
2. Existem fatores específicos que influenciam o processo de tomada de decisão do otimizador?

Aqui está o que eu penso, por favor me corrija se eu estiver errado e adicione mais informações:

  • Ele está usando junção de loop aninhado em vez de junção de mesclagem porque no controle de qualidade pode haver menos linhas para o mesmo registro em um lado.
  • O tamanho do índice idx_user_id_customer_idé grande, por isso está sendo ignorado. Ou pode ser que a seletividade user_idseja baixa, por customer_idisso está escolhendocustomer_id
postgresql
  • 1 1 respostas
  • 39 Views

1 respostas

  • Voted
  1. Best Answer
    J.D.
    2023-07-09T21:06:46+08:002023-07-09T21:06:46+08:00
    1. Quais poderiam ser as possíveis razões para a disparidade na seleção de índices e na estratégia de junção entre os dois ambientes?

    Ambiente de controle de qualidade: conjunto de dados menor em comparação com o Prod

    ...

    Ambiente de produção: conjunto de dados maior em comparação com o controle de qualidade

    Essa é a disparidade, os dados diferentes, principalmente a diferença na quantidade de linhas.

    1. Existem fatores específicos que influenciam o processo de tomada de decisão do otimizador?

    Sim, o tamanho dos dados. Diferentes operações de dados no plano de consulta são mais eficientes, dependendo do tamanho dos dados que estão sendo operados. Loops aninhados são normalmente mais eficientes para conjuntos menores de dados sendo unidos. Merge Join é melhor para conjuntos de dados maiores.

    É difícil manter vários ambientes consistentes o suficiente para obter sempre os mesmos planos de consulta para todas as consultas, mas, para isso, você teria que manter um conjunto de dados bastante semelhante entre os ambientes, em todas as tabelas relevantes.

    • 1

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve