Posso ativar o PITR depois que o banco de dados foi usado

Question

sujeet

Asked: 2023-07-09 14:17:36 +0800 CST2023-07-09 14:17:36 +0800 CST 2023-07-09 14:17:36 +0800 CST

Seleção de índice diferente e estratégia de junção entre ambientes QA e Prod no PostgreSQL

772

Encontrei um cenário em que a mesma consulta em um banco de dados PostgreSQL exibe diferentes seleções de índice e estratégias de junção entre os ambientes QA e Prod. Estou tentando entender as possíveis razões por trás desse comportamento.

Aqui estão os detalhes:

Ambiente de controle de qualidade:

Conjunto de dados menor em comparação com o Prod
A consulta usa junção de loop aninhada
Consulta usa idx_user_id_id_customer_idíndice
Item de lista

Ambiente de produção:

Conjunto de dados maior em comparação com o controle de qualidade
A consulta usa junção de mesclagem
Consulta usa idx_customer_idíndice
O tamanho do idx_user_id_customer_idíndice é de 118 GB, enquanto idx_customer_ido índice é de 85 GB

Ambos os ambientes têm o mesmo conjunto de índices. As principais diferenças estão no tamanho dos dados e nos planos de execução escolhidos pelo otimizador de consultas.

Registro de explicação do produto: https://explain.depesz.com/s/28la

Registro de explicação do controle de qualidade: https://explain.depesz.com/s/zM6e

1. Quais seriam as possíveis razões para a disparidade na seleção de índices e na estratégia de junção entre os dois ambientes?
2. Existem fatores específicos que influenciam o processo de tomada de decisão do otimizador?

Aqui está o que eu penso, por favor me corrija se eu estiver errado e adicione mais informações:

Ele está usando junção de loop aninhado em vez de junção de mesclagem porque no controle de qualidade pode haver menos linhas para o mesmo registro em um lado.
O tamanho do índice idx_user_id_customer_idé grande, por isso está sendo ignorado. Ou pode ser que a seletividade user_idseja baixa, por customer_idisso está escolhendocustomer_id

1 respostas

Voted

J.D. · Answer 1 · 2023-07-09T21:06:46+08:00

Quais poderiam ser as possíveis razões para a disparidade na seleção de índices e na estratégia de junção entre os dois ambientes?

Ambiente de controle de qualidade: conjunto de dados menor em comparação com o Prod

...

Ambiente de produção: conjunto de dados maior em comparação com o controle de qualidade

Essa é a disparidade, os dados diferentes, principalmente a diferença na quantidade de linhas.

Existem fatores específicos que influenciam o processo de tomada de decisão do otimizador?

Sim, o tamanho dos dados. Diferentes operações de dados no plano de consulta são mais eficientes, dependendo do tamanho dos dados que estão sendo operados. Loops aninhados são normalmente mais eficientes para conjuntos menores de dados sendo unidos. Merge Join é melhor para conjuntos de dados maiores.

É difícil manter vários ambientes consistentes o suficiente para obter sempre os mesmos planos de consulta para todas as consultas, mas, para isso, você teria que manter um conjunto de dados bastante semelhante entre os ambientes, em todas as tabelas relevantes.

Seleção de índice diferente e estratégia de junção entre ambientes QA e Prod no PostgreSQL

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Seleção de índice diferente e estratégia de junção entre ambientes QA e Prod no PostgreSQL

1 respostas

relate perguntas