Posso ativar o PITR depois que o banco de dados foi usado

Question

Marco Cesarato

Asked: 2024-02-03 00:09:00 +0800 CST2024-02-03 00:09:00 +0800 CST 2024-02-03 00:09:00 +0800 CST

Otimizando o desempenho de grandes bancos de dados PostgreSQL com tabelas pai e filho

772

Descrição

Atualmente estou enfrentando desafios de desempenho em um cenário de banco de dados PostgreSQL envolvendo uma tabela pai e 30 tabelas filho. Notavelmente, nenhuma dessas tabelas é particionada e algumas das tabelas secundárias têm tamanhos individuais substanciais, com um tamanho cumulativo de todas as tabelas atingindo 5 TB. Apesar de ter índices nas tabelas pai e filho, a execução de consultas, como a mostrada abaixo, leva um longo período, geralmente várias horas.

Pergunta

Estou buscando orientação sobre como otimizar o desempenho neste contexto. Existem configurações específicas, além dos índices, que poderiam melhorar significativamente a velocidade de consulta para uma estrutura de banco de dados tão grande e complexa?

Além disso, estou curioso para saber se o PostgreSQL pode ter limitações inerentes ao manuseio eficiente de bancos de dados desse tamanho e peso. Em caso afirmativo, existem estratégias alternativas que poderiam ser consideradas para um melhor desempenho?

Tem havido especulações sobre o PostgreSQL enfrentar desafios com E/S de disco, especialmente quando comparado a outros bancos de dados como Oracle ou NoSQL. Esta especulação é precisa?

Informações

Versão

Executando no Google Cloud SQL

PostgreSQL 13.12 em x86_64-pc-linux-gnu, compilado pelo Debian clang versão 12.0.1, 64 bits

Mesa

CREATE TABLE mytable (
    id_pos int8 NOT NULL PRIMARY KEY,
    date_insert DATE DEFAULT NOW()
);

CREATE TABLE mytable_child1 (
    id_pos int8 NOT NULL PRIMARY KEY,
    date_insert DATE DEFAULT NOW(),
    other_field varchar(10) NOT NULL
) INHERITS (mytable);

Índices

Em cada tabela (pai e filho) tenho esses índices

CREATE INDEX IF NOT EXISTS mytable_date_insert_idx ON mytable USING btree (date_insert);

CREATE INDEX IF NOT EXISTS mytable_child1_date_insert_idx ON mytable_child1 USING btree (date_insert);

Consulta

SELECT * FROM mytable WHERE date_insert >= CURRENT_DATE - INTERVAL 1 MONTH;

1 respostas

Voted

J.D. · Answer 1 · 2024-02-03T01:51:38+08:00

Existem configurações específicas, além dos índices, que poderiam melhorar significativamente a velocidade de consulta para uma estrutura de banco de dados tão grande e complexa?

Claro, ajuste de consulta e rearquitetura conforme necessário. Seria necessário ver o plano de consulta (via EXPLAIN ANALYZE) para oferecer conselhos específicos.

Além disso, estou curioso para saber se o PostgreSQL pode ter limitações inerentes ao manuseio eficiente de bancos de dados desse tamanho e peso.

Não. Ele opera de forma mensurável da mesma forma que qualquer outro sistema de banco de dados moderno.

Em caso afirmativo, existem estratégias alternativas que poderiam ser consideradas para um melhor desempenho?

Veja minha resposta à sua primeira pergunta. No que diz respeito à rearquitetura, depende de quais são seus casos de uso e do que você está fazendo com os dados depois deles SELECT. Por exemplo, se você estiver fazendo algum tipo de agregação, existem estratégias de design, como pré-agregação, e outros recursos que podem ajudar nisso.

Tem havido especulações sobre o PostgreSQL enfrentar desafios com E/S de disco, especialmente quando comparado a outros bancos de dados como Oracle ou NoSQL. Esta especulação é precisa?

Absolutamente não. Em primeiro lugar, a diferença entre qualquer sistema de banco de dados NoSQL e um sistema de banco de dados SQL (relacional) nunca está relacionada ao desempenho. E, como mencionado anteriormente, o PostgreSQL (entre a maioria dos sistemas de banco de dados convencionais) tem desempenho mensuravelmente igual. Tudo se resume a como você os usa com base em seus casos de uso.

Terminarei minha resposta com uma pergunta: quantos dados sua consulta de exemplo retorna para o intervalo fornecido de CURRENT_DATE - INTERVAL 1 MONTH?

Otimizando o desempenho de grandes bancos de dados PostgreSQL com tabelas pai e filho

Descrição

Pergunta

Informações

Versão

Mesa

Índices

Consulta

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Otimizando o desempenho de grandes bancos de dados PostgreSQL com tabelas pai e filho

Descrição

Pergunta

Informações

Versão

Mesa

Índices

Consulta

1 respostas

relate perguntas