Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

Question

François Beausoleil

Asked: 2012-06-01 17:56:01 +0800 CST2012-06-01 17:56:01 +0800 CST 2012-06-01 17:56:01 +0800 CST

O VACUUM ANALYZE regular ainda é recomendado sob 9.1?

772

Estou usando o PostgreSQL 9.1 no Ubuntu. O agendamento VACUUM ANALYZEainda é recomendado, ou o autovacuum é suficiente para atender todas as necessidades?

Se a resposta for "depende", então:

Eu tenho um banco de dados grande (tamanho de despejo compactado de 30 GiB, diretório de dados de 200 GiB)
Faço ETL no banco de dados, importando cerca de 3 milhões de linhas por semana
As tabelas com as alterações mais frequentes são todas herdadas de uma tabela mestre, sem dados na tabela mestre (os dados são particionados por semana)
Eu crio rollups por hora e, a partir daí, relatórios diários, semanais e mensais

Estou perguntando porque a programação VACUUM ANALYZEestá impactando na minha reportagem. Ele é executado por mais de 5 horas e tive que matá-lo duas vezes esta semana, porque estava afetando as importações regulares do banco de dados. check_postgresnão relata nenhum inchaço significativo no banco de dados, então isso não é realmente um problema.

A partir dos documentos, o autovacuum também deve cuidar do envolvimento do ID da transação. A questão permanece: eu ainda preciso de um VACUUM ANALYZE?

3 respostas

Voted

Daniel Vérité · Answer 1 · 2012-06-02T08:40:04+08:00

VACUUM só é necessário em linhas atualizadas ou excluídas em tabelas não temporárias. Obviamente você está fazendo muitos INSERTs, mas não é óbvio pela descrição que você também está fazendo muitos UPDATEs ou DELETEs.

Essas operações podem ser rastreadas com a pg_stat_all_tablesexibição, especificamente as colunas n_tup_upde . n_tup_delAlém disso, ainda mais importante, há uma n_dead_tupcoluna que informa, por tabela, quantas linhas precisam ser limpas. (consulte Monitorando estatísticas no documento para funções e visualizações relacionadas à coleta de estatísticas).

Uma estratégia possível no seu caso seria suprimir o VACUUM agendado, ficando de olho nessa view e verificando em quais tabelas ela n_dead_tupestá subindo significativamente. Em seguida, aplique o VACUUM agressivo apenas a essas tabelas. Isso será uma vitória se houver tabelas grandes cujas linhas nunca sejam excluídas nem atualizadas e o VACUUM agressivo for realmente necessário apenas em tabelas menores.

Mas continue executando o ANALYZE para que o otimizador tenha sempre estatísticas atualizadas.

Erwin Brandstetter · Answer 2 · 2012-06-02T08:36:00+08:00

Não vejo nada na sua pergunta que autovacuumnão resolva. Depende muito do padrão de suas atividades de escrita . Você menciona 3 milhões de novas linhas por semana, mas INSERT(ou COPY) normalmente não cria tabelas e índices inchados. ( autovacuumsó tem que cuidar das estatísticas da coluna , do mapa de visibilidade e de alguns trabalhos menores). UPDATEe DELETEsão a causa dominante do inchaço de tabelas e índices, especialmente ao segmentar linhas aleatórias. Não vejo nada disso na sua pergunta.

autovacuumpercorreu um longo caminho e está fazendo um ótimo trabalho no Postgres 9.1 ou posterior. Eu daria uma olhada nas autovacuumconfigurações . Se a aspiração tende a interferir com sua carga de trabalho, também dê uma olhada em "Atraso de vácuo baseado em custo" . A aspiração manual deve ser a rara exceção.

Se você tiver muitos s aleatórios UPDATE, talvez queira definir o FILLFACTORpara algo menor que 100, para permitir atualizações HOT imediatamente e reduzir a necessidade de VACUUM. Mais sobre atualizações HOT:

Dados redundantes em declarações de atualização

Observe também que as tabelas temporárias precisam de manual VACUUM& ANALYZE. Cito o manual sobreCREATE TABLE :

O daemon de autovacuum não pode acessar e, portanto, não pode limpar ou analisar tabelas temporárias. Por esse motivo, as operações apropriadas de vácuo e análise devem ser executadas por meio de comandos SQL de sessão. Por exemplo, se uma tabela temporária for usada em consultas complexas, é aconselhável executá ANALYZE-la depois que ela for preenchida.

MvcCmsJon · Answer 3 · 2013-06-14T05:34:45+08:00

Embora eu concorde que é melhor usar os recursos automáticos em vez de executá-los em todo o banco de dados, na maioria dos casos é necessário o ajuste por tabela.

Não concordo muito com a escolha de design do postgres para unir vácuo e análise, já vi vários casos em que bancos de dados que fazem muita inserção/atualização, mas pouca exclusão, nunca são analisados e começam a ter um desempenho ruim.

A solução é entrar nas tabelas que são muito usadas e estão sujeitas a grandes consultas e definir as configurações de análise automática dessas tabelas para algo em que elas sejam analisadas uma vez ou a cada dois dias.

Você pode acessar as configurações por tabela no gui na guia de vácuo automático e verá as configurações de análise que podem ser definidas independentemente do vácuo.

As configurações acabam na tabela de opções e podem ser vistas com a consulta

SELECT c.relname, c.reloptions FROM pg_class c where reloptions is not null

e um valor amostral de uma análise agressiva pode ser

{autovacuum_enabled=true,autovacuum_analyze_threshold=10,autovacuum_analyze_scale_factor=.01}

Para ver quando foi a última vez que suas tabelas foram analisadas automaticamente

select 
    relname, 
    n_dead_tup, 
    n_tup_ins, 
    n_tup_upd, 
    n_tup_del, 
    last_autoanalyze, 
    autoanalyze_count 
from pg_stat_user_tables 
where last_autoanalyze is not null 
order by last_autoanalyze desc;

O VACUUM ANALYZE regular ainda é recomendado sob 9.1?

Como ver a lista de bancos de dados no Oracle?

Quão grande deve ser o mysql innodb_buffer_pool_size?

Listar todas as colunas de uma tabela especificada

restaurar a tabela do arquivo .frm e .ibd?

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Como selecionar a primeira linha de cada grupo?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

O VACUUM ANALYZE regular ainda é recomendado sob 9.1?

3 respostas

relate perguntas