AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 106928
Accepted
patrick
patrick
Asked: 2015-07-14 15:35:23 +0800 CST2015-07-14 15:35:23 +0800 CST 2015-07-14 15:35:23 +0800 CST

como você evita que linhas mortas fiquem no postgresql?

  • 772

Tenho instâncias RDS de produção e preparação na amazon, e os dados de preparação são uma cópia direta da produção, portanto, ambas as instâncias têm dados duplicados.

Fazendo um EXPLAIN ANALYZE SELECT * from my_table WHERE my_col=true;resultou nisso:

Seq Scan on my_table (cost=0.00..142,775.73 rows=1 width=1,436) (actual time=18,170.294..18,170.294 rows=0 loops=1) Filter: my_col Rows Removed by Filter: 360275

Onde, como na produção, foi:

Seq Scan on my_table (cost=0.00..62,145.88 rows=1 width=1,450) (actual time=282.487..282.487 rows=0 loops=1) Filter: my_col Rows Removed by Filter: 366442

ao correrselect pg_total_relation_size('my_table'::regclass);

Achei que o tamanho da encenação era quase o dobro da produção. Pelo que li, vejo que o MVCC do postgresql é responsável por isso, pois mantém várias versões de linhas ao redor. Corri manualmente VACUUM FULLe depois vi que o tamanho da encenação havia sido reduzido em 2/3. A execução da mesma análise de explicação agora mostra:

Seq Scan on my_table  (cost=0.00..56094.75 rows=1 width=1436) (actual time=1987.340..1987.340 rows=0 loops=1) Filter: my_col Rows Removed by Filter: 360287 Total runtime: 1987.547 ms

O que é ótimo - mas o que não entendo é que a documentação sugere que o aspirador automático deveria entrar em ação e limpar essas linhas mortas, mas claramente isso não estava acontecendo.

Eu li vários lugares falando sobre "não deixe seus índices ficarem inchados" e não entendo muito bem 1) como um índice fica inchado e 2) como evitar que um índice fique inchado.

Como posso evitar que isso aconteça novamente no futuro?

ATUALIZAR

Aqui estão minhas configurações de autovacuum:

                name                 |  setting  | unit |  category  |                                        short_desc                                         | extra_desc |  context   | vartype | source  |  min_val  |  max_val   | enumvals | boot_val  | reset_val | sourcefile | sourceline
-------------------------------------+-----------+------+------------+-------------------------------------------------------------------------------------------+------------+------------+---------+---------+-----------+------------+----------+-----------+-----------+------------+------------
 autovacuum                          | on        |      | Autovacuum | Starts the autovacuum subprocess.                                                         |            | sighup     | bool    | default |           |            |          | on        | on        |            |
 autovacuum_analyze_scale_factor     | 0.1       |      | Autovacuum | Number of tuple inserts, updates, or deletes prior to analyze as a fraction of reltuples. |            | sighup     | real    | default | 0         | 100        |          | 0.1       | 0.1       |            |
 autovacuum_analyze_threshold        | 50        |      | Autovacuum | Minimum number of tuple inserts, updates, or deletes prior to analyze.                    |            | sighup     | integer | default | 0         | 2147483647 |          | 50        | 50        |            |
 autovacuum_freeze_max_age           | 200000000 |      | Autovacuum | Age at which to autovacuum a table to prevent transaction ID wraparound.                  |            | postmaster | integer | default | 100000000 | 2000000000 |          | 200000000 | 200000000 |            |
 autovacuum_max_workers              | 3         |      | Autovacuum | Sets the maximum number of simultaneously running autovacuum worker processes.            |            | postmaster | integer | default | 1         | 8388607    |          | 3         | 3         |            |
 autovacuum_multixact_freeze_max_age | 400000000 |      | Autovacuum | Multixact age at which to autovacuum a table to prevent multixact wraparound.             |            | postmaster | integer | default | 10000000  | 2000000000 |          | 400000000 | 400000000 |            |
 autovacuum_naptime                  | 60        | s    | Autovacuum | Time to sleep between autovacuum runs.                                                    |            | sighup     | integer | default | 1         | 2147483    |          | 60        | 60        |            |
 autovacuum_vacuum_cost_delay        | 20        | ms   | Autovacuum | Vacuum cost delay in milliseconds, for autovacuum.                                        |            | sighup     | integer | default | -1        | 100        |          | 20        | 20        |            |
 autovacuum_vacuum_cost_limit        | -1        |      | Autovacuum | Vacuum cost amount available before napping, for autovacuum.                              |            | sighup     | integer | default | -1        | 10000      |          | -1        | -1        |            |
 autovacuum_vacuum_scale_factor      | 0.2       |      | Autovacuum | Number of tuple updates or deletes prior to vacuum as a fraction of reltuples.            |            | sighup     | real    | default | 0         | 100        |          | 0.2       | 0.2       |            |
 autovacuum_vacuum_threshold         | 50        |      | Autovacuum | Minimum number of tuple updates or deletes prior to vacuum.                               |            | sighup     | integer | default | 0         | 2147483647 |          | 50        | 50        |            |
postgresql
  • 2 2 respostas
  • 8534 Views

2 respostas

  • Voted
  1. Best Answer
    khampson
    2015-07-14T16:51:12+08:002015-07-14T16:51:12+08:00

    A aspiração automática deve, eventualmente, limpá-lo (supondo que você não o tenha desativado), mas pode não ser suficiente para seus propósitos. Existem muitas configurações que podem controlar a aspiração automática e como/quando é feita, que podem ser interessantes: aqui e aqui .

    Isso pode ser especialmente verdadeiro em tabelas com alta rotatividade. Ou seja, tabelas com muitas inserções e exclusões. Transações de execução longa e ociosas também podem ser um fator aqui, pois o MVCC entrará em ação e impedirá que as tuplas mortas sejam recuperadas. O fato de fazer manualmente uma VACUUMliberação das tuplas mortas sugere que esse não é o seu caso, e pode ser o problema anterior.

    Em geral, não é recomendado fazer um VACUUM FULL, pois isso remove um bloqueio exclusivo da tabela, principalmente quando a maioria das linhas de uma tabela foi atualizada/excluída.

    Do documento :

    A opção FULL não é recomendada para uso rotineiro, mas pode ser útil em casos especiais. Um exemplo é quando você excluiu ou atualizou a maioria das linhas em uma tabela e gostaria que a tabela diminuísse fisicamente para ocupar menos espaço em disco e permitir varreduras de tabela mais rápidas. VACUUM FULL geralmente encolherá a tabela mais do que um simples VACUUM faria.

    Seu padrão de uso é tal que seria esse o caso? Você mencionou uma "cópia direta" envolvida, mas não está claro exatamente como isso está sendo feito.

    Já tive casos com tabelas de alta rotatividade em que a taxa padrão de vácuo automático simplesmente não era suficiente e mesmo quantidades relativamente pequenas de tuplas mortas afetariam muito a velocidade da consulta (isso ocorreu em uma tabela grande que foi consultada com muita frequência e onde a consulta precisava ser extremamente rápida e, como tal, era altamente afetada por tuplas mortas).

    Para ajudar com isso, configurei um manual VACUUM ANALYZEda tabela (para liberar as tuplas e ajudar o planejador de consultas atualizando as estatísticas) em um cron job que foi configurado para ser executado a cada 5 minutos. Como não havia tantas tuplas mortas, o VACUUMfoi bem rápido, e a limpeza constante mantém a contagem de tuplas mortas baixa o suficiente para manter as consultas dessa tabela rápidas.

    Edite em resposta ao comentário do OP:

    No doc VACUUM , diz que:

    VACUUM recupera o armazenamento ocupado por tuplas mortas

    O doc então diz que (ênfase minha):

    VACUUM ANALYZE executa um VACUUM e depois um ANALYZE para cada tabela selecionada . Este é um formulário de combinação útil para scripts de manutenção de rotina. Veja ANALYZE para mais detalhes sobre seu processamento.

    Portanto, ele definitivamente recupera tuplas mortas.

    • 4
  2. Daniel Vérité
    2015-07-15T11:54:44+08:002015-07-15T11:54:44+08:00

    a documentação sugere que o vácuo automático deveria entrar em ação e limpar essas linhas mortas, mas claramente isso não estava acontecendo.

    Para saber se o autovacuum processa uma tabela, veja pg_catalog.pg_stat_user_tables.last_autovacuum.

    Você parece acreditar que o autovacuum não funciona porque um manual VACUUM FULLencolhe a mesa e o autovacuum não. Mas isso é normal, já que o autovacuum não deve encolher as tabelas, ele apenas sinaliza o espaço ocupado por linhas mortas como reutilizável.

    1) como um índice fica inchado e 2) como evitar que um índice fique inchado.

    O inchaço do índice acontece assim que as gravações acontecem, não pode ser evitado. O que precisa ser verificado é se o inchaço cresce indefinidamente ou permanece estável e quão ruim é.

    O wiki do postgres fornece uma consulta para isso: https://wiki.postgresql.org/wiki/Show_database_bloat

    • 3

relate perguntas

  • Posso ativar o PITR depois que o banco de dados foi usado

  • Práticas recomendadas para executar a replicação atrasada do deslocamento de tempo

  • Os procedimentos armazenados impedem a injeção de SQL?

  • Sequências Biológicas do UniProt no PostgreSQL

  • Qual é a diferença entre a replicação do PostgreSQL 9.0 e o Slony-I?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve