Sequências Biológicas do UniProt no PostgreSQL

Question

beldaz

Asked: 2015-06-23 17:06:09 +0800 CST2015-06-23 17:06:09 +0800 CST 2015-06-23 17:06:09 +0800 CST

Tamanho preciso do banco de dados PG para comparar representações

772

Eu tenho um programa Java/JDBC que pega um arquivo de amostra e importa os dados para o banco de dados, fragmentando-os em várias relações. O programa faz isso várias vezes para várias representações diferentes, uma das quais usa objetos grandes. Posso compartilhar mais detalhes dessas representações, mas elas são muito longas e não são relevantes para essa questão, pois estou procurando algo genérico.

Gostaria de comparar os tamanhos dessas diferentes representações examinando o tamanho do banco de dados após cada importação. O banco de dados está em uma instância do servidor Windows local PostgreSQL 9.4, sem outros usuários e com configuração padrão. Sua única finalidade é realizar este teste.

Meu plano inicial era o seguinte:

for each representation {
  call VACUUM ANALYZE
  record old DB size with SELECT pg_tablespace_size('pg_default');
  import data into database
  call VACUUM ANALYZE
  record new DB size with SELECT pg_tablespace_size('pg_default');
  store storage cost as new DB size - old DB size
}

Obviamente, há limitações para essa abordagem, mas minha expectativa é que, para arquivos grandes (~ 100 MB), os custos de armazenamento relatados sejam aproximações razoáveis. Observe que utilizo pg_tablespace_sizede forma a incluir a contribuição de dados fora do esquema principal, como objetos grandes (in pg_catalog.pg_largeobjecte pg_catalog.pg_largeobject_metadata).

Eu estou querendo saber se esta é uma abordagem correta e se existe uma abordagem melhor. Não tenho certeza se VACUUM ANALYZEatualiza corretamente as estatísticas usadas por pg_tablespace_size, mesmo que seja chamado na mesma sessão. Também seria melhor se eu pudesse evitar chamar VACUUM ANALYZE, pois isso requer conexão como superusuário para executar as pg_catalogrelações.

Alguma ideia?

1 respostas

Voted

Daniel Vérité · Answer 1 · 2015-06-23T18:10:32+08:00

Best Answer

Daniel Vérité

2015-06-23T18:10:32+08:002015-06-23T18:10:32+08:00

Basta ligar pg_database_size(dbname)para saber o tamanho do banco de dados.

VACUUM(sem a FULLcláusula) não libera nenhum espaço, apenas o marca como reutilizável e, portanto, não altera o tamanho do banco de dados (exceto em um caso de limite raro, consulte Routine Vacuuming ).

ANALYZEfaz amostragem estatística e seria útil se você precisasse das contagens de linhas, mas para o tamanho global do banco de dados, não é necessário.

6

Tamanho preciso do banco de dados PG para comparar representações

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Tamanho preciso do banco de dados PG para comparar representações

1 respostas

relate perguntas