Estou usando um banco de dados postgresql e atualmente estou experimentando algumas coisas de vácuo/vácuo automático/vácuo total.
Até onde eu sei, as linhas atualizadas/removidas na tabela ainda ocupam espaço (e são marcadas apenas como ocultas) até que o comando vacuum seja chamado. Após a execução do comando vacuum, essas tuplas inativas são marcadas como espaço livre, e esse espaço pode ser recuperado pela mesma tabela (ou talvez por tabelas diferentes? Não tenho certeza), mas o espaço não é retornado ao SO/FS e ainda é reservado pelo banco de dados até que o comando VACUUM FULL seja executado.
E aqui vem a minha pergunta. Sou capaz de determinar quanto espaço a tabela ocupa no disco
SELECT pg_size_pretty(pg_relation_size('fluffy_table')) AS data_only,
pg_size_pretty(pg_total_relation_size('fluffy_table')) AS with_indexes;
Este deve ser o espaço "reservado" para a tabela e, após executar VACUUM FULL, esse valor provavelmente mudará (se houver algumas linhas excluídas).
Mas existe alguma opção, como obter o tamanho desta tabela após VACUUM FULL antes de executar VACUUM FULL? Ou algum uso em porcentagens, talvez? Então, posso dizer que esta tabela tem 100 MB de tamanho, mas apenas 60% (60 MB) são usados por dados reais, então posso adicionar 40% a mais de linhas a ela antes que ela cresça novamente?
E é possível com postgresql nativo (sem extensões)?
Pensei na soma das tuplas vivas + mortas, calculando o tamanho médio da linha e, em seguida, múltiplas tuplas vivas/mortas com base nesse valor. Mas já chamei VACUUM, então não tenho mais informações sobre tuplas mortas.