AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 35327
Accepted
kissgyorgy
kissgyorgy
Asked: 2013-02-24 09:16:51 +0800 CST2013-02-24 09:16:51 +0800 CST 2013-02-24 09:16:51 +0800 CST

如果 autovacuum 开启,我应该手动 VACUUM PostgreSQL 数据库吗?

  • 772

我使用制作大型 PostgreSQL 数据库的软件(其中有一个包含一百万行的表),开发人员说我应该VACUUM定期ANALYZE进行。但是 PostgreSQL 数据库默认是autovacuum打开的。

我应该抽真空/分析吗?有什么好处?自动吸尘器和手动吸尘器有什么区别

例如,在 Pgadmin3 中,我有这个:
在此处输入图像描述

postgresql maintenance
  • 4 4 个回答
  • 32506 Views

4 个回答

  • Voted
  1. Best Answer
    pygrac
    2013-02-25T01:26:13+08:002013-02-25T01:26:13+08:00

    我同意 ETL 的观点,即没有简短的答案。大小并不是唯一重要的事情——我们在重负载下运行相当大的 PostgreSQL OLTP 数据库(一些表 > 100.000.000 行),目前我们只依赖 autovacuum。

    然而,有两件事对我来说似乎很重要:

    • 似乎有一个共识,那就是永远不应该关闭 autovacuum,除非您的数据库上有非常明确的工作负载并且您确切地知道自己在做什么。但是,自然地,您可以进行额外VACUUM的和/或ANALYZE运行。

    • 在考虑额外VACUUM的运行之前,我会检查 autovacuum 是如何跟上的。pg_stat_user_tables您可以通过查询和来检查是否有任何表超出了 autovacuum 阈值pg_class。我在另一个线程上发布了这样一个查询,这可能很有趣:Aggressive Autovacuum on PostgreSQL。

      不幸的是,对自动分析阈值进行类似的检查并不容易(即目前不可能)。但是,默认情况下,自动分析早在自动真空之前就开始了,而且便宜得多。因此,基本上,如果您的数据库可以跟上 autovacuum 的速度,那么使用 autoanalyze 也可能没问题。最后的自动分析日期也可以从 中查询pg_stat_user_tables。

    (最优秀的)PostgreSQL 文档的某些部分,我发现它们很有帮助:

    • 常规吸尘
    • 统计收集器
    • 15
  2. Erwin Brandstetter
    2013-02-25T06:03:12+08:002013-02-25T06:03:12+08:00

    Autovacuum应该可以很好地覆盖它,除非你配置错误。其他答案已经涵盖了这一点。

    手动 VACUUM(更重要的是:手动ANALYZE)有一个明确定义的案例:临时表,它们不被 autovacuum 恶魔考虑。我在这里引用手册CREATE TABLE:

    autovacuum 守护进程无法访问,因此无法清理或分析临时表。因此,应通过会话 SQL 命令执行适当的清理和分析操作。例如,如果要在复杂查询中使用ANALYZE临时表,则在填充临时表后在临时表上运行是明智的。

    • 7
  3. ETL
    2013-02-24T09:23:32+08:002013-02-24T09:23:32+08:00

    没有简短的答案,因为它取决于很多因素。系统慢吗?自动吸尘器是否真的接触到这张桌子?等等

    这里有一些关于这个主题的好链接:

    • PostgreSQL 性能注意事项
    • 性能优化(PostgreSQL 维基)
    • VACUUM、ANALYZE、EXPLAIN 和 COUNT 简介(同一来源)
    • 解释 pg_stat 视图,了解 pg_stat 视图

    要做出明确的决定,需要了解数据库本身以及正在发生的事情的更多细节。

    • 4
  4. Hasan Ammori
    2018-04-16T03:58:36+08:002018-04-16T03:58:36+08:00

    我认为您不需要手动清理,除非您开始看到性能下降。但是,我强烈建议您检查您的真空和自动真空设置并根据您的需要进行调整

    要查看您当前的设置,请运行以下查询:

    SELECT *
    FROM pg_settings 
    WHERE name LIKE '%vacuum%'
    

    大多数字段都是不言自明的,但这里有关于它们的文档: https ://www.postgresql.org/docs/current/static/runtime-config-autovacuum.html

    我想说,您的目标应该是配置 autovacuum 以始终如一地清理垃圾,但不要经常运行 autovacuum

    最重要的设置是:

    • autovacuum_vacuum_scale_factor - 确定在触发清理之前可能死亡的元组百分比。默认值 = 0.2
    • autovacuum_vacuum_threshold - 触发清理之前死元组的最小数量。默认值 = 50

    阈值有助于防止对小表过于频繁地触发清理过程。

    默认设置可以正常工作,除非您有非常大的表。简单地说,如果你碰巧有一个占用 100GB 的表,你将在触发 autovacuum 之前积累 20GB 垃圾。因此,我通常建议将比例因子设置得较低。你应该自己确定多低。我在当前项目中使用 0.05

    门槛也可以提高。许多应用程序有几个表,这些表经常更新,50 个元组并不多。将其增加到 1000 应该不会导致任何问题,但是当然,您应该考虑自己的情况

    您还可以微调 autovacuum 并为某些表设置不同的设置

    ALTER TABLE your_table SET (autovacuum_vacuum_scale_factor = 0.05);
    

    如果你配置 scale_factor 和 thresholds 你应该没问题。您也可以增加autovacuum_vacuum_cost_limit,默认等于vacuum_cost_limit,设置为 200。这是 Vacuum 的一个非常重要的特性,它不会让它吃光所有资源,并且即使在清理过程中也可以让您的应用程序使用数据进行操作,但默认值太低。将其增加到 1000 不会导致任何明显的延迟,但可以让真空过程更快地完成

    当然,您也可以手动运行真空。在最简单的情况下,您可以有一个简单的 cron 作业,当您的数据库不经常访问时,这将在每晚进行一次全面清理

    希望有帮助!

    • 1

相关问题

  • 我可以在使用数据库后激活 PITR 吗?

  • 运行时间偏移延迟复制的最佳实践

  • 存储过程可以防止 SQL 注入吗?

  • PostgreSQL 中 UniProt 的生物序列

  • PostgreSQL 9.0 Replication 和 Slony-I 有什么区别?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    授予用户对所有表的访问权限

    • 5 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve