我有一个超过 500GB 的大型 PostgreSQL 数据库,太大了。无论如何将数据库压缩到更易于管理的大小?我试图用 SquashFS 来做到这一点,并且数据库压缩到 177GB,但是 PostgreSQL 要求数据库具有写访问权限并且 Squashed 系统是只读的。更有经验的数据库用户对实现这一目标有什么建议吗?
该数据库保存地球的 GIS 数据,并将在本地部署的系统上使用。目前它位于 1TB SSD 上,但是,我试图避免仅仅为了容纳大型数据库而添加额外的硬盘驱动器。数据库按预期运行,没有问题,我只想将其压缩到更易于管理的大小,并避免将其放在单独的驱动器上。
文件系统
一种非常流行的方法是使用文件系统。BTRFS 和 ZFS 在文件系统级别的数据库下工作。两者都可以在回送设备中使用,因此您可以提供压缩表空间而无需另一个分区。对此有一些警告,如果表空间失败,它也可能会占用您的集群。
ZFS
ZFS 是这里最大的一个。这就是我想要的。
也可以看看
Btrfs
Btrfs 是一个强有力的竞争者,但它已经进行了很长时间的积极开发,而且由于缺乏主要发行版将其作为默认设置,许多人质疑它是否已准备好迎接“黄金时段”。
PostgreSQL
GIS 方法 (PostGIS)
对于多边形,一种方法是通过删除顶点来简化多边形
ST_Simplify
。对于点,一种方法是空间聚类。
这两种情况都会导致信息丢失。与数据库的大多数功能一样,PostGIS 没有透明的“魔术压缩”选项。
cstore_fdw
还有
cstore_fdw
一个提供压缩的柱状存储。它具有不同的性能配置文件,所以 ymmv。