我可以在使用数据库后激活 PITR 吗？

Question

Asked: 2021-01-29 08:29:57 +0800 CST2021-01-29 08:29:57 +0800 CST 2021-01-29 08:29:57 +0800 CST

Postgres 可以按列值对表进行分区以启用分区修剪

772

我目前正在使用 Hive，它有分区表。假设这是我的数据：

Country City DailySale
USA     NY   200.2
USA     SF   190.5
CAN     TR   390.4

我可以定义我的表


create table SALES_DATA(
Country    STRING,
City       STRING,
DailySale  BIGDECIMAL
) PARTITIONED BY (Country, City)

然后我在 HDFS 上创建目录结构：

SALES_DATA/
          Country=USA/
                      City=NY/
                              data-file-0001
                              data-file-0002
... the rest omitted for brevity...

然后分区修剪可以应用于查询，如

SELECT SUM(DailySale) FROM SALES_DATA
WHERE  Country='USA' and City='SF'

Hive 引擎将修剪除一个以外的所有分区。超级有效和最佳。

我想在 Postgres 上实现类似的东西。我将拥有包含聚合数据的不可变表，并希望为它们应用类似的东西。我正在尝试通过它 https://www.postgresql.org/docs/13/ddl-partitioning.html 但如果这是我需要的，请不要真正遵循。

Angel Bravo · Answer 1 · 2021-02-04T01:01:40+08:00

在这种情况下，对国家和城市进行索引可能会比分区好得多。

如果你真的打算使用分区，postgres 总是使用 CHECK 约束来修剪分区。解决此问题的一种方法是：

创建一个基于“国家”和“城市”输入的函数将创建一个继承自 salesdata 的表（如果该表已经存在，则返回它）
如果表是新创建的，则对国家和城市的值添加检查约束。
创建一个在插入 salesdata 之前/之后执行的触发器，该触发器将运行该函数并插入国家和城市分区。

当遵循此过程并在 SalesData 上进行选择时，postgres 将修剪与检查约束不匹配的表。

Postgres 可以按列值对表进行分区以启用分区修剪

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

Postgres 可以按列值对表进行分区以启用分区修剪

1 个回答

相关问题