我可以在使用数据库后激活 PITR 吗？

Question

Asked: 2023-07-29 17:15:09 +0800 CST2023-07-29 17:15:09 +0800 CST 2023-07-29 17:15:09 +0800 CST

没有明显根本原因的逻辑复制超时

772

直到几天前，从 PG 15.3 到 15.3 的逻辑复制一直运行没有问题。

现在订阅者会显示重复的消息，例如：

2023-07-29 08:25:04.523 UTC [26] LOG:  checkpoint complete: wrote 8692 buffers (53.1%); 0 WAL file(s) added, 1 removed, 14 recycled; write=269.921 s, sync=0.485 s, total=270.438 s; sync files=37, longest=0.224 s, average=0.014 s; distance=230568 kB, estimate=436766 kB

2023-07-29 08:25:34.550 UTC [26] LOG:  checkpoint starting: time

2023-07-29 08:27:55.699 UTC [142] ERROR:  could not receive data from WAL stream: server closed the connection unexpectedly

        This probably means the server terminated abnormally
        before or while processing the request.

2023-07-29 08:27:55.702 UTC [159] LOG:  logical replication apply worker for subscription "<SUB_NAME>" has started

2023-07-29 08:27:55.706 UTC [1] LOG:  background worker "logical replication worker" (PID 142) exited with exit code 1

发布者会显示重复的消息，例如：

2023-07-29 08:24:50.341 UTC [530982] STATEMENT:  START_REPLICATION SLOT "<SUB NAME>" LOGICAL 37D1/1E0DD9A0 (proto_version '3', publication_names '"<PUB NAME>"')
2023-07-29 08:27:36.956 UTC [530982] LOG:  terminating walsender process due to replication timeout
2023-07-29 08:27:36.956 UTC [530982] CONTEXT:  slot "<SUB NAME>", output plugin "pgoutput", in the change callback, associated LSN 37D0/F9E8C2E8

我可以使用psql从任一节点连接回另一个节点。据我所知，没有对路由或防火墙进行任何更改。

阅读其他类似的报告表明删除并重新创建子文件将解决问题，但我想理解/避免它。

任何有关如何追踪此问题的建议将不胜感激。

编辑：进一步调查显示“逻辑复制工作线程”100% CPU 限制，但 pg_stat_activity 中没有当前命令。

RabidMutant · Answer 1 · 2023-08-01T13:59:23+08:00

事实证明，这是一个应用程序设计问题，并且由于 postgres 中的边缘情况而导致 O(n^2) 更新性能。

该应用程序在复制表上有触发器，用于计算更新的基本统计数据。除其他事项外，它还保留了某些类型更改的计数。

在一种病态的情况下，单个事务中对此行的更新次数超过 150k。众所周知，这会导致 O(n^2) 性能下降，因为 PG 会重复写入行副本，然后必须在下一次更新时找到这些行。

超时只是因为更新速度太慢造成的。

解决方案是避免收集这些特定的统计数据。另一种解决方案是写入多行，但这有其自身的问题，并且统计数据并不是绝对必要的。

没有明显根本原因的逻辑复制超时

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

没有明显根本原因的逻辑复制超时

1 个回答

相关问题