我可以在使用数据库后激活 PITR 吗？

Question

Richie Thomas

Asked: 2020-01-15 10:37:37 +0800 CST2020-01-15 10:37:37 +0800 CST 2020-01-15 10:37:37 +0800 CST

带有`jobs`标志的`pg_restore`导致`pg_restore：错误：工作进程意外死亡`

772

我有一个运行以下内容的脚本：

pg_restore tmp/latest.backup --verbose --clean --no-acl --no-owner --dbname hub_development --jobs=12

这经常失败并出现以下错误：

error: could not find block ID 4584 in archive -- possibly due to out-of-order restore request, which cannot be handled due to lack of data offsets in archive

pg_restore: error: a worker process died unexpectedly

反过来，这个错误意味着应该有索引、主键等的表最终没有它们。例如，当在没有多核的情况下运行时，我们的users表如下所示，正如预期的那样：


                                           Table "public.users"
       Column       |            Type             | Collation | Nullable |              Default              
--------------------+-----------------------------+-----------+----------+-----------------------------------
 id                 | integer                     |           | not null | nextval('users_id_seq'::regclass)
 created_at         | timestamp without time zone |           | not null | 
 updated_at         | timestamp without time zone |           | not null | 
 email              | character varying           |           | not null | 
 confirmation_token | character varying(128)      |           |          | 
 name               | character varying           |           | not null | ''::character varying
 user_type          | character varying           |           |          | 
 encrypted_password | character varying(128)      |           |          | 
 remember_token     | character varying(128)      |           |          | 
Indexes:
    "users_pkey" PRIMARY KEY, btree (id)
    "index_users_on_email" btree (email)
    "index_users_on_remember_token" btree (remember_token)
Referenced by:
    TABLE "project_feedback_users" CONSTRAINT "fk_rails_08af49ba47" FOREIGN KEY (user_id) REFERENCES users(id)
    TABLE "client_reviews" CONSTRAINT "fk_rails_8fc606dbea" FOREIGN KEY (user_id) REFERENCES users(id)

多核运行时，表格如下所示：


hub_development=# \d users
                                            Table "public.users"
       Column       |            Type             | Collation | Nullable |              Default              
--------------------+-----------------------------+-----------+----------+-----------------------------------
 id                 | integer                     |           | not null | nextval('users_id_seq'::regclass)
 created_at         | timestamp without time zone |           | not null | 
 updated_at         | timestamp without time zone |           | not null | 
 email              | character varying           |           | not null | 
 confirmation_token | character varying(128)      |           |          | 
 name               | character varying           |           | not null | ''::character varying
 user_type          | character varying           |           |          | 
 encrypted_password | character varying(128)      |           |          | 
 remember_token     | character varying(128)      |           |          |

基于此，我得出的结论是，创建表本身的同一个工作人员也不负责添加索引和外键，第二个工作人员试图在第一个工作人员之前运行，这导致了我观察到的错误.

当我删除--jobs=12标志时脚本工作正常，最坏的情况是我只是这样做。

但是，对于我自己的教育，我很想知道是否有一种解决方案可以保留我们使用多核并行化数据库还原的能力，同时避免无序的还原请求。

该错误提到由于存档中缺少数据偏移量而无法处理乱序恢复请求。添加这些数据偏移量会以我描述的方式解决问题吗？如果是这样，我将如何去做，这样做有什么缺点吗？

我不是数据库管理员，我在这里的知识有限，所以如果我没有提供足够的信息来回答这个问题，请告诉我。

我的 Postgres 本地版本是 12.1，数据来自 Heroku 上托管的 Rails 应用程序。这是结果heroku pg:info：

=== HEROKU_POSTGRESQL_BRONZE_URL, DATABASE_URL
Plan:                  Standard 0
Status:                Available
Data Size:             3.38 GB
Tables:                44
PG Version:            11.5
Connections:           22/120
Connection Pooling:    Available
Credentials:           1
Fork/Follow:           Available
Rollback:              earliest from 2020-01-10 18:17 UTC
Created:               2019-10-29 18:20 UTC
Region:                us
Data Encryption:       In Use
Continuous Protection: On
Maintenance:           not required
Maintenance window:    Wednesdays 18:00 to 22:00 UTC
Add-on:                postgresql-metric-02684

3 个回答

Voted

ldrg · Answer 1 · 2020-05-19T04:43:00+08:00

Best Answer

ldrg

2020-05-19T04:43:00+08:002020-05-19T04:43:00+08:00

更新：“工作进程意外死亡”问题已在 PostgreSQL 12.4 上游修复！升级以获得修复。

为了获得最佳兼容性和性能，pg_restore请将pg_dump转储文件写入磁盘上的本地文件，而不是不可搜索的文件描述符。

5

Jared Menard · Answer 2 · 2020-04-28T09:29:15+08:00

Jared Menard

2020-04-28T09:29:15+08:002020-04-28T09:29:15+08:00

我有这个问题。对我来说，解决方案是在开发中使用旧版本的 postgres。我们的生产服务器使用的是 9.x 或 10.x，但我试图使用 postgres 12.x 进行恢复。降级到 10.x 对我有用。

0

Adam C. Scott · Answer 3 · 2020-05-14T15:29:48+08:00

Adam C. Scott

2020-05-14T15:29:48+08:002020-05-14T15:29:48+08:00

乍一看，它看起来像是 pg_dump 达到 EOF 的文件系统问题。

见https://github.com/postgres/postgres/blob/7a9c9ce6411720c2bbeaf6e64855d4263c47ea80/src/bin/pg_dump/pg_backup_custom.c#L460

但是你说没有 --jobs=12 也能正常工作。那么这看起来像是一个同步问题，但在其他人报告时应该会更频繁地出现。（我会尝试 --jobs=2。）

我的猜测是它与操作系统有关。可能已达到最大打开文件数（通常我会查看 /var/log/messages，但您在 Heroku 上）。有关最大打开文件的更多详细信息，请参阅：https ://www.postgresql.org/docs/12/kernel-resources.html#id-1.6.5.6.5

0

带有`jobs`标志的`pg_restore`导致`pg_restore：错误：工作进程意外死亡`

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

带有`jobs`标志的`pg_restore`导致`pg_restore：错误：工作进程意外死亡`

3 个回答

相关问题