AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 22486
Accepted
ThinkingMonkey
ThinkingMonkey
Asked: 2012-08-15 04:12:48 +0800 CST2012-08-15 04:12:48 +0800 CST 2012-08-15 04:12:48 +0800 CST

在 HDD 崩溃后启动 PostgreSQL 服务器导致 FAILED STATE

  • 772

我正在Fedora 15使用PostgreSQL 9.1.4. Fedora 最近崩溃了,之后:

尝试启动 PostgreSQL 服务器:

service postgresql-9.1 start

给

Starting postgresql-9.1 (via systemctl):  Job failed. See system logs and 'systemctl status' for details.
                                                       [FAILED]

虽然,当我在系统重启后第一次启动服务器时,服务器正常启动。
但是,尝试使用psql会出现此错误:

psql: could not connect to server: No such file or directory
    Is the server running locally and accepting
    connections on Unix domain socket "/tmp/.s.PGSQL.5432"?

.s.PGSQL.5432文件在系统上的任何地方都不存在。Alocate .s.PGSQL.5432什么也不输出。


系统日志有这个:

Aug 14 17:31:58 localhost systemd[1]: postgresql-9.1.service: control process exited, code=exited status=1
Aug 14 17:31:58 localhost systemd[1]: Unit postgresql-9.1.service entered failed state.

一个

systemctl status postgresql-9.1.service

给

postgresql-9.1.service - SYSV: PostgreSQL database server.
          Loaded: loaded (/etc/rc.d/init.d/postgresql-9.1)
      Active: failed since Tue, 14 Aug 2012 17:31:58 +0530; 58s ago
     Process: 2811 ExecStop=/etc/rc.d/init.d/postgresql-9.1 stop (code=exited, status=1/FAILURE)
     Process: 12423 ExecStart=/etc/rc.d/init.d/postgresql-9.1 start (code=exited, status=1/FAILURE)
    Main PID: 2551 (code=exited, status=1/FAILURE)
      CGroup: name=systemd:/system/postgresql-9.1.service

我没有更改 fsync 的默认设置,所以我猜,它设置为on. 我在硬盘上。硬盘坏了。

硬盘崩溃

HDD 崩溃导致在fsck提示符下运行手册,而不是基于 gui。用它修复大量的 inode 等。之后我用Ctrl++Alt重新启动了系统Delete。

PostgreSQL 的日志是这样的:

LOG:  database system was interrupted; last known up at 2012-08-14 17:31:57 IST
LOG:  database system was not properly shut down; automatic recovery in progress
LOG:  record with zero length at 0/41A4E58
LOG:  redo is not required
FATAL:  could not access status of transaction 1
DETAIL:  Could not open file "pg_multixact/offsets/0000": No such file or directory.
LOG:  startup process (PID 13016) exited with exit code 1
LOG:  aborting startup due to startup process failure

更新

在获取目录的文件系统级别副本后尝试启动服务器/var/lib/pgsql,并运行./pg_resetxlog -f /var/lib/pgsql/9.1/data/结果xlog -f /var/lib/pgsql/9.1/data/仍然会产生:

LOG:  database system was interrupted; last known up at 2012-08-14 18:46:36 IST
LOG:  database system was not properly shut down; automatic recovery in progress
LOG:  record with zero length at 0/6000078
LOG:  redo is not required
FATAL:  could not access status of transaction 1
DETAIL:  Could not open file "pg_multixact/offsets/0000": No such file or directory.
LOG:  startup process (PID 13766) exited with exit code 1
LOG:  aborting startup due to startup process failure
postgresql linux
  • 1 1 个回答
  • 13961 Views

1 个回答

  • Voted
  1. Best Answer
    Craig Ringer
    2012-08-15T04:33:00+08:002012-08-15T04:33:00+08:00

    真正的答案将在 PostgreSQL 日志中,在/var/lib/pgsql/data/pg_log.

    但是,在您采取任何行动之前:如果您的任何数据对您有价值,那么在尝试修复之前获取数据库的文件系统级副本至关重要。请参阅http://wiki.postgresql.org/wiki/Corruption。您必须复制整个数据目录。在 Fedora 上,这/var/lib/pgsql/data是默认设置,但请验证您的安装是否正确。

    根据您发布的日志,您肯定有一定程度的数据库损坏。数据库所在的存储(硬盘驱动器或文件系统)很可能已损坏。立即复制,并将其放在不同的硬盘驱动器或系统上。

    仅在您制作了数据目录的完整文件系统级别副本后,尝试使用pg_resetxlog清除损坏的事务日志并启动数据库。即使它启动它也很可能是腐败的;你应该pg_dump然后重新initdb它并将转储恢复到新实例。

    如果您仍然无法启动它,pg_resetxlog请在 resetxlog 之后发布更新的启动尝试日志。您可能需要以独立模式启动 Pg:

    sudo -u postgres postgres --single -D /var/lib/pgsql/data -P -f i postgres
    

    如果可行,给你一个backend>提示,用你要连接的数据库的名称替换最后一个“postgres”后重试。您应该能够SELECT,COPY来自表等的数据。

    如果这不起作用,即你不能启动一个独立的后端,那么可能是时候从备份中恢复了——因为你足够明智地拥有它们。如果其他阅读本文的人处于相同的位置,请联系经验丰富的 PostgreSQL 顾问,看看他们是否可以从您的数据库中恢复数据。准备好为他们的时间和专业知识付费。

    您的文件系统可能已损坏

    PostgreSQL 安装损坏的严重程度表明您的整个文件系统可能已损坏。您可能希望考虑从备份中恢复整个系统或重新安装它。

    我不会相信这个文件系统,fsck或者不相信fsck.

    智能测试您的驱动器

    我还建议您使用smartmontoolsSMART对您的硬盘进行检查;smartctl假设是/dev/hda这样smartctl -d ata -a /dev/sda | less。查找失败的运行状况测试、uncorrectable_sectors高读取错误率、大于 2 或 3 的 reallocated_sector_count 或非零 current_pending_sector。运行smartctl -d ata -t long /dev/sda以在您的硬盘上执行非破坏性自检;它不会中断系统的正常运行。当估计的时间已经过去时,smartctl -d ata /dev/sda再次运行并查看自检日志以查看它是否通过。

    如果有任何东西看起来不够完美,请更换驱动器。

    将来,请考虑通过smartd对驱动器故障进行早期警告来自动化此测试。

    (这篇文章中的内容已因问题更新而过时。如果您正在解决类似问题,请查看此答案的编辑历史记录)。

    • 15

相关问题

  • 我可以在使用数据库后激活 PITR 吗?

  • 运行时间偏移延迟复制的最佳实践

  • 存储过程可以防止 SQL 注入吗?

  • PostgreSQL 中 UniProt 的生物序列

  • PostgreSQL 9.0 Replication 和 Slony-I 有什么区别?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何查看 Oracle 中的数据库列表?

    • 8 个回答
  • Marko Smith

    mysql innodb_buffer_pool_size 应该有多大?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    从 .frm 和 .ibd 文件恢复表?

    • 10 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    如何选择每组的第一行?

    • 6 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    bernd_k 什么时候应该使用唯一约束而不是唯一索引? 2011-01-05 02:32:27 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve