我正在Fedora 15
使用PostgreSQL 9.1.4
. Fedora 最近崩溃了,之后:
尝试启动 PostgreSQL 服务器:
service postgresql-9.1 start
给
Starting postgresql-9.1 (via systemctl): Job failed. See system logs and 'systemctl status' for details.
[FAILED]
虽然,当我在系统重启后第一次启动服务器时,服务器正常启动。
但是,尝试使用psql
会出现此错误:
psql: could not connect to server: No such file or directory
Is the server running locally and accepting
connections on Unix domain socket "/tmp/.s.PGSQL.5432"?
.s.PGSQL.5432
文件在系统上的任何地方都不存在。Alocate .s.PGSQL.5432
什么也不输出。
系统日志有这个:
Aug 14 17:31:58 localhost systemd[1]: postgresql-9.1.service: control process exited, code=exited status=1
Aug 14 17:31:58 localhost systemd[1]: Unit postgresql-9.1.service entered failed state.
一个
systemctl status postgresql-9.1.service
给
postgresql-9.1.service - SYSV: PostgreSQL database server.
Loaded: loaded (/etc/rc.d/init.d/postgresql-9.1)
Active: failed since Tue, 14 Aug 2012 17:31:58 +0530; 58s ago
Process: 2811 ExecStop=/etc/rc.d/init.d/postgresql-9.1 stop (code=exited, status=1/FAILURE)
Process: 12423 ExecStart=/etc/rc.d/init.d/postgresql-9.1 start (code=exited, status=1/FAILURE)
Main PID: 2551 (code=exited, status=1/FAILURE)
CGroup: name=systemd:/system/postgresql-9.1.service
我没有更改 fsync 的默认设置,所以我猜,它设置为on
. 我在硬盘上。硬盘坏了。
硬盘崩溃
HDD 崩溃导致在fsck
提示符下运行手册,而不是基于 gui。用它修复大量的 inode 等。之后我用Ctrl++Alt重新启动了系统Delete。
PostgreSQL 的日志是这样的:
LOG: database system was interrupted; last known up at 2012-08-14 17:31:57 IST
LOG: database system was not properly shut down; automatic recovery in progress
LOG: record with zero length at 0/41A4E58
LOG: redo is not required
FATAL: could not access status of transaction 1
DETAIL: Could not open file "pg_multixact/offsets/0000": No such file or directory.
LOG: startup process (PID 13016) exited with exit code 1
LOG: aborting startup due to startup process failure
更新
在获取目录的文件系统级别副本后尝试启动服务器/var/lib/pgsql
,并运行./pg_resetxlog -f /var/lib/pgsql/9.1/data/
结果xlog -f /var/lib/pgsql/9.1/data/
仍然会产生:
LOG: database system was interrupted; last known up at 2012-08-14 18:46:36 IST
LOG: database system was not properly shut down; automatic recovery in progress
LOG: record with zero length at 0/6000078
LOG: redo is not required
FATAL: could not access status of transaction 1
DETAIL: Could not open file "pg_multixact/offsets/0000": No such file or directory.
LOG: startup process (PID 13766) exited with exit code 1
LOG: aborting startup due to startup process failure
真正的答案将在 PostgreSQL 日志中,在
/var/lib/pgsql/data/pg_log
.但是,在您采取任何行动之前:如果您的任何数据对您有价值,那么在尝试修复之前获取数据库的文件系统级副本至关重要。请参阅http://wiki.postgresql.org/wiki/Corruption。您必须复制整个数据目录。在 Fedora 上,这
/var/lib/pgsql/data
是默认设置,但请验证您的安装是否正确。根据您发布的日志,您肯定有一定程度的数据库损坏。数据库所在的存储(硬盘驱动器或文件系统)很可能已损坏。立即复制,并将其放在不同的硬盘驱动器或系统上。
仅在您制作了数据目录的完整文件系统级别副本后,尝试使用pg_resetxlog清除损坏的事务日志并启动数据库。即使它启动它也很可能是腐败的;你应该
pg_dump
然后重新initdb
它并将转储恢复到新实例。如果您仍然无法启动它,
pg_resetxlog
请在 resetxlog 之后发布更新的启动尝试日志。您可能需要以独立模式启动 Pg:如果可行,给你一个
backend>
提示,用你要连接的数据库的名称替换最后一个“postgres”后重试。您应该能够SELECT
,COPY
来自表等的数据。如果这不起作用,即你不能启动一个独立的后端,那么可能是时候从备份中恢复了——因为你足够明智地拥有它们。如果其他阅读本文的人处于相同的位置,请联系经验丰富的 PostgreSQL 顾问,看看他们是否可以从您的数据库中恢复数据。准备好为他们的时间和专业知识付费。
您的文件系统可能已损坏
PostgreSQL 安装损坏的严重程度表明您的整个文件系统可能已损坏。您可能希望考虑从备份中恢复整个系统或重新安装它。
我不会相信这个文件系统,
fsck
或者不相信fsck
.智能测试您的驱动器
我还建议您使用smartmontools
SMART
对您的硬盘进行检查;smartctl
假设是/dev/hda
这样smartctl -d ata -a /dev/sda | less
。查找失败的运行状况测试、uncorrectable_sectors
高读取错误率、大于 2 或 3 的 reallocated_sector_count 或非零 current_pending_sector。运行smartctl -d ata -t long /dev/sda
以在您的硬盘上执行非破坏性自检;它不会中断系统的正常运行。当估计的时间已经过去时,smartctl -d ata /dev/sda
再次运行并查看自检日志以查看它是否通过。如果有任何东西看起来不够完美,请更换驱动器。
将来,请考虑通过
smartd
对驱动器故障进行早期警告来自动化此测试。(这篇文章中的内容已因问题更新而过时。如果您正在解决类似问题,请查看此答案的编辑历史记录)。