AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 47992
Accepted
lexsys
lexsys
Asked: 2009-07-31 04:17:45 +0800 CST2009-07-31 04:17:45 +0800 CST 2009-07-31 04:17:45 +0800 CST

为什么我的服务器意外宕机?

  • 772

我有基于 CentOS 5.3 的服务器,内核为 2.6.18-128.2.1.el5。它工作了将近一个月,但本周它下降了三倍。我在 Nagios 看到它,写一封电子邮件重新启动服务器。它工作了 12-36 小时,然后又下降了。

我查看日志文件。就在第一次出现故障之前/var/log/messages是这条消息:

logrotate: ALERT 异常退出 [1]

第二次重新启动服务器后,系统管理员从数据中心向我发送此屏幕截图: alt text http://www.freeimagehosting.net/uploads/bd9fb68d98.png 在第三个故障之前/var/log/messages是消息:

哎呀!page_mapcount(page) 变为负数 (-1)

我应该如何调查问题?

升级版:

部分memtester输出:

比较 OR : FAILURE: 0x7e9f90d1 != 0x7e9fd2d1 在偏移 0x06222609。
失败:0x7e9f90d1 != 0x7e9fd0d1 在偏移量 0x06222621。
失败:0x7e9f90d1 != 0x7e9fd1d1 在偏移量 0x06222661。
失败:0x7e9f90d1 != 0x7e9f92d1 在偏移量 0x06222681。
失败:0x7e9f90d1 != 0x7e9fd0d1 在偏移量 0x062226a1。
失败:0x7e9f90d1 != 0x7e9fd0d1 在偏移量 0x062226c1。
失败:0x7e9f90d1 != 0x7e9f93d1 在偏移量 0x062226e9。

是内存有问题。谢谢你的帮助!

linux centos server-crashes
  • 5 5 个回答
  • 1732 Views

5 个回答

  • Voted
  1. Best Answer
    TomOnTime
    2009-07-31T04:30:45+08:002009-07-31T04:30:45+08:00

    我的第一个猜测是 Nagios 存在少量内存泄漏,并且在运行数月后耗尽了 RAM 或交换空间。但是,由于机器在同一天崩溃了几次,这表明 RAM 芯片有故障。我的第一步是进行内存测试或检查错误的内存日志(如果您的服务器支持它)。

    • 3
  2. Kyle Brandt
    2009-07-31T04:37:00+08:002009-07-31T04:37:00+08:00

    我也投票给有缺陷的公羊。我建议使用memtest86对 ram 进行彻底检查。另外,房间里的温度是否凉爽凉爽?

    • 2
  3. sybreon
    2009-07-31T04:47:16+08:002009-07-31T04:47:16+08:00

    我也投票给有问题的 RAM。如果由于机器位于远程位置而无法使用 memtest86,则可能需要尝试使用用户空间工具 - memtester。它不能很好地工作,但如果它们存在的话,可能会发现一些内存错误。

    • 1
  4. Jeremy Bouse
    2009-07-31T04:26:46+08:002009-07-31T04:26:46+08:00

    一眼看去,惊慌失措的进程似乎是 Nagios。每次恐慌和锁定时,这是否一致?如果是这样,我会问问题是否在您设置 Nagios 时开始。如果是这种情况,那么您可能想尝试关闭 Nagios 并查看服务器是否恢复稳定。如果确实如此,那么您已经找到了罪魁祸首,需要仔细查看以了解 Nagios 出了什么问题。

    • 0
  5. goo
    2009-07-31T04:36:03+08:002009-07-31T04:36:03+08:00

    谷歌或 Centos 论坛/列表可能是你最好的选择。如果没有 crsah 转储,将很难确定,因此您应该考虑进行配置。

    您还可以通过 Redhat bugzilla 进行搜索。根据您从屏幕截图中获得的信息,这看起来很有可能。

    • 0

相关问题

  • 多操作系统环境的首选电子邮件客户端

  • 你最喜欢的 Linux 发行版是什么?[关闭]

  • 更改 PHP 的默认配置设置?

  • 保护新的 Ubuntu 服务器 [关闭]

  • (软)Ubuntu 7.10 上的 RAID 6,我应该迁移到 8.10 吗?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    Windows 中执行反向 DNS 查找的命令行实用程序是什么?

    • 14 个回答
  • Marko Smith

    如何检查 Windows 机器上的端口是否被阻塞?

    • 4 个回答
  • Marko Smith

    我应该打开哪个端口以允许远程桌面?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    kch 如何更改我的私钥密码? 2009-08-06 21:37:57 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve