AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 35513
Accepted
Contango
Contango
Asked: 2009-07-04 03:38:45 +0800 CST2009-07-04 03:38:45 +0800 CST 2009-07-04 03:38:45 +0800 CST

如何追踪 Windows Server 2008 崩溃的原因?

  • 772

我有在 VMware 下运行的 Windows Server 2008。

最近,它几乎每天都开始崩溃,持续 100% 的 CPU 使用率,并且在 GUI 中没有响应。

有没有一步一步的技术来追踪这个问题的根源?

我会查看哪些日志?

ps 这个问题出现在我尝试卸载 Acronis 的时候,并且蓝屏。但是,我不确定当前的故障是否与 Acronis 有关。

windows-server-2008 logging windows-event-log server-crashes
  • 8 8 个回答
  • 41377 Views

8 个回答

  • Voted
  1. Contango
    2009-07-11T02:07:19+08:002009-07-11T02:07:19+08:00

    您还可以使用 Windows Server 2008 下提供的“可靠性和性能监视器”。

    正如您在下面看到的,它会自动记录服务器的可靠性,并为它分配一个满分 10 分的“可靠性分数”。这个分数从 10 分开始,如果服务器遇到任何崩溃或意外关闭,它就会下降。

    它甚至会记录安装了哪些程序以及何时安装,因此您可以诊断安装的程序是否会导致更多故障。

    您还可以将其设置为连续记录程序的 CPU 使用率,以查看是哪个程序导致了 100% 的 CPU 使用率。

    在此处输入图像描述

    • 6
  2. Peter Hahndorf
    2009-07-05T14:19:43+08:002009-07-05T14:19:43+08:00

    如果有像 c:\windows\memory.dmp 这样的故障转储,您可以使用WinDbg对其进行分析。通常你想在转储中寻找第三方驱动程序。可在此处找到分步说明。

    • 4
  3. Dave Markle
    2009-07-04T04:01:59+08:002009-07-04T04:01:59+08:00

    系统事件日志。应用程序事件日志。谷歌BSOD的消息。使用 chkdsk 检查磁盘的完整性。

    • 3
  4. Bob
    2009-07-06T00:13:08+08:002009-07-06T00:13:08+08:00

    你有两个选择:

    • 查看记录以尝试找出导致过去问题的原因
    • 寻找可能导致 CPU 峰值的事物的迹象,以尝试复制问题

    如果您知道问题开始的时间或者日志​​足够安静,可以让您注意到导致固定 CPU 的模式,那么日志是回顾系统历史的良好开端。如果系统蓝屏,你可以把dmp的扔进windbg。

    如果您正在寻找可能导致 CPU 峰值的事情:

    • 来自 sysinterals 的进程资源管理器:查找不再存在的文件或网络共享的奇怪进程或打开句柄。它可能会为您指明复制问题的正确方向
    • Windows 可靠性和性能监视器/Perfmon:您可以查看每个进程在磁盘/CPU/内存/网络使用情况以及数百个其他计数器方面的行为。它们可能会在 VM 发生之前为您提供有关 VM 失控的线索。

    一旦你有一个很好的问题候选人,你可以从 sysinternals 打开进程监视器。它将实时转储系统上每个进程正在执行的每个文件和注册表交互。它甚至可以配置为在启动时加载并捕获所有内容,直到您接下来运行 GUI(请注意,这是大量数据,因此只有在启动后可以快速复制问题时才建议这样做)

    有一堆兔子洞,根本原因分析可以让你失望,请随时让我们知道它是如何进行的。

    • 3
  5. Adam Brand
    2009-07-04T06:49:29+08:002009-07-04T06:49:29+08:00

    如果是蓝屏,请查看 minidump 文件:http: //support.microsoft.com/kb/315271

    ...这将告诉您(通常)导致崩溃的驱动程序或软件。

    • 2
  6. Best Answer
    Gravitas
    2009-07-07T13:49:31+08:002009-07-07T13:49:31+08:00

    2009-07-06 - 我认为它的硬盘驱动器。

    我做了一个 chkdsk,它在 chkdsk 中途崩溃时出现了与之前相同的症状。我使用的是固态硬盘 (SSD),“PQI DK9128GD6R000A03 128GB SATA 2.5”SSD”,MTBF 为 1,500,000 小时。尽管 MTBF 为 133 年,但在 2 周或正常使用后似乎已经死亡!为了验证我的理论,我将 VMware 文件复制到标准硬盘驱动器。运行 chkdsk,它就像一个魅力。我会看看系统是否能存活一周的正常运行时间,如果可以,我可以正式保护我的 PQI SSD .

    2009-07-07 - 系统再次崩溃。回到绘图板。

    2009-07-08 - 在我安装 SSD 之前再回滚 20 天。我们将看看它是否再次崩溃(确实如此)。

    2009-07-09 - 卸载 OpenVPN,升级到最新版本的 Skype,升级到 SQL 2008 到 SP1,移除 TeamViewer。我们将看看它是否再次崩溃(它确实发生了,在 Acronis 备份过程中)。

    2009-07-09 - 怀疑运行服务器的 VMware 机器可用的虚拟内存量太小,我目前只有 4GB。增加它(这没有效果)。

    2009-07-09 - 发现如果运行 Windows Server 2008 的 VMware 容器在 CPU 利用率为 100% 的情况下崩溃,我暂停/重新启动它,然后它会恢复运行并恢复运行!这往往指向 VMware 或其主机操作系统(即 XP)的问题,而不是 Windows Server 2008 本身的问题。现在非常接近问题的核心。

    2009-07-09 - Windows Server 2008 仅在主机操作系统负载非常重时崩溃。将它可以利用的 CPU 数量增加到 2 个 CPU,这似乎已经解决了这个问题。

    综上所述:

    1. 最初的问题是由带有坏扇区的坏硬盘驱动器引起的(它实际上是 PQI 的 128GB SSD - 不希望固态驱动器 (SSD) 在购买两周后出现故障,但这个确实出现了)。
    2. 下一个问题是由运行 VMware 的主机操作系统在高负载下引起的。通过分配更多 RAM 并增加页面文件的大小来解决此问题。
    3. 如果它再次发生,我有一个解决方法(只需暂停/重新启动 VMware v6.5 以“解冻”在其中运行的 Windows Server 2008)。

    问题已解决,谢谢各位!

    • 2
  7. Maxwell
    2009-07-04T04:26:51+08:002009-07-04T04:26:51+08:00

    您能否解释一下崩溃是什么意思,服务器遇到 BSOD 还是只是挂在 100% Cpu 上。

    对于故障排除,您可以将服务器记录到 syslog 服务器,每隔一段时间运行一个脚本列表来处理它们的资源使用情况,将他的输出写入网络共享。

    如果服务器使 bsods 尝试使用谷歌搜索 bsod 中提到的错误代码。

    此外,也许 acronis 卸载会在安装文件夹中留下带有一些信息的错误日志。

    • 1
  8. Gamecat
    2009-07-04T04:04:30+08:002009-07-04T04:04:30+08:00

    它是否每 24 小时(每天同一时间)准确地崩溃?

    如果是这样,则可能存在导致崩溃的预定进程。

    • 1

相关问题

  • 有没有办法在 LAN 上的所有事件日志中搜索特定事件?

  • 什么可能导致 IIS7 拒绝绑定到不允许导出私钥的证书?

  • 从 2003 年迁移到 2008 年 Microsoft 群集技术

  • 有什么理由使用 Windows Server 2003 而不是 Server 2008?

  • 是否可以在单个 W2008 服务器上安装 Exchange Server?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    Windows 中执行反向 DNS 查找的命令行实用程序是什么?

    • 14 个回答
  • Marko Smith

    如何检查 Windows 机器上的端口是否被阻塞?

    • 4 个回答
  • Marko Smith

    我应该打开哪个端口以允许远程桌面?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    kch 如何更改我的私钥密码? 2009-08-06 21:37:57 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve