在一台 AIX 7.2 机器上,我需要调查是什么导致了特定时间之间的每日减速,在使用nmon
分析器 excel 分析 .nmon 文件后,我发现确实磁盘忙图形显示我的至少一个硬盘驱动器达到 100 % 利用率约 45 分钟。
这是nmon
我正在使用的命令:
nmon -f -T -s 10 -c 720 -d -V -P -m /my/nmon/location/
我真正想做的是查明在此期间使用磁盘的确切进程。我认为搜索在磁盘使用高峰发生的同时运行的任何进程将揭示原因。
所以让我们假设我在 15.00 看到磁盘使用率图形峰值,我是否应该转到 UARG 选项卡并搜索当时正在运行的任何进程?假设最消耗 CPU 的进程应归咎于磁盘使用是否正确?
请注意,在那段时间我没有正在运行的作业。
快照和选项之间的间隔为
-T
10 秒,您每 10 秒捕获一次顶级进程;希望有问题的进程正在使用足够的 CPU 时间,以在其中一个时间范围内被视为“顶级”进程。一旦你有了时间框架,我会从 NMON 文件中 grep 获取那个“快照编号”,然后按 CHARIO 列对结果进行排序。这将很好地指示哪些进程分配给它们的 I/O 最多。
获取快照编号:
您将获得如下所示的结果:
找到对应于 15:00 时间帧的 T000 编号,然后从 nmon 文件中 grep 查找这些 T 代码并按第 11 列(CHARIO)排序;例如:
每个时间范围底部的条目在该时间范围内执行的 I/O 最多。如果您在所讨论的 45 分钟持续时间内看到相同的过程,那么您有一个很好的候选人。当然,该进程可能与您的I/O 无关——它可能正在执行终端 I/O 或对其他磁盘的 I/O。