多操作系统环境的首选电子邮件客户端

Question

Jeremy W.

Asked: 2020-11-07 17:59:13 +0800 CST2020-11-07 17:59:13 +0800 CST 2020-11-07 17:59:13 +0800 CST

如何设置服务器以监控一段时间内的资源使用情况并生成报告

772

我正在做一个研究项目，我们通常在服务器上开始工作，大约需要一两天的时间才能运行，然后我们回去看看结果。问题在于，在某些情况下，我们正在使服务器资源匮乏，并且由于某些作业失败，它正在影响我们的结果。

我想生成一份报告，我们可以回顾一下以确定服务器资源的使用情况，并将其与作业交叉引用。

我试过用 atop 做这个（使用它的 rawfile 格式）但是在不同的机器上读取这种格式有很多问题（即不同版本的 linux 或 atop 等）

所以我想知道是否有更优雅的解决方案？最终，我需要能够深入了解每个进程级别的资源消耗，并查看用于实例化进程的命令（如 htop 中的命令列。）

2 个回答

Voted

Mark Scheck · Answer 1 · 2020-11-08T01:05:43+08:00

Best Answer

Mark Scheck

2020-11-08T01:05:43+08:002020-11-08T01:05:43+08:00

您可能可以从

sar -f /var/log/sysstat/sa6

看昨天系统大雅

以及 vmstat

这使您能够开始将问题缩小到小时。从那里您可以开始查看服务器日志以查看是否有错误。在日志上使用 grep 并查找您的进程名称和关键字，例如问题、错误。

0

zorry · Answer 2 · 2020-11-10T04:12:57+08:00

zorry

2020-11-10T04:12:57+08:002020-11-10T04:12:57+08:00

您应该尝试一下nmon，您可以从 EPEL 存储库中获取它。

您可以安排一个 cron 作业来创建每日报告，例如，这将在每天早上 7 点生成一份报告：

- name: nmon cron
  cron:
    name: "Generate nmon daily at 7:00"
    minute: "0"
    hour: "7"
    job: "/bin/nmon -fT -s300 -c290 -m /root/nmon"
    user: root
    cron_file: nmon

报告的大小各不相同，例如第一个来自测试服务器，第二个来自 Oracle 生产服务器：

[root@xxxxxx379 ~]# du -sh nmon/xxxxxx379_201108_0700.nmon
316K    nmon/xxxxxx379_201108_0700.nmon

[root@xxxx203 ~]# du -sh nmon/xxxx203_201108_0700.nmon
1.8M    nmon/xxxx203_201108_0700.nmon

然后，您可以通过多种方式绘制统计数据（输出为 csv）。

0

如何设置服务器以监控一段时间内的资源使用情况并生成报告

新安装后 postgres 的默认超级用户用户名/密码是什么？

SFTP 使用什么端口？

命令行列出 Windows Active Directory 组中的用户？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

如何设置服务器以监控一段时间内的资源使用情况并生成报告

2 个回答

相关问题