AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 45005
Accepted
lexsys
lexsys
Asked: 2009-07-24 23:55:05 +0800 CST2009-07-24 23:55:05 +0800 CST 2009-07-24 23:55:05 +0800 CST

如何监控单个进程?

  • 772

我需要监视单个进程(例如,当建立超过 3000 个连接时发出警告)并收集有关它的统计信息(例如,确定今天上午 01:20 建立了多少连接,当时服务器工作太慢,正如客户所说)。我应该使用什么工具?

linux centos monitoring
  • 5 5 个回答
  • 6241 Views

5 个回答

  • Voted
  1. user13723
    2009-07-25T00:46:13+08:002009-07-25T00:46:13+08:00

    这可能不是最复杂的解决方案,但是 - 特别是如果您没有其他进程打开这么多套接字 - 您可以检查输出

    netstat -nutp
    

    (n:无名称解析,t:TCP,u:UDP,p:显示 PID 和程序 - 根据您的进程是否打开 UDP 或 TCP 连接,您可能只想提供 u 或 t 之一)。

    您可以从输出中获取 pid:

    netstat -nutp | grep -c ' 12345/progname$'
    

    其中“12345”应替换为您的 PID,“progname”应替换为您的进程名称。grep 的选项 -c 对匹配进行计数。您可能希望细化搜索以更准确地匹配您的需求(例如,仅包括 ESTABLISHED 连接)。

    'lsof' 也可能是你的朋友。你可以试试

    lsof -p 12345 -a -i4
    

    并检查输出并做一些 grepping。查看 lsof 手册页,看看您是否可以修改输出格式以更好地适应脚本解析。

    您可以编写一个简单的脚本来定期运行该命令。对于大量连接,您最好尝试运行 netstat 或 lsof 占用多少资源并调整间隔。例如每分钟一次(默认):

    #!/bin/sh
    
    prog=progname
    
    if [ -z "$1" ]; then
         interval=60
    else
         interval="$1"
    fi
    
    pid=$(pidof $prog)
    while :; do
        n=$(netstat -nutp | grep -c " ${pid}/${prog}$')
        date +"Number of connections [%Y-%m-%d %H:%M:%S]: $n" > connection.log
        if [ "$n" -gt $TRESHOLD ]; then
           # warn the admin
        fi
        sleep "${interval}"
    done
    

    (相当没用,只是提供给想法)。

    • 4
  2. James
    2009-07-25T00:03:28+08:002009-07-25T00:03:28+08:00

    如果你想要警报和监控,那么我会看Nagios,如果你想要纯图表,那么我会看Munin或Cacti。如果您只想知道一个进程在任何时候打开了多少个连接,请使用 lsof。

    • 2
  3. hayalci
    2009-07-29T03:07:33+08:002009-07-29T03:07:33+08:00

    您可以使用现成的解决方案ps-watcher

    你的配置可以是这样的:

    [processname$]
        trigger = $count > 3000
        action  = <<EOF
        mail -s "processname treshold exceeded" <<< "You have $count processes" 
        /root/bin/run_some_cleanup
    EOF
    
    [[p]rocessname$]
        action = echo "$count processes are running" 
    

    当进程计数超过阈值时,这将向您发送邮件。第二部分有一个不同的正则表达式匹配相同的进程名称,它记录进程的计数。由于它不受任何触发器的限制,因此该操作在每次 ps-watcher 检查时运行。您可以使用“--sleep 150”选项将检查间隔更改为 ps-watcher。

    • 2
  4. Best Answer
    RainyRat
    2009-07-25T00:43:53+08:002009-07-25T00:43:53+08:00

    如果您不想安装完整的 Nagios(或其他)来监控单个进程,为什么不自己编写一个脚本来完成呢?我已经做了类似的事情来跟踪我们其中一个盒子的数据库连接,使用 netstat 的输出进行计数并将结果记录到文件中。如果计数 > 3000,则添加额外的几行以发送电子邮件应该是微不足道的。

    • 0
  5. Adam Benayoun
    2009-07-28T05:45:24+08:002009-07-28T05:45:24+08:00

    我会安装 munin 并编写一个插件来监视特定进程或服务的特定行为。

    • 0

相关问题

  • 更改 PHP 的默认配置设置?

  • 你用什么工具来监控你的服务器?

  • 我应该如何管理每用户带宽?

  • 保护新的 Ubuntu 服务器 [关闭]

  • (软)Ubuntu 7.10 上的 RAID 6,我应该迁移到 8.10 吗?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    Windows 中执行反向 DNS 查找的命令行实用程序是什么?

    • 14 个回答
  • Marko Smith

    如何检查 Windows 机器上的端口是否被阻塞?

    • 4 个回答
  • Marko Smith

    我应该打开哪个端口以允许远程桌面?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    kch 如何更改我的私钥密码? 2009-08-06 21:37:57 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve