AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题

问题[nagios](server)

Martin Hope
nulll
Asked: 2024-06-05 15:28:10 +0800 CST

`systemctl reload` 失败,但 `systemctl is-failed` 无法识别失败状态

  • 6

在 Ubuntu 22.04 服务器上,我有一个用于重新加载 nagios4 配置的 bash 脚本。重新加载后,我想检查服务是否正常

#!/bin/bash
sudo systemctl reload nagios4.service

if (systemctl --quiet is-failed nagios4.service); then
    echo "Bad config!"
fi

不知何故它不工作,如果配置不正确,服务就会失败,但无法被识别systemctl is-failed

如果我手动检查systemctl status nagios4

× nagios4.service - nagios4
     Loaded: loaded (/lib/systemd/system/nagios4.service; enabled; vendor preset: enabled)
     Active: failed (Result: exit-code) since Wed 2024-06-05 09:20:03 CEST; 4min 27s ago

我曾尝试将我的脚本改为使用restart而不是reload或使用 来运行systemctl is-failed,sudo但没有任何变化。

我错过了什么?


更新:即使失败也会reload返回状态0

sudo systemctl reload nagios4.service
status=$?
echo $status
nagios
  • 2 个回答
  • 65 Views
Martin Hope
elbarna
Asked: 2023-07-02 08:33:51 +0800 CST

我的 nagios kdc 配置有什么问题?

  • 5

我想设置一项服务来使用 nagios 检查 kdc。使用我的 kdc (samba4),我使用此脚本创建用户

#!/bin/bash

USER=nagioskerberos
DOMAIN=myhost.priv
SERVICE=nagioskerberos
FQDN=nagios1.myhost.priv

samba-tool user delete $USER
samba-tool user create $USER --random-password
samba-tool user setexpiry $USER --noexpiry
net ads enctypes set $USER 16
samba-tool spn add $SERVICE/$FQDN $USER
samba-tool domain exportkeytab $USER.keytab --principal=$SERVICE/$FQDN

然后我复制 nagios 服务器上的密钥表并重新启动服务

scp nagioskerberos.keytab nagios1:
ssh nagios1
systemctl restart nagios

权限没问题

ls -lhd /etc/nagios/nagios.*tab
-rw------- 1 nagios nagios 101 Jul  2 02:25 /etc/nagios/nagios.keytab

钥匙看起来还可以

klist -ke /etc/nagios/nagios.keytab 
Keytab name: FILE:/etc/nagios/nagios.keytab
KVNO Principal
---- --------------------------------------------------------------------------
   2 nagioskerberos/nagios1.myhost.priv@MYHOST.PRIV (aes256-cts-hmac-sha1-96) 

但是当我尝试检查时...

./check_kdc -k /etc/nagios/nagios.keytab  -p nagioskerberos/nagios1.myhost.priv@MYHOST.PRIV -H samba4 -P 88
CRITICAL Getting Kerberos ticket: kinit: Client 'nagioskerberos/nagios1.myhost.priv@MYHOST.PRIV' not found in Kerberos database while getting initial credentials (credentials for nagioskerberos/nagios1.myhost.priv@MYHOST.PRIV from /etc/nagios/nagios.keytab)

为什么?

这是服务器 samba4 和服务器 nagios 的 krb5.conf

[libdefaults]
    default_realm = MYHOST.PRIV
    dns_lookup_realm = true
    dns_lookup_kdc = true
    default_tgs_enctypes = aes256-cts-hmac-sha1-96 aes128-cts-hmac-sha1-96
    default_tkt_enctypes = aes256-cts-hmac-sha1-96 aes128-cts-hmac-sha1-96
    permitted_encryptes = aes256-cts-hmac-sha1-96 aes128-cts-hmac-sha1-96
nagios
  • 1 个回答
  • 15 Views
Martin Hope
Cat Mucius
Asked: 2023-05-03 16:43:54 +0800 CST

NRPE comman 的远程调用在一种情况下失败,而在所有情况下都在本地成功

  • 5

我在监视通过 Nagios + NRPE 安装到 Linux 机器的 CIFS (SMB) 共享文件夹时遇到了一个非常奇怪的问题。

NRPE 进程在专用用户下的 Linux 机器上运行nrpe:

# systemctl status nrpe
  nrpe.service - Nagios Remote Program Executor
   Loaded: loaded (/usr/lib/systemd/system/nrpe.service; enabled; vendor preset: disabled)
   Active: active (running) since Tue 2023-05-02 14:46:47 IDT; 20h ago
     Docs: http://www.nagios.org/documentation
  Process: 30216 ExecStopPost=/bin/rm -f /run/nrpe/nrpe.pid (code=exited, status=0/SUCCESS)
 Main PID: 30218 (nrpe)
   CGroup: /system.slice/nrpe.service
           └─30218 /usr/sbin/nrpe -c /etc/nagios/nrpe.cfg -f

# ps -ef | grep nrpe
nrpe     30218     1  0 May02 ?        00:00:05 /usr/sbin/nrpe -c /etc/nagios/nrpe.cfg -f

监控命令在其配置/etc/nagios/nrpe.cfg文件中是这样定义的:

command[check_backups_share]=/usr/lib64/nagios/plugins/check_disk -w 7% -c 5% -p /mnt/backups

如果我在所有机器上以用户身份手动运行命令nrpe,它会成功:

# sudo -u nrpe bash
bash-4.2$ /usr/lib64/nagios/plugins/check_disk -w 7% -c 5% -p /mnt/backups
DISK OK - free space: /mnt/backups 2571991 MiB (61.32% inode=-);| /mnt/backups=1622248MiB;3900643;3984528;0;4194240

但是,如果我从 Nagios远程调用它,它会在一台机器上成功而在另一台机器上失败:

$ /usr/local/nagios/libexec/check_nrpe -2 -H Machine01 -c check_backups_share
DISK OK - free space: /mnt/backups 2575536 MiB (61.40% inode=-);| /mnt/backups=1618703MiB;3900643;3984528;0;4194240

$ /usr/local/nagios/libexec/check_nrpe -2 -H Machine02 -c check_backups_share
DISK CRITICAL - /mnt/backups is not accessible: Permission denied

所有其他远程 NRPE 命令都Machine02成功。更重要的是,如果我卸载/mnt/backups文件夹Machine02,它也会成功(对于根文件系统)。但是当它安装时,我得到这个Permission denied错误。

该文件夹以相同的凭据和选项安装在所有计算机上。在/etc/fstab文件中:

//Backups-Server/backups  /mnt/backups      cifs    vers=3.0,credentials=/path/to/creds    0 0

所以:

  • 所有凭据、权限、用户、组都是相同的;
  • 在同一用户下的所有机器上本地执行的命令产生相同的结果;
  • 但是当远程执行时,它在一台抱怨权限的机器上失败,但在所有其他机器上成功,
  • 而执行nrpe进程在所有机器上以相同的方式配置并具有相同的权限。

那么这到底是什么呢?

更新:

已解决,见下文。

nagios
  • 1 个回答
  • 35 Views
Martin Hope
Plouff
Asked: 2022-10-13 07:47:11 +0800 CST

学习哪一个:Nagios 还是 Zabbix?

  • 0

我需要回答一个网络管理员学生,目前哪个工具在“就业能力”方面更有用:Nagios 或 Zabbix。但这不是我的领域。

我听说 Nagios 过去曾有过辉煌,而如今 Zabbix 被更多人使用。这是真的吗?

此外,它们是否提供相同的功能?我读过 Nagios 是连续的,而 Zabbix 不是?这是真的吗?

非常感谢您的见解:)!

nagios zabbix
  • 1 个回答
  • 46 Views
Martin Hope
Colin 't Hart
Asked: 2022-03-03 11:37:18 +0800 CST

Naemon 仍在为已删除的主机发送 DOWN 通知

  • 0

我关闭了一个旧的 Web 服务器,并立即开始接收来自 Naemon 的 DOWN 通知。

现在我已经从 Naemon 配置中完全删除了该主机,并重新启动了 Naemon 服务。然而,我仍然每小时都会收到 DOWN 通知。

我该如何阻止这些?

整个 Naemon 配置差不多有 2000 行,太长了,这里就不介绍了;几乎默认的 naemon.cfg 本身就超过 1000 行。

是否有一些参数导致主机保存在某个缓存中?我可以找到列出的主机/var/lib/naemon/status.dat

nagios ubuntu-16.04 notification
  • 1 个回答
  • 56 Views
Martin Hope
qroberts
Asked: 2021-12-10 07:55:46 +0800 CST

Nagios - “错误:无法打开配置目录”但权限正确且 selinux 允许

  • 0

尝试设置一个单独的目录来存储我的 nagios 配置文件,当我尝试验证配置时,我收到以下错误。

错误:无法打开配置目录“/usr/local/nagios/etc/objects/corp/contacts.cfg”进行读取。

我相信权限是正确的,并且我在许可模式下拥有 selinux。

[root@NAGSRV objects]# /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

Nagios Core 4.4.6
Copyright (c) 2009-present Nagios Core Development Team and Community Contributors
Copyright (c) 1999-2009 Ethan Galstad
Last Modified: 2020-04-28
License: GPL

Website: https://www.nagios.org
Reading configuration data...
   Read main config file okay...
Error: Could not open config directory '/usr/local/nagios/etc/objects/corp/contacts.cfg' for reading.
Error: Invalid max_check_attempts value for host 'localhost'
Error: Could not register host (config file '/usr/local/nagios/etc/objects/localhost.cfg', starting on line 21)
   Error processing object config files!


***> One or more problems was encountered while processing the config files...

     Check your configuration file(s) to ensure that they contain valid
     directives and data definitions.  If you are upgrading from a previous
     version of Nagios, you should be aware that some variables/definitions
     may have been removed or modified in this version.  Make sure to read
     the HTML documentation regarding the config files, as well as the
     'Whats New' section to find out what has changed.

权限:

[root@NAGSRV objects]# ls -ld *
-rwxr-xr-x. 1 nagios nagcmd  6747 Dec  7 21:06 commands.cfg
-rwxr-xr-x. 1 nagios nagcmd  1794 Dec  7 21:35 contacts.cfg
-rwxr-xr-x. 1 nagios nagcmd  4777 Dec  7 21:06 localhost.cfg
-rwxr-xr-x. 1 nagios nagcmd  3001 Dec  7 21:06 printer.cfg
drwxr-xr-x. 2 nagios nagcmd    99 Dec  9 10:43 corp
-rwxr-xr-x. 1 nagios nagcmd  3484 Dec  7 21:06 switch.cfg
-rwxr-xr-x. 1 nagios nagcmd 12533 Dec  7 21:06 templates.cfg
-rwxr-xr-x. 1 nagios nagcmd  3512 Dec  7 21:06 timeperiods.cfg
-rwxr-xr-x. 1 nagios nagcmd  7630 Dec  9 10:17 windows.cfg

[root@NAGSRV objects]# ls -ld ./corp/*
-rwxr-xr-x. 1 nagios nagcmd  1245 Dec  9 10:43 ./corp/contacts.cfg
-rwxr-xr-x. 1 nagios nagcmd  1124 Dec  9 10:39 ./corp/hostgroups.cfg
-rwxr-xr-x. 1 nagios nagcmd  3809 Dec  9 10:45 ./corp/hosts.cfg
-rwxr-xr-x. 1 nagios nagcmd 10967 Dec  9 10:41 ./corp/hosts-service-template.cfg

团体:

[root@NAGSRV objects]# cat /etc/group | grep nag
nagios:x:1000:
nagcmd:x:1001:apache,nagios

Selinux:

[root@NAGSRV objects]# getenforce
Permissive

nagios.cfg:

# NAGIOS USER
# This determines the effective user that Nagios should run as.
# You can either supply a username or a UID.

nagios_user=nagios



# NAGIOS GROUP
# This determines the effective group that Nagios should run as.
# You can either supply a group name or a GID.

nagios_group=nagcmd

如果我编辑nagios.cfg并从 cfg_dir= 中删除我的目录,我可以验证。

centos nagios
  • 1 个回答
  • 549 Views
Martin Hope
donmelchior
Asked: 2021-10-23 05:50:21 +0800 CST

如何在基于 Powershell 脚本的 check_nrpe 结果中正确显示重音字符?

  • 0

我有一个由 Nagios 使用“check_nrpe”调用的自定义 Powershell 脚本。目前在 Nagios 上显示检查结果时,所有带有特殊字符(如“è”、“é”或“à”的检查结果输出消息都无法正确显示。

如何让那些正确显示?

检查命令

$USER1$/check_nrpe  -H server.tld -c check_foo -a 7 7 7  

nsclient.ini 上的脚本调用

[/settings/external scripts/scripts]
check_foo = cmd /c echo X:\scripts_\check-foo.ps1 -arg1 "$ARG1$" -arg2 "$ARG2$" -arg3 "$ARG3$"; exit($lastexitcode) | powershell.exe -command -

预期结果

CRITICAL - Vérification échouée

实际结果

# UTF-8 BOM (GUI)
CRITICAL - Vrification choue

# UTF-8 BOM (CLI)
CRITICAL - V,rification ,choue,

# UTF-8 (GUI)
CRITICAL - VǸrification ǸchoueǸ 

目前,我的 Powershell 脚本是从 Linux CentOS 7 监控机器和目标服务器(Windows 2016 Server)上的 NSClient++ 远程调用的“check_nrpe”。脚本 itelf 被编码为“UTF-8 BOM”。

powershell nagios nrpe nsclient++
  • 2 个回答
  • 101 Views
Martin Hope
Gabriel
Asked: 2020-11-18 13:18:54 +0800 CST

Nagios - 当被动检查新鲜度过期时将主机设置为关闭?

  • 1

环境只有被动检查启用。无法进行主动检查。

配置的目的是,当主机未报告信息(未报告被动检查)的时间超过配置的新鲜度时,Nagios 将主机报告为“关闭”。

我创建了一个非常简单的实验室环境,复制了与原始环境相同的防火墙规则和相同的设置。该实验室仅包含 1 个 NagioXI 服务器和 1 个 Linux 客户端。

出于测试目的,我在服务检查和主机配置中配置了新鲜度。在这两种情况下,当超过新鲜度阈值时,会执行相同的检查命令,即 check_dummy ARG1= 2(严重)和 Arg2=“服务器停机”或类似停机。

在服务检查中,警报工作正常。超过新鲜度阈值后,将显示严重状态。但是,在主机配置中,主机始终报告为 Up,并且不显示任何消息。

配置服务

在此处输入图像描述

在主机上配置

在此处输入图像描述

检查命令

在此处输入图像描述

正如我所料,所有服务都处于严重状态,但这不是我想要实现的。我想实现主机关闭状态,但是主机始终处于启动状态。

在此处输入图像描述

主机状态

在此处输入图像描述

如何将主机设置为状态关闭?

nagios
  • 1 个回答
  • 520 Views
Martin Hope
MOBIN TM
Asked: 2020-10-31 22:01:26 +0800 CST

Nagios 服务器未检测客户端 vm 是否已重新启动

  • 0

我已经配置了 nagios 服务器并添加了 30+ 个物理服务器和 25+ 个虚拟机。所有配置已完成,nagios 服务器正在监视服务器、vm 和服务。

但是当我重新启动一个 vm 时,Nagios 服务器没有检测到 vm 不可用,而是在线显示。

有人遇到过这个问题吗?有人可以帮忙吗?

nagios nrpe
  • 1 个回答
  • 358 Views
Martin Hope
Meni
Asked: 2020-10-13 02:21:11 +0800 CST

访问 Nagios 时未发现错误

  • 0

我已按照本指南https://www.digitalocean.com/community/tutorials/how-to-install-nagios-4-and-monitor-your-servers-on-centos-7在我的 centos 中安装 nagios 7.8 系统

安装没有问题,但是我在访问 GUI 时遇到问题

在我使用 htpasswd 指定凭据集后,Nagios 页面打开,但是在 iframe 的右侧我得到:

The requested URL /nagios/< was not found on this server.

错误日志和访问日志中没有错误,我可以看到:

10.0.1.36 - nagiosadmin [12/Oct/2020:13:15:03 +0300] "GET /nagios/ HTTP/1.1" 200 1933 "-" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36 OPR/71.0.3770.228"
10.0.1.36 - nagiosadmin [12/Oct/2020:13:15:03 +0300] "GET /nagios/side.php HTTP/1.1" 200 6193 "http://10.0.0.101/nagios/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36 OPR/71.0.3770.228"
10.0.1.36 - nagiosadmin [12/Oct/2020:13:15:03 +0300] "GET /nagios/%3C?php%20echo%20$url;%20?%3E HTTP/1.1" 404 209 "http://10.0.0.101/nagios/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36 OPR/71.0.3770.228"
10.0.1.36 - nagiosadmin [12/Oct/2020:13:15:03 +0300] "GET /nagios/images/sblogo.png HTTP/1.1" 200 3231 "http://10.0.0.101/nagios/side.php" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36 OPR/71.0.3770.228"
10.0.1.36 - nagiosadmin [12/Oct/2020:13:15:03 +0300] "GET /nagios/stylesheets/common.css?%3C?php%20echo%20$this_version;%20?%3E HTTP/1.1" 200 10166 "http://10.0.0.101/nagios/side.php" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36 OPR/71.0.3770.228"
10.0.1.36 - nagiosadmin [12/Oct/2020:13:15:03 +0300] "GET /nagios/images/favicon.ico HTTP/1.1" 200 822 "http://10.0.0.101/nagios/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36 OPR/71.0.3770.228"

从这些日志中可以看出,文件存在 404 错误

/nagios/%3C?php%20echo%20$url;%20?%3E

浏览器控制台日志中显示相同的文件我已经没有想法了,有什么线索吗?

linux nagios centos7
  • 1 个回答
  • 304 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve