我已经在几台服务器上使用了 munin,这是第一次花费我这么多时间来设置它。
当我直接 telnet munin 时,我可以列出服务,日志没有错误,并且 munin 每 5 分钟更新一次。但是没有创建 html 文件。我正在使用默认位置(/var/cache/munin/www),我可以确认该目录的权限设置为 munin.munin
(IP和域名已更改)
munin.conf:
dbdir /var/lib/munin
htmldir /var/cache/munin/www
logdir /var/log/munin
rundir /var/run/munin
[example.ne.jp;]
address 100.100.50.200
munin-node.conf:
log_level 4
log_file /var/log/munin/munin-node.log
pid_file /var/run/munin/munin-node.pid
background 1
setsid 1
user root
group root
host_name example.ne.jp
allow ^127\.0\.0\.1$
allow ^100\.100\.50\.200$
allow ^::1$
/etc/hosts:
100.100.50.200 example.ne.jp mail.example.ne.jp
127.0.0.1 localhost
$ 远程登录 example.ne.jp 4949
Trying 100.100.50.200...
Connected to example.ne.jp.
Escape character is '^]'.
# munin node at example.ne.jp
list
apache_accesses apache_processes apache_volume cpu cpuspeed df df_inode entropy fail2ban forks fw_packets if_err_eth0 if_err_eth1 if_eth0 if_eth1 interrupts ipmi_fans ipmi_power ipmi_temp irqstats load memory munin_stats mysql_bin_relay_log mysql_commands mysql_connections mysql_files_tables mysql_innodb_bpool mysql_innodb_bpool_act mysql_innodb_insert_buf mysql_innodb_io mysql_innodb_io_pend mysql_innodb_log mysql_innodb_rows mysql_innodb_semaphores mysql_innodb_tnx mysql_myisam_indexes mysql_network_traffic mysql_qcache mysql_qcache_mem mysql_replication mysql_select_types mysql_slow mysql_sorts mysql_table_locks mysql_tmp_tables ntp_2001:e40:100:208::123 ntp_91.189.94.4 ntp_kernel_err ntp_kernel_pll_freq ntp_kernel_pll_off ntp_offset ntp_states open_files open_inodes postfix_mailqueue postfix_mailvolume proc_pri processes swap threads uptime users vmstat
fetch df
_dev_sda3.value 2.1762874086869
_sys_fs_cgroup.value 0
_run.value 0.0503536980635825
_run_lock.value 0
_run_shm.value 0
_run_user.value 0
_dev_sda5.value 0.0176986285727571
_dev_sda8.value 1.08464646179852
_dev_sda7.value 0.0346633563514803
_dev_sda9.value 6.81031810822797
_dev_sda6.value 9.0932802215469
.
/var/log/munin/munin-node.log
Process Backgrounded
2014/08/16-14:13:36 Munin::Node::Server (type Net::Server::Fork) starting! pid(19610)
Binding to TCP port 4949 on host 100.100.50.200 with IPv4
2014/08/16-14:23:11 CONNECT TCP Peer: "[100.100.50.200]:55949" Local: "[100.100.50.200]:4949"
2014/08/16-14:36:16 CONNECT TCP Peer: "[100.100.50.200]:56209" Local: "[100.100.50.200]:4949"
/var/log/munin/munin-update.log
...
2014/08/16 14:30:01 [INFO]: Starting munin-update
2014/08/16 14:30:01 [INFO]: Munin-update finished (0.00 sec)
2014/08/16 14:35:02 [INFO]: Starting munin-update
2014/08/16 14:35:02 [INFO]: Munin-update finished (0.00 sec)
2014/08/16 14:40:01 [INFO]: Starting munin-update
2014/08/16 14:40:01 [INFO]: Munin-update finished (0.00 sec)
$ ls -la /var/cache/munin/www/
drwxr-xr-x 3 munin munin 19 Aug 16 13:55 .
drwxr-xr-x 3 root root 16 Aug 16 13:54 ..
drwxr-xr-x 2 munin munin 4096 Aug 16 13:55 static
关于它为什么不起作用的任何想法?
编辑
这是 /var/log/munin/ log 几天后的样子:
-rw-r----- 1 www-data 0 Aug 16 13:54 munin-cgi-graph.log
-rw-r----- 1 www-data 0 Aug 16 13:54 munin-cgi-html.log
-rw-rw-r-- 1 munin 0 Aug 16 13:55 munin-html.log
-rw-r----- 1 munin 0 Aug 19 06:18 munin-limits.log
-rw-r----- 1 munin 15K Aug 18 14:10 munin-limits.log.1
-rw-r----- 1 munin 1.8K Aug 18 06:15 munin-limits.log.2.gz
-rw-rw-r-- 1 munin 1.3K Aug 17 06:15 munin-limits.log.3.gz
-rw-r--r-- 1 root 6.5K Aug 16 13:55 munin-node-configure.log
-rw-r--r-- 1 root 0 Aug 17 06:18 munin-node.log
-rw-r--r-- 1 root 420 Aug 16 14:52 munin-node.log.1.gz
-rw-r----- 1 munin 0 Aug 19 06:18 munin-update.log
-rw-r----- 1 munin 11K Aug 18 14:10 munin-update.log.1
-rw-r----- 1 munin 1.6K Aug 18 06:15 munin-update.log.2.gz
-rw-rw-r-- 1 munin 1.5K Aug 17 06:15 munin-update.log.3.gz
更新
尝试直接执行 munin-cron 或 munin-html (su - munin --shell=/bin/bash),
$ perl /usr/share/munin/munin-html
$ /usr/bin/munin-cron --debug
显示此错误:
not a reference at /usr/share/perl5/Munin/Master/Utils.pm line 863.
主机名(或 uname -n):(例如更改域)
example.ne.jp
根据: http: //www.mail-archive.com/[email protected]/msg1248923.html
在全新安装其他发行版时,这个错误似乎也随机出现。
它总是由没有配置节点引起的,或者更确切地说是单个节点配置不正确。
主节点和节点中节点的命名配置不匹配(触发时通常都在同一主机上)
要更新我使用的图表:
可能不是解决方案,但值得尝试......
我解决了这个问题,但我不能 100% 确定它的根源是什么。我尝试了很多方法来恢复错误但没有成功。我怀疑那里挂着一个-old-munin 进程。服务器是生产服务器,所以我没有重新启动它。
这就是为什么我怀疑:当我遇到上述问题时,我像往常一样重新启动了 munin“/etc/init.d/munin restart”或“service munin restart”以及“munin-node”。我什至清除并重新安装了 munin,但问题仍然存在。就在几分钟前,我从其他服务器复制了所有 /etc/munin 目录(使用旧版本的 munin),所以我在重试之前杀死了所有“munin”进程。重试后,munin 工作正常。我认为这是配置文件中的内容,但即使将 munin 目录替换为前一个目录,它也可以正常工作(在重新启动所有 munin 服务并删除任何 munin 进程之后)。
摘要:我可能太早安装了 munin,当时服务器没有正确设置。在 munin 失败后,某些进程可能正在运行,从而阻止了 munin 正常工作。杀死所有“munin”进程可能已经解决了这个问题。
在您的
munin.conf
,use_node_name yes
下设置address 100.100.50.200
(默认为no
:http://munin-monitoring.org/wiki/use_node_name)。另见http://munin-monitoring.org/ticket/1285
当没有安装 apache 时,我在 Ubuntu 18.04 上遇到了类似的问题,但 nginx 是。我显然必须创建一个 nginx 配置,但标准目录 (/var/www/html) 是空的。
我最终意识到 munin 文件是在 中创建的
/var/cache/munin/www
,所以创建了一个符号链接: