<group name="local,syslog,">
<rule id="100001" level="13">
<regex>^.*Your string.*$</regex>
<description>I've just picked up a fault in the AE35 unit. It's going to go 100% failure in 72 hours</description>
</rule>
</group>
EMAILMSG="/tmp/logreport.$$"
echo "Something to put in the email" >> $EMAILMSG
cat $EMAILMSG | mail -s "Whatever Subject You Like" [email protected]
rm -f $EMAILMGS
你可以使用类似LogWatch的东西。甚至是这样的简单脚本(它是伪代码,您需要根据您的环境对其进行修改):
把它放在 cron 中每隔一小时左右运行一次,你应该会收到一封电子邮件,让你知道它什么时候变得奇怪。
您可以使用OSSEC HIDS 设置日志文件的规则,同时从您的主机获取安全信息。
设置它非常简单:
/var/ossec/rules/local_rules.xml
如下指定/var/ossec/bin/ossec-control start
local_rules.xml
规则可以非常灵活和复杂。请参阅此表以了解规则中涉及的参数。
如果您不想要或不需要其他安全功能,您可以通过删除标签
include
下的行来停用它们。rules
我会建议Nagios它是我们在我工作的地方运行的,用于通过网络监控多台机器。它非常好,我没有专门将它用于您的工作,但您当然可以将其设置为在发生错误时通过电子邮件发送给您。
这里有一个在 Ubuntu 上安装它的指南http://beginlinux.com/blog/2008/11/install-nagios-3-on-ubuntu-810/和一个在http://www.debianhelp 上安装的指南。 co.uk/nagiosinstall.htm。
你可以用这样的东西发送它:
在服务器上下载并安装Splunk 。它类似于 logwatch,但为您提供了一个日志搜索引擎。
您可以将其配置为索引您的日志,然后您可以搜索日志并查找模式、查找错误,然后查看其他日志在该特定故障点正在做什么。
它还可以设置为在某些阈值下发送警报或执行脚本。因此,如果某个特定错误开始被垃圾邮件发送到您的日志中,您可以编写脚本以自动重新启动有问题的服务。
我们在我们的服务器集群中使用 splunk,它一直是救命稻草!
我正在使用带有 IPMI 工具的Zabbix来按需重启有故障的服务器。另外,我认为OSSEC也是一个不错的选择,但是您确实需要在将其投入生产之前进行试验和调试...
在以前的雇主中,我们使用logsurfer+实时监控日志并发送电子邮件警报。调整误报确实需要大量时间和配置,但我们有一个规则集,可以很好地处理各种发现和警报,比用于类似目的的 Nagios 更有价值。
不幸的是,我无法再访问配置文件来提供我们过滤的示例,但该站点应该提供更多信息和示例。
你也可以看看我的Octopussy项目。