我可以使用任何 Windows Pro 或 Server Standard 或 CentOS 来执行此监控(我猜)。AWS Deadline 工作似乎存在一些我不希望任何人知道的复杂问题。工作失败了很多。
吸烟枪(我认为)是监控软件有时无法启动的工作,因为它无法访问特定共享。共享是 ZFS,硬件完全能够跟上 IO。这个问题主要发生在密集的集群中,在其他时间出现稀疏的“一次性”事件。“重新启动修复它”但不是在密集的故障集群期间。
我有强烈的动机去密切监视网络共享的可靠性,因为有时这些共享会突然而神秘地在其他时间对 Windows 10 客户端不可用!然后他们要么在片刻或几分钟后再次出现......要么重新启动修复它。
遇到此问题的所有客户端都在运行 Windows 10,但这并不一定意味着这是 Windows 10 问题。
网络拥塞不是太高。
我可以使用事件查看器进行这种监控吗?有没有一种无痛的 python 方法来做这个监视器。我想在一周内尽可能多地收集数据……一天 24 小时……如果有道理的话。
将脚本作为计划任务运行,以定期和频繁的时间间隔读取和写入一个小但不断变化的值到共享上的文本文件,并将这些记录到监视服务器。
如果可能的话,我建议让它每隔几秒运行一次,所以如果你要将它托管在 Windows 机器上,你可能希望使用 cmd 而不是 PowerShell。
要写入的值将是时间/日期,精确到几分之一秒,在下一次迭代中,脚本将查找文件,如果找到,将读取该文件中的值,然后将其附加到监控记录,并将新值写入检查文件。如果未找到该文件,您将在日志中写入相应的错误消息。
您将能够验证对共享的访问(包括读取和写入),直至您希望或系统可以处理的任何粒度,并且您将获得对该共享的成功或失败读取和写入的日志。