当服务器需要在我的工作场所安排停机时间时,我们大致遵循如下流程:
- 建议在特定盒子上进行工作的时间
- 特定盒子的利益相关者查找列表
- 通过电子邮件寻求利益相关者(服务所有者/管理层等)的批准
- 如有必要,对建议的时间进行更改,重复步骤 2 直到..
- 现在每个人都对时间感到满意,通过电子邮件发送时间通知,询问
- 关心盒子何时关闭的员工手动将其添加到他们的日历中
- 一些利益相关者
- 工作人员
- 做实际工作
有没有我们可以用来自动化这个过程的 OSS 项目?到目前为止,我的谷歌搜索一直没有结果。我们需要自己建造一些东西吗?其他人会对这样的事情感兴趣吗?
我没有适合您的软件答案,但这种情况是我们进入我工作的定期维护窗口的原因之一。我们有一个每个人都知道的每月窗口,不需要许可。在每个窗口之前,我们会弄清楚在此期间我们将做什么,然后向每个人发送通知,以准确说明哪些盒子/服务将不可用。这个解决方案也不是完美的,但它肯定比每次都谈判要好。
像icky2000一样,我已经安排了一个维护窗口。我的时间是每周日凌晨 3 点到 4 点之间。那个时间是我的,任何在那个时间使用我的网络的人都不会因为如果他们愚蠢到甚至在早上的那个时间工作而可能导致的任何不便而道歉。
尽可能使用该维护期,大多数用于自动化任务,例如安装补丁、重新启动等。我不能(或不会)适应该窗口的大型工作通常在周日早上(上午 9 点之前)完成,因为那是系统最不可能被使用的时候。值得注意的是,我在一家小公司工作,那里的事情比大公司更灵活一些。
多年来,对我来说,维护窗口的真正关键是尽可能避免需要。小工作只要我能应付,就在工作时间、上班前的清晨或深夜完成。大型作业(例如设置新服务器)通常通过将所有内容设置为离线然后在我的正常工作时间内插入新机器来管理,而对用户的影响很小或没有影响。显然,每个维护任务都必须单独考虑。
我不知道它是否存在于开源中,但您搜索的是与 CMDB 相关联的 HP 的 Service Manager 或 IBM 的 Remedy 等软件。
服务管理器软件负责批准过程,而 CMDB 维护有关谁是哪个系统上哪个服务的利益相关者的信息。
这不是一件容易的事,所以如果你的公司很小或者你没有时间,像前两篇文章所说的最好的解决方案是有一个固定的维护窗口。
问候