嗨伙计,
我在一家公司工作,在生产中运行我们的软件即服务产品的少量 Windows 服务器。通过进行一系列更改(例如创建新数据库、移动数据库文件、设置登录名和启用/禁用 Windows 服务)的部分方式。我不是唯一进行更改的人,如果出现问题,调查它的人很可能不会知道最近应用了哪些更改。在大多数情况下,我认为这不是问题,因为我们对更改任何内容都非常谨慎,更改通常发生在定义的时间(当我们升级自己的软件等时)并且问题通常很容易追踪。
但是,我确实想到记录人们所做的更改、何时以及为什么可能有用,如果不是为了追踪问题,那么如果我们需要一些时间来重建这些机器。其他人如何处理这个问题?
您需要像CMDB这样的官僚机构!,也许..但这不是灵丹妙药。您可以开始使用的最便宜的工具是 MS word 或 wiki。
生产中的服务器需要处于变更控制之下,变更不应该随意发生。
您必须为您的业务选择合适的官僚机构。
为什么会有多人在这么小的环境中对 prod 进行更改?可能是时候引入明确的角色分离并让一名生产人员拥有管理员访问权限并推出所有更改。
对于重建机器,如果您创建许多略有不同的服务器,您可以做一些简单的事情,例如“构建指南”,然后有一个通用指南并填写特定服务器的空白。
您还应该记录您的灾难恢复计划,以便企业知道如果服务器/数据丢失该怎么办。
建立一个彻底的部署过程,包括使用某种类型的 CMBD(无论 C 表示更改还是配置),是很好的第一步。尼克肯定在他的回答中很好地涵盖了这一点。流程和程序有助于进行合法的、有意的更改。
我还建议查看配置监控工具,例如Tripwire。这些类型的系统使用您的 C(onfiguration)MDB,并且会在设备偏离时发出警报。它不仅会帮助系统管理员,因为它会检测到有人在配置新 VM 时无意中关闭 HA 的情况;但当流氓域管理员将他的好友添加到财务组时,也会让您的安全人员感到高兴。