在对一天早上无法启动的服务器感到害怕之后,高层决定业务需要高可用性/故障转移设置。
我们有 5 台主要服务器(4 个 Linux,1 个 OpenBSD),所有这些服务器都需要运行才能让公司运营。其中三台服务器相当标准(文件/Web/数据库),第四台处理大多数网络路由和网络代理,而第五台支持我们的电话系统并具有非标准硬件。
我的老板说服务器故障的周转时间应该在 30 分钟以内。
我在这个领域的经验是不存在的(我只是一个被“提拔”的程序员),所以我想我的问题真的可以归结为:
- 这是否应该由具有平均服务器管理技能的人尝试。如果是这样,我应该读什么,我应该和谁谈谈?
谢谢。