私有云上的专用服务器,由四个磁盘组成。
其中一张磁盘包含操作系统 (OS)。如果磁盘出现故障,服务器将无法启动,并且我们无法以简单的方式从其他磁盘提取数据。即使磁盘被挂载为只读,我们仍然需要重新安装操作系统,这需要关闭服务器。
如果您能推荐一些资源或书籍来减少此类错误,我将不胜感激。
此外,我想知道如何管理这些“脆弱”专用服务器的正常运行时间。
私有云上的专用服务器,由四个磁盘组成。
其中一张磁盘包含操作系统 (OS)。如果磁盘出现故障,服务器将无法启动,并且我们无法以简单的方式从其他磁盘提取数据。即使磁盘被挂载为只读,我们仍然需要重新安装操作系统,这需要关闭服务器。
如果您能推荐一些资源或书籍来减少此类错误,我将不胜感激。
此外,我想知道如何管理这些“脆弱”专用服务器的正常运行时间。
您的问题有点模糊,基于错误的设置,并且似乎是假设的。
我们通过不为操作系统使用单个磁盘来预防该问题
如果问题确实发生(或者如果操作系统位于 RAID 上并且 RAID 设备发生故障/磁盘控制器发生故障),那么对于大多数人来说,下一步将是使用远程控制台工具(IPMI、iDRAC、iLO)来映射虚拟 USB/重新配置存储/恢复或重新安装。
通常的解决方案是首先不要出现这种情况:如果服务正常运行时间如此重要,那么它不应该依赖于一台机器保持运行。
如果失败,您可以将机器迁移到备用机器,然后关闭出现故障的机器,或者如果这确实不可能,那么有几种方法可以加快交换速度(例如,在新驱动器上安装操作系统,然后再放置)它在服务器等)
如果您打算使用“传统”通用操作系统,请使用 RAID。“有用的”存储性能并不依赖于这一点:操作系统的关键部分被加载到 RAM 中并从中进行操作,大多数时候根本不访问磁盘。因此,“出于性能原因不使用 RAID”的想法是完全没有根据的,您的假设也是毫无意义的。
有一个基于Linux的专用存储操作系统,ESOS。它旨在安装到 USB 闪存驱动器中并从中启动。它还依赖于操作系统将简单地从内存运行的事实,您甚至可以在启动后移除闪存棒。配置以这种方式进行管理,因此您可以快速准备另一个 USB 记忆棒并推送配置并再次启动到“同一”系统。