我正在寻找为 Web 业务构建服务器场,我将需要前端 Web 服务服务器和一个通用的 NAS 文件服务器后端。
一些公司选择购买速度最快、最可靠的硬件,但需要支付额外费用。其他公司选择购买规格较低的廉价 PC 硬件,但数量更多。他们构建了高度冗余的系统,当它们出现故障时它们会被替换掉。我相信谷歌会采用后来的方法。
有没有人给我任何现实生活中的具体经验和建议?
我正在寻找为 Web 业务构建服务器场,我将需要前端 Web 服务服务器和一个通用的 NAS 文件服务器后端。
一些公司选择购买速度最快、最可靠的硬件,但需要支付额外费用。其他公司选择购买规格较低的廉价 PC 硬件,但数量更多。他们构建了高度冗余的系统,当它们出现故障时它们会被替换掉。我相信谷歌会采用后来的方法。
有没有人给我任何现实生活中的具体经验和建议?
这取决于您的应用程序和对故障的容忍度。
如果您正在为金融业务运行 Oracle 数据库,您需要具有热插拔部件和内置冗余(电源、磁盘,甚至 cpu 和内存)的昂贵服务器。
如果它是具有 NAS 存储的 Web 服务器或计算服务器,只要您可以容忍丢失一个盒子而不会产生太大影响,就便宜一点(在服务器上,而不是 NAS 上)。
不要太便宜以至于你不断地更换坏硬件。
对我来说,一般的经验法则是使用 raid 来保护基于磁盘的重要数据,但要为计算和网络农场购买廉价的商品硬件。获得一个好的负载均衡器,它可以检测网络服务器何时没有响应并将其标记为离线。
现实生活经历:
坏:在商用硬件上运行 oracle 是一个便宜的解决方案,我们能够非常快速地组装起来,但是一个坏的 CPU 风扇导致服务器崩溃,迫使我们从磁带恢复 Oracle(啊!)。
好:我们用 70 台商用机架式服务器替换了 2 台高度冗余的高端机器。我们能够放弃对 2 台机器的维护,并开始购买 2500 美元的“备件”。在大约 2 年的时间里,我认为我们只使用了大约 6 个“备件”(真正的挑战是避免将备件用于其他目的)。
我个人建议我的客户需要高度可靠的计算机是具有当前顶级支持的名牌计算机。
在星际迷航中的外星人种族之后,我将其称为“打包级支持”,因为您应该能够在白天或晚上拨打支持热线并说我是 $COMPANY 的 $NAME。我的支持合同编号是 $X。我的电脑是 $TYPE,序列号 $NUMBER。它坏了,让它去吧,期待有人会在 2-4 小时后出现来做这件事。
现在期望为这种支持付出很多钱。但如果你必须起来,那是值得的。
在大多数情况下,我更喜欢带有保修和支持的预组装计算机,因为通常不值得客户花钱来指定、订购和组装廉价计算机。
对于您可以忍受几个小时/几天的计算机,更便宜的硬件可能是可以的。例如,如果我有五台 Web 服务器,我希望其中两台具有高可用性,并容忍其余的更便宜。对于计算农场,我会选择更便宜的硬件。
构建热插拔服务器非常困难。
去买贵的。
Jeff 有一篇关于这个主题的精彩博文,其中他还查看了能源和许可费用。
根据我的经验,便宜的硬件也确实要花很多钱。我相信您不需要专业服务器的高端模型来为一些网站提供服务。但你不想错过
此外,考虑使用一个好的负载平衡器、HTTP 缓存(例如
Squid
)、PHP 缓存(例如ACP
)memcachd
,如果它适合您的 Web 应用程序的话。这可能会使相当繁忙的站点上的某些后端服务器过时。气流,气流,气流。
寻找当地供应商,制造价格合理的机器,研究组件,这样您就不会购买柠檬零件,并确保它在整个自身中移动大量空气。当齿轮保持凉爽时,它会持续更长时间。冗余很好,但根据您的组织规模,它可能有点矫枉过正。如果您确实想要冗余,那么也许您应该考虑购买更少容错能力更强的机器(hdd、cpu、mem、psu、风扇等)并运行虚拟服务器。这样,您将获得服务器的容错能力以及运行虚拟机的额外优势。但是,最好将数据库服务器保持在单独的硬件上,或者至少让它们写入专用的 RAID 阵列。
一些最昂贵的硬件有一些最便宜的 4 小时响应合同。
我所知道的最昂贵的硬件是最便宜的,但制造商在它坏了时无法/不愿意修复它。他们还拥有最昂贵的服务合同续签(结果证明是无用的)。
在争取实现系统的 3 到 5 年生命周期而不会发生重大停机的竞赛中,您不希望您的条目被标记为“未完成”。
我认为这完全取决于您的情况……这取决于您是要责备某人还是要在内部进行维护。
如果您更愿意责怪供应商,请与支持合同签订高端合同。如果你想省钱并培养一批 IT 支持人员,随着时间的推移,他们会变得更有价值,那么就使用成本更低但硬件更多的内部硬件来实现冗余。
您可能应该坐下来分析灾难计划和单点故障,并将其与您可以承受的损失金额进行比较。我不知道您期望服务器上的负载是多少,但我可以说,如果您的企业绝对需要 IT 服务才能正常工作,您需要计划好每一个假设,如果可以的话……驱动器坏了,异地备份,服务器机房着火(或停电......你有多少种方法可以在那里获得电力?),控制器故障,主板故障等,在它削弱业务之前你能坚持多久,然后多少不降低(或满足您的支持需求)是否值得与您在建立另一个系统所需的时间中损失多少?
如果你有一个优秀的员工,你可以考虑投资相同的服务器和 VMWare,使用带有 RAID 的 iSCSI 或 SAN 解决方案以及用于后端存储的良好备份服务器。
分析您的需求,尽可能检查每一个故障场景,看看冗余成本是多少,并制定一个计划来处理这些紧急情况,然后看看您是否愿意信任供应商,为这些问题提供有保证的服务,或者您是否愿意您的内部人员要为此做好准备。
老实说,我首先从业务角度对此进行现实检查很重要。这是一个依赖于业务需求的技术问题。
所以问自己一个问题。进入这个,对您来说更重要的是系统可用性还是降低成本?如果要求该系统在不停机的情况下运行,那么查看高级硬件肯定符合您的利益。但是,如果您担心预算有限,那么使用低端系统的第二种选择也很有意义。我使用工作站作为服务器来降低成本,只是养成了构建它们的习惯,因此如果在工作站上运行的服务器发生故障,它可以快速过渡到另一台冗余服务器。虽然这不会赢得速度恶魔奖。它将弥合第一天与您拥有适当的现金流以投资于适当的行业标准解决方案的时间之间的差距。
另一件要考虑的事情是,维修更有可能在人力和材料方面出现故障的硬件需要花费多少?有时,如果您知道支持低端硬件会使您落后于 8 号球,那么冒险尝试是有意义的。
只是我的 0.02 美元……希望这能给你一些值得咀嚼的东西。
选址绝对是影响能源消耗和计算成本的最重要因素之一。有些地方的气候比美国大陆凉爽,可用的绿色电力也更多。我建议任何考虑建立数据中心的人查看芬兰网站上的这些问题:http ://www.fincloud.freehostingcloud.com/