我有 3 台服务器,每台服务器都运行一个名称服务器和一个网络服务器。今天,有 2 台服务器出现故障。我认为最后一个服务器将处理从那时起所有未来的请求,但这似乎只发生在一小部分时间。其他时候,请求会超时。
在我的每台服务器上,我都有以下区域条目:
ns1 IN A <SERVER IP 1>
ns2 IN A <SERVER IP 2>
ns3 IN A <SERVER IP 3>
example.com. IN A <SERVER IP 1>
example.com. IN A <SERVER IP 2>
example.com. IN A <SERVER IP 3>
www IN CNAME example.com.
我应该只在每台服务器上为 example.com 保留一个 A 记录吗?我想设置我的服务器,以便在其他服务器出现故障时任何服务器都可以透明地处理所有请求。
可能发生的情况是,当 3 人中有 2 人宕机时,第三人对此毫不知情,继续为宕机的服务器提供 A 记录。DNS 服务器不会在它返回的结果中优先选择它自己的 IP - 根据软件的不同,它可能会从 A 记录中按顺序或随机选择。因此,在 3 次中有 2 次,它将向发生故障的 2 台服务器返回 A 记录。
要在 DNS 中完全解决这个问题,您需要某种 DNS 负载平衡器(在系统上或作为第 3 方设备/服务)。
在每个 DNS 服务器上保留一个 A 记录将允许每个服务器独立运行,尽管您最终可能会按顺序在第一台服务器(相对于其他 2 台服务器)上承受巨大的负载(即:ns1 映射到 server1 并有一个 server1 A记录在它的区域,它很可能是客户端首先查询的那个,所以如果它启动了,它将获得几乎所有的流量)。
所以,它会工作,但它可能不会像你希望的那样工作。
您设置的是DNS 循环;虽然这将提供负载平衡,但它不会提供透明的动态故障转移。这是因为当客户端查询 A 记录“example.com”时,虽然它们会收到所有 3 个服务器 IP,但它们通常会缓存一个以用于将来与该域名的连接。即使您将区域的 TTL 设置为低,在公共 Internet 上,您也无法控制您和客户端之间有多少缓存解析器,更不用说客户端计算机上可能发生的 DNS 条目的应用程序级别缓存(Internet例如,资源管理器维护自己的 DNS 缓存)。
您要设计的是高可用性。这将需要硬件设备或某种形式的软件集群。硬件选项包括 Citrix Netscaler、F5 ig IP 或 Foundry NetIrons。除非您为托管许多应用程序的大型企业工作,否则购买自己的设备很可能不切实际。可能值得与您的托管服务提供商核实,因为许多服务提供商会提供对共享 HA 设备的访问,但需额外付费。
基于软件的选项包括Windows 上的Microsoft 网络负载平衡或Linux 上的ucarp;如果不知道您的确切要求以及您当前的基础架构是什么样的,就很难更具体。还有其他几个关于 SF 的问题可能会更有帮助——特别是查看高可用性和集群标签。
你的意思是初选还是解析器?
如果是初选,会有很多人主持。对于您自己的基础架构中的解析器,故障转移是有问题的,因为大多数解析器库只会按优先顺序尝试所有解析器。失败的第一个解析器意味着将尝试第二个和第三个解析器,但只有在可怕的长时间延迟之后才会在很大程度上破坏性能(对于需要在其关键执行路径中进行名称解析的邮件服务器之类的事情)。
因此冗余不是唯一的问题,而是具有持续可用的高性能 - 如果某些解析器出现故障,则不能允许性能下降。我们现在使用 LVS 对我们的内部解析器进行负载均衡,因为它已被证明是为大容量名称解析获得足够性能和冗余的唯一方法。
相关:是否有托管故障转移页面的免费服务?