我最近遇到了一个问题,请求我的服务器(使用托管 DNS 提供商)IP 地址的远程服务响应:
DNS problem: SERVFAIL looking up A for mysql.xavamedia.nl
(更新:这里提到的远程服务是 Let's Encrypt;我针对他们的问题跟踪器提交了一个错误,这导致我走上了这条道路。)
在我的本地网络上进行测试时,我发现有时我会从托管的 DNS 服务器获得一个空的 DNS 响应。显然这是间歇性的,因为它仅在 DNS 记录不在缓存中时才会发生,并且仅在 DNS 服务器非常繁忙时才会出现问题。
这是空响应消息的 Wireshark 描述:
当然,由于大多数 DNS 查询和响应都是通过 UDP 发送的,因此本地解析器只会等待一段时间等待响应,然后放弃。我现在想知道的是,是否有关于 DNS 响应时间的指南?我的 DNS 主机有点耸了耸肩,说我的本地解析器过早地发送了空响应。我以前从未遇到过这个问题,但我对失败模式感到惊讶——没有错误代码的空 DNS 响应。
是否有人知道一些关于这应该如何工作的指导方针,以及我何时/如何证明我的 DNS 托管做错了什么?
您正在查看的空响应是一种合成状态,称为
NODATA
.NODATA
并且NXDOMAIN
两者都表示该名称不存在,但NXDOMAIN
也适用于指定记录下的所有名称。NODATA
建议该名称与未请求类型的记录相关联,或者还有其他记录在您请求的内容之下。(即example.test.xavamedia.nl.
)NODATA
在这种情况下,您的结论NXDOMAIN
实际上是相同的:所请求的名称和类型的记录不存在。已为所请求的域访问了权威名称服务器,它回复说该名称和类型的记录不存在。这不是通信错误。权威服务器表示没有数据。您正在与之交谈的服务器很可能已经处理了此请求,并且在过去四个小时内缓存了该记录的缺失。(14400 秒是 SOA 记录为 定义的负缓存间隔xavamedia.nl.
)NXDOMAIN
在这种情况下遇到时,NODATA
它们都不会导致超时,但是您的解析器库可能会从这里继续添加 DNS 搜索后缀,这反过来可能会触发搜索域的权威 DNS 服务器超时。应该注意的是,这些都不能解释为什么您
SERVFAIL
在查找时遇到响应mysql.xavamedia.nl.
。这表明递归服务器从权威服务器获取答案存在问题。要么权威服务器回复SERVFAIL
,递归服务器无法访问任何权威服务器,或者递归服务器确定返回的数据无效。这些都不能用您提供的信息来证明。除了 RFC 1123 http://tools.ietf.org/rfcmarkup?rfc=1123#page-77的“6.1.3.3 有效资源使用”部分中定义的指南外,我不知道任何具体指南
指定了“不少于 5 秒”的超时值。RFC 还规定应缓存临时故障。这是为了防止客户端违反 RFC 的第 2.2 节时出现过多的 DNS 请求。该部分指出,客户端应在重试之间等待“合理”的时间,以防出现软故障。
还有一个关于这个主题的 Stackoverflow 线程,但除了一些真实世界的观察之外,它不包含更多信息。https://stackoverflow.com/questions/3036054/ideal-timeout-period-for-dns-lookup
这就是我能说的关于这个话题的全部内容。如果其他人有更多要添加的内容,我也会感兴趣。