2 周前,我将我的网站从 AWS 移至另一台主机。
更新了 DNS 等。
我仍然在旧网站上看到点击量。(不多,一天200左右)
是否可以合理地假设在这段时间之后,这些点击来自通过弹性负载平衡 URL 进入的网络爬虫,而不是 DNS 尚未更新的用户?
我注意到在谷歌中输入负载平衡 URL 会返回一些结果。不完全确定为什么它在谷歌,但它似乎在那里。
2 周前,我将我的网站从 AWS 移至另一台主机。
更新了 DNS 等。
我仍然在旧网站上看到点击量。(不多,一天200左右)
是否可以合理地假设在这段时间之后,这些点击来自通过弹性负载平衡 URL 进入的网络爬虫,而不是 DNS 尚未更新的用户?
我注意到在谷歌中输入负载平衡 URL 会返回一些结果。不完全确定为什么它在谷歌,但它似乎在那里。
我从来没有遇到过缓存记录超过两三天的公共名称服务器,所以我会说你的假设听起来很安全。如果您想要额外的确定性,您可以使用全球 DNS 检查工具,例如https://dnschecker.org来查看各种名称服务器的响应。
如果您可以在 google 搜索中找到 ELB URL,则很可能网络爬虫正在访问该路径并产生流量。如果您的 Web 服务器设置为跟踪通过 ELB 转发的请求 URI,您可能能够看到请求来自哪个 URL。
如果您有一个受欢迎的网站,那么您可能会在数周或数月内看到此流量。我在一家拥有前 100 名全球网站的公司工作,当我们更改 IP 地址或更改缓存断路器时,我们会在很长一段时间内不断看到流量进入。
那里有各种表现不佳的工具。大学生写得不好的爬虫,专业搜索引擎写得不好的爬虫,僵尸网络写得不好。
也有表现不佳的递归 DNS 解析器,尽管这些解析器变得越来越少,而且缓存超过 14 天将非常非常不寻常。
您看到的这 200 首热门歌曲甚至不是真人,这似乎是合理的——尤其是当他们只是发送
HEAD
动词时。这些用户也可能出于某种原因直接访问您的旧 ELB URL - 您提到 ELB 出于某种原因被 Google 索引。您始终可以使用 Google 高级搜索来查看它是否引用了链接到该 URL 的第三方网站。