我在一家财富 500 强公司工作,该公司难以准确衡量高可用性应用程序的性能和可用性(即,在 5 秒页面到页面导航的情况下提高 99.5% 的应用程序)。我们将计划内和计划外停机时间都考虑在内,以确定此可用性数量。但是,我们最近在组合中添加了一个 CDN,这使我们的指标有点复杂。CDN 现在处理我们大约 75% 的流量,同时将剩余的流量发送到我们自己的服务器。
我们试图衡量我们所谓的“真正的用户体验”(即,我们的测试脚本模拟典型的用户点击应用程序。)这些监控脚本位于我们的网络之外,这意味着我们访问了大约 75% 的 CDN时间。
管理层已决定我们采用最坏的情况来衡量可用性。因此,如果我们的源服务器出现问题,但 CDN 提供的内容还不错,我们仍然会影响可用性。反过来也是如此。我的想法是,只要“用户体验”成功,我们就不应该无谓地惩罚自己。毕竟,CDN 可以提高性能和可用性!
我只是想知道是否有人知道其他财富 500 强公司如何计算他们的可用性数字?例如,我查看 apple.com 的一个店面,该店面使用的 CDN 似乎永远不会关闭(除非即将发布重大产品公告。)拥有一些确凿的事实数据会很棒,因为我不知道不要相信我们需要在这些指标上不必要地伤害自己。我们正在根据这些数字做出业务决策。
然而,我可以说,鉴于这些指标对管理层是可见的,问题得到解决并很快得到解决(阅读:我们很快就消除了繁文缛节。)不幸的是,作为一名开发人员,我不希望管理层认为由于某些外部因素(即 CDN)正在影响数字,因此应用程序处于上升或下降状态。
想法?
(我错误地将这个问题发布在 StackOverflow 上,对于交叉帖子,我深表歉意)