我有一些客户的网络设备由他们的 ISP 管理。这通常采用 ISP 提供的交换机或放置在客户位置的路由器的形式。
对于具有 MPLS 或多位置连接的站点,将此设备连接到现有的监控基础设施(OpenNMS、Observium等)将非常方便,特别是因为环境的所有其他方面都经过例行检查。
不幸的是,大多数提供商限制对设备的访问,并迫使您通过它们进行配置更改。这是可以理解的,但我怎样才能获得更准确的信息呢?我的监控足迹基本上有一个大黑洞。
最近的一个例子是一个客户在两个设施之间的 MPLS 链路上遇到 VoIP 问题(掉线和质量问题)。我没有关于实现的 QoS 级别的任何详细信息(因为我们看不到路由器内部)。除了将带宽从 4Mbps 增加到 7Mbps(追加销售- $$$)之外,ISP 没有任何建议。他们说,“你正在最大限度地利用远程站点的连接”。所以当然,客户同意了这一点,没有任何工程理由。
我能做的最好的事情是监控两个站点上通向 ISP 路由器的交换机端口,我没有看到带宽饱和的迹象……只有延迟大幅增加(测量交换机到交换机)。
- 那么,这是可以与 ISP 协商的吗?
- 您是否曾说服供应商提供更深入的监控数据或允许对其设备进行 SNMP 监控?
- 如果您怀疑问题出在 ISP 上,您有什么办法?
通常对于大型合同,您应该能够协商至少对其边缘路由器的只读访问权限。
然而,即使在我们的一个 ISP 连接(约 40m 电缆)附近建立一个新的数据中心和当时的一份相当大的合同,我也无法得到它。经常有一些你可以得到的数据泄露。
但是,根据您当地的法律,这可能已经是某种未经授权的访问,您应该确保您可以获得许可或承担没有人注意到的风险:)
像往常一样,获得某种倒退是可以协商的,但很可能不值得。
一个小合同的例子:如果他们真的搞砸了并且无法提供我们从他们那里购买的服务,我们最多可以退还 2 个月的费用。我们(当时)在最坏的情况下会损失更多,所以这在金钱方面毫无用处。
我们试图记录一切“外部”。 你自己不能改变的,把它写下来/监控它,这样你就可以立即知道它是否改变了。
我们有关于我们的客户获得了哪些路由、通常需要多长时间、链路之间的带宽有多大以及我们能想到的每一个细节的文档。这是在 ISP 的帮助下完成的,所以没花那么长时间,我想是一周或类似的时间。
对于实际的修复和/或指责:
如果我们发现特定问题,我们会通过监控数据和文档的部分内容通知他们。有一次他们改变了路由,我们的一部分客户比以前多了几毫秒的延迟,这对我们的服务至关重要。
然而,他们并没有一直积极回应。
我们获准“证明”这是他们的问题,向链接发送垃圾邮件,并在达到某个阈值时重现额外的延迟。不久之后它被修复了,即使使用不同的路由。
基本上有两种选择:
要么您与负责的技术人员有很好的联系(阅读 ISP 的 CTO),并且他们能够允许您进行只读访问,或者您必须尝试出错,重现问题(无论多么困难)然后得到有人真正理解它。
甚至不要尝试使用 ISP 的正常客户支持,即使他们的“更高级别的支持”在大多数情况下也不允许承认他们的错误。
如果合同中有足够的现金,所有这些都不会奏效。
一些 ISP可能会提供一个窥镜服务器,它为公众访问提供有限的信息。这些信息通常包括
traceroute
/ping
从 ISP 路由器到特定位置,以及基本的 BGP 信息。可以查看诸如lookinglass.org或bgp4.net wiki之类的站点,以查看是否列出了相关的ISP。但是请注意,这些信息非常有限,可能无法完全满足原始问题。
一般来说,@dennis-nolte 的回答确实适用:一切都归结为金钱和合同的初始期限。当 ISP 在讨论初始合同时发现大客户时,很容易要求 ISP 提供只读访问权限,但他们不愿意事后做任何事情。