我有一个主路由器,上面连接了几个其他交换机。网络出现故障,当我安慰主路由器时,它很慢。重新启动它,但是一旦连接其他交换机的接口出现,路由器又恢复缓慢。一个接一个地弹开开关,一切恢复正常。现在我需要弄清楚哪个开关是问题的根源,以及问题是什么。
我应该查看哪些日志?我可能在寻找什么?
我有一个主路由器,上面连接了几个其他交换机。网络出现故障,当我安慰主路由器时,它很慢。重新启动它,但是一旦连接其他交换机的接口出现,路由器又恢复缓慢。一个接一个地弹开开关,一切恢复正常。现在我需要弄清楚哪个开关是问题的根源,以及问题是什么。
我应该查看哪些日志?我可能在寻找什么?
您正在登录系统日志服务器吗?否则,Cisco 设备上的日志记录缓冲区在默认情况下无法在重启后继续存在。
如果您确实有日志,请查看问题开始前后整个网络的消息价值。有没有接口弹跳?MAC扑动?来自任何设备的奇怪错误?您是否有监控平台可以显示哪个设备最先占用 CPU?路由表大小?收到 BGP 前缀?
根据您提供的信息,这有点像将您的汽车开到机械师那里说:“它不能正常工作,而且您无法打开引擎盖。修理它需要多少钱?”。这是一个非常复杂的主题,根据您的拓扑结构、硬件、配置和业力,可能会有成千上万的答案。
重启设备以解决问题并在重启后找到这些问题的根本原因很多时候是排他性的。
使用外部系统日志、网络流和 SNMP 轮询统计信息(CPU、内存和接口统计信息,包括带宽、错误和每秒数据包),您确实有机会。然而,在导致“停机”的问题的情况下,这些通常无法正常运行。
另一种选择是在重新启动之前收集“show tech-support”或等效命令的输出。
但是,如果没有可供查看的信息来源并且在重新启动后,您实际上只是在猜测原因。
我会怀疑某种 L2 循环,但证明这需要来自接口的统计信息(特别是数据包/秒)。