排除cisco12000系列互联网路由器的矩阵ping超时问题和故障.pdf
文本预览下载声明
目录
简介
开始使用前
规则
先决条件
使用的组件
背景
症状
排除故障
有用的 debug 及 show 命令
报告TAC案例应收集的信息
相关信息
简介
本文解释如何排除故障矩阵ping超时和失败Cisco 12000SERIES互联网路由器的。这样失败是由以
下错误消息表示的:
并且
开始使用前
规则
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
先决条件
本文档没有任何特定的前提条件。
使用的组件
本文档中的信息基于下面的硬件版本。
Cisco 12000 系列互联网路由器
本文档中的信息都是基于特定实验室环境中的设备创建的。本文档中使用的所有设备最初均采用原
始(默认)配置。如果您是在真实网络上操作,请确保您在使用任何命令前已经了解其潜在影响。
背景
GRP和线卡(LCs)在Cisco 12000SERIES互联网路由器通过Crossbar交换矩阵连接,为多数线卡间
通信提供一个高速的物理路径。在消息中通过在GRP和线卡之间在交换矩阵是路由和接收的包括的
实际数据包,转发信息、流量统计和多数管理和控制信息。因此,对GRP来说,确保这个路径在正
常运转是很重要的。
矩阵PING是运行在GRP和交换矩阵之间四应用程序的之一。处理器间通信(IPC),网络信息包和代
码下载是其他。矩阵 ping利用MBUS ping线卡的减缓矩阵接口从而提供部分错误检测算法和keep-
alive机制。
在GRP的Cisco Cell Segmentation and Reassembly (CSAR)矩阵接口驱动程序处理在交换矩阵和
GRP之间将被发送和接受的消息。这包括矩阵PING。矩阵PING是由软件生成的,每六秒从主GRP被发
送到每个线路卡。在线卡收到从GRP时候的ping请求, LC发送回到对GRP的一回复。如果GRP不收
到给五个连续矩阵PING (30秒总时间)的任何回复,通过维护总线(MBUS)宣称线卡失败和重置它。
多数时间,线路卡只是太繁忙以至于不能回答从GRP的矩阵PING请求。.
矩阵ping超时,当千兆路由处理器(GRP)发现ping请求在T ofab队列被滞留(入交换矩阵) Cisc o
Cell Segmentation and Reassembly(CSAR) applic ation-spec ific integrated c irc uit
(ASIC)。
当线卡或第二GRP不能回答从主要的GRP的一个矩阵PING请求在交换矩阵,矩阵ping失败发生。
这样失败是应该调查的问题症状。
症状
按照Background部分说明 , GRP发送矩阵PING对线卡每六秒,并且线卡必须响应。当GRP不能收
到对五个连续矩阵PING时的一回复,通过发送一个Request信息重置线卡在维护总线(MBUS),并
且如在输出show context slot {-}命令中看到报告软件所制崩溃。
从控制台日志或show log命令 ,您可以在矩阵PING失效消息前收到以下错误消息:
%GRP-3-FABRIC_UNI: Unicast send timed out (3) %GRP-3-FABRIC_UNI: Unicast send timed out (3)
%GRP-3-FABRIC_UNI: Unicast send timed out (3)
那里第(3)表示主GRP设法发送矩阵PING的线卡插槽。
此消息表明信息包在CSAR ASIC的Tofab队列被滞留在主GRP。如果在2个CSAR缓冲区的任何一个中延
迟超过100毫秒,缓冲区被冲满,并且超时消息生成。
如果GRP传送其矩阵PING请求信息,但是线卡不应答或者线卡答案,或者交换矩阵有故障造成信息丢
失,您在矩阵PING失效消息之前将看不到此消息。所以,如果收到错误消息%GRP-3-
FABRIC_UNI,这意味着某事不可能传送到在结构的一slot为100或200 msecs。也许是,由于
%GRP-3-FABRIC_UNI,您不能发送保活到LC,并且您最终获得矩阵ping失败以后,在这种情况下
, 30秒。然而,您能获得矩阵ping失败,不用%GRP-3-FABRIC_UNI反之亦然。
主GRP可以检测线卡或备GRP存在的问题并实时执行core dump。.GRP会通过MBUS发出信息给线卡并
要求线卡CPU crash,从而生成core dump。
%GRP-3-FABRIC_UNI: Unicast send timed out (3) %GRP-3-FABRIC_UNI: Unicast send
显示全部