TB002301以太网单板故障分析处理ISSUE1.0.ppt
文本预览下载声明
TB002301以太网单板故障分析与处理 课程目标 以太网故障定位的思路 以太网故障定位的常见方法 以太网常见故障的处理 课程内容 以太网故障定位基本知识 以太网故障定位的思路与常见方法 以太网常见故障的处理 基本知识 CSMA/CD 端口工作模式 帧格式 以太网各种错帧 以太网流控 VLAN 基本知识 CRC校验错 以太网帧的最末部分为4个字节的帧校验序列字段,接收端通过CRC(循环冗余校验)来校验帧在传送过程中是否发生差错(误码)。对于CRC校验出错的帧,一律丢弃。 超短帧 小于64字节的帧,认为是信号碰撞产生的残片,一律丢弃。 超长帧 超过端口允许的最长长度的帧,一律丢弃,MSTP系列产品端口默认最长帧为1522字节(可设置)。 若全双工VS半双工,大量碰撞的会导致端口接收到不完整的帧,如果残片小于64字节,则认为是超短帧,直接丢弃;如果残片不小于64字节,则进行CRC校验,但由于帧校验序列字段错误,则认为是CRC错帧,也会丢弃。 Alignment 字节对齐错,比较少见,一般为硬件故障引起,碰撞也可能引起该类错包。 基本知识 目前各种设备主要实现的是全双工以太网的显式流量控制:在发生拥塞的时候,端口发送特定的流控帧(PAUSE帧)到对端,对端接收到流控帧后便停止数据发送一段时间,从而减缓端口的拥塞压力。 PAUSE帧是一种标准的以太网帧,其类型域的值为0x8808,净荷的主要内容为slot time(表明需要对端暂停数据发送的时间,若slot time为0,则表示对端可以立即恢复数据发送)。 对于MSTP产品系列以太网单板而言,都支持在自身拥塞的情况下向对端发送流控帧,但slot time一般为固定值(产品不同、版本不同,则取值不同)。对于接收到的流控帧,不同的单板处理方式不完全相同: ET1V1/ET1V2:响应但不透传 EGT:既响应也透传 基本知识 对于ET1V1版本而言,VLAN的作用在于业务汇聚功能时用作路由标志,即通过配置VLAN路由实现以太网业务的汇聚功能,此时,有如下要求: 中心网元ET1的以太网端口设置为TAG属性; 中心网元ET1对接的宽带数通设备必须具备3层功能,即可以进行VLAN的划分(一般根据目的IP地址划分不同的VLAN)。 其他网元不做要求,根据实际情况灵活配置。 其他场合,一律建议配置端口路由。 对于ET1V2版本而言,VLAN的作用在于隔离,即通过VLAN过滤表实现端口的隔离,再在VLAN过滤表内通过二层交换实现帧的转发。 基本要求 基于不同平台的单板的共性与特征 封装协议、封装颗粒、接口类型、功能实现、版本特征、配置方法…… 单板的性能指标 吞吐量、时延、背靠背和交换容量 单板可支撑故障定位的功能 环回、测试帧、流量统计、黑匣子、SDH类告警与性能、以太网类告警与性能(RMON) 同SDH相比,以太网特性单板规格更多、配置和应用更复杂,需要多花精力来学习和记忆!当然,理解是记忆的基础。 基本知识 ET1系列单板的处理方式:发端首先将以太网帧拆成N个64字节长度的分片,然后采用ML-PPP协议对各个分片进行封装并依次轮循映射到绑定的VC12中,其中每个分片对应一个VC12。接收端首先从VC12中恢复出完整的分片,然后再将N个分片合成一个完整的以太网帧。 EGT/EMS/EFS系列单板的处理方式:发端不对以太网帧进行拆片,而是采用LAPS/GFP协议将整个以太网帧进行封装,然后以字节流依次轮循映射到绑定的VC中。接收端首先从VC中取出数据,然后去掉封装恢复成一个完整的以太网帧。 基本知识 吞吐量(Throughput):网络不丢帧情况下的最大速率,是最直接反映“带宽”的一个性能指标; 时延(Latency):设备的处理过程引入的延时; 丢帧率(Frame Loss Rate):在网络稳定状态下由于网络资源缺乏造成的不能转发的数据帧和总数据帧的百分比,理论上,吞吐量+丢帧率=100%; 背靠背( Back-to-Back ):网络允许的无帧丢失通过的、以最小的合法帧间隙出现的连续数据帧的最大长度,反映系统对数据突发的容忍能力。 由于吞吐量和丢帧率具有互补的关系,一般情况下只需要关注吞吐量和时延这两项性能指标。当然,在故障定位时,要综合考虑以上几种性能指标对业务带来的影响。 另外,长期稳定性测试能反映出系统在一定负荷下长期工作的可靠性,对于反映业务有少量丢包的故障,最终可通过背靠背测试来判断是否为MSTP产品故障引起 基本知识 各种错包 FCSErrors :CRC错和超短帧,首先排除端口模式不匹配的问题,其次是网线质量(干扰)的可能性,最后定位是否为网口硬件故障。 AlignmentErrors:对齐错误,
显示全部