全国服务热线18688709878
服务支持
技术支持 联系我们
  • 公司电话:0755-82828888
  • 400电话: 18688709878
  • 技术支持:18688709878
  • 公司传真:0755-82821116

华为MA5600故障处理常用方法

发表时间:2016年09月19日阅读数:3057次来源:http://www.szhuajiahui.com/cn/article-details-619.html

  

  华为MA5600处理故障时可以采用多种故障定位方法。在实际的故障定位过程中,各种定位方法往往可交叉使用,互为补充。

  为提高效率,实际操作过程中,华为MA5600故障处理遵循由外到内、由大到小的原则,即先查看外部线缆连接是否牢靠、各指示灯状态是否正常,然后通过控制台查看系统的整体运行状态,最后再查看各个模块的运行状态。

    故障定位的各个过程及其常用的方法如表1所示

表1 故障处理流程图

故障定位过程

常用方法

其它方法

排除外部设备故障

· 对比分析

· 互换分析

· 仪表测试

· 协议分析

· 告警分析

· 性能分析

故障定位到具体设备

· 分段处理

· 配置数据分析

· 告警分析

· 性能分析

故障定位到单板

· 分段处理

· 替换分析

· 仪表测试

协议分析

  配置数据分析

  重配置不当、扩容配置不当、过往配置遗留的问题隐患等都是导致MA5600故障的原因之一,因此定位和排除故障时有必要对配置数据进行检查分析。维护工程师必须掌握不同业务功能的配置方法、实现原理,从而掌握不同故障现象需要重点检查哪些配置数据,防止盲目定位,降低故障处理效率。

  告警分析

  通过分析告警信息,能找到部分故障的原因,或配合其他方法共同定位故障原因。

  告警是故障或者事件发生的重要提示信息,告警信息包含故障或异常现象的具体描述、可能的原因、修复建议等,涉及硬件、链路、业务、CPU占用率等各个方面,信息丰富、全面,是进行故障分析和定位的重要依据之一。

  当华为MA5600系统出现故障时,请查看系统是否有告警上报。如果系统有告警上报,则分析出同本故障相关的告警,然后根据告警参数的指导清除这些告警,进而清除故障。

  对比分析

  对比分析是指将故障的部件或现象与正常的部件或现象进行比较分析,找出不同点,从而判断问题的所在。如:业务故障时的线路参数与业务正常时进行对比、同等地位的设备间进行对比。对比分析适用于故障单一的场合。

  互换分析

  在更换备件后仍不能定位故障时,可以使用互换分析法定位和排除故障。

  互换是指将处于正常状态的部件(如单板、线缆等)与可能故障的部件对调,通过比较对调后二者运行状况的变化,确定故障的范围或故障点。此方法适用于:

  · 在更换部件后,仍然不能确定故障范围或故障点的场合。

  · 故障复杂的场合。

  注意:互换操作具有一定的风险。例如:将短路的单板换到正常的机框中有可能造成正常机框损坏。因此,使用互换方法必须谨慎,确保不会导致新故障。

  分段处理

  在故障可能原因复杂,涉及到多个环节时,使用分段处理的方法逐个排除可能产生故障的环节,最终定位故障点。

  进行分段处理的前提是确定可能产生故障的环节,然后运用合适的定位手段(如:各种环回操作、配置数据分析等)进行逐个排查。因此,本操作对维护工程师技能有一定要求:

  · 对华为MA5600/MA5603的系统结构和功能特性原理有深入的了解。

  · 对可能导致业务故障的各个环节全面了解。

  · 熟练掌握环回、配置数据分析等故障诊断操作。

  · 熟练使用测试仪器。

  说明:分段处理往往涉及整个组网的各个环节,建议按照先远程处理后近端处理、由最可能原因到次要原因、由简单到复杂的顺序进行不同环节的排查,以降低故障处理成本,提高故障处理效率。

  协议分析

  协议分析主要用于当MA5600/MA5603与上层设备的对接出现问题时定位和排除故障,是定位故障的重要手段。

  协议分析是指通过信令跟踪、捕获数据包(即通常所说的“抓包”)等手段对故障进行分析的方法。协议分析要求维护工程师对协议有深入的了解,掌握各种协议报文的交互流程,从而能够从捕获的报文中找出故障的真正原因。

  例如:某用户不能点播组播节目,通过抓包分析发现,BRAS丢弃了该用户发出的IGMP报文。

  仪表测试

  仪表测试法是指使用各种仪器、仪表取得实际的各种性能参数,对照正常的参数值来定位和排除故障。仪器、仪表以直观、量化的数据直接反映设备运行状态,在故障处理过程中有着不可替代的作用。

  在故障处理中常用的仪器、仪表包括:

  · 万用表

  · 线路测试仪

  · 光功率计

  · 光衰减器

  性能分析

  性能分析是指通过MA5600/MA5603提供的性能统计手段,对发生故障的业务进行性能指标的分析,从而定位故障原因。

  针对不同的故障类别,需要查看不同的统计信息,这要求维护工程师:

  · 熟悉系统的结构和运行机制。

  · 了解系统能够提供哪些统计信息。

  · 了解如何查看、分析统计信息。

  例如:在以太网端口模式下,使用display port statistics命令查询以太网端口的统计信息,根据以太网端口的统计信息判断设备运行是否正常:

  · 如果发现CRC错误帧增长很快,说明设备之间可能存在链路异常、端口协商不正确或端口物理故障。

  · 如果发现存在大量的丢弃帧,说明对接设备发送的流量超过了端口的接收能力。

 


返回列表>>
X