第四章计算机联锁控制系统的可靠性保障技术.pdf
文本预览下载声明
第四章 计算机联锁控制系统的可靠性保障技术
以上所学的内容主要是从功能安全的角度出发,讨论了无任何故障情况
下,实现功能安全的软硬件实现原理,任何设备、装置的故障是不可避免的,
本章对系统设备的可靠性进行研究,尽可能防止可预知的故障发生,将不可
预知的故障减小到最低程度,使故障造成的损失降低到最小,最大限度的提
高路信号系统的可靠性。
第一节 可靠性概述
要研究计算机联锁控制系统的可靠性,首先要明确系统的故障以及故障
产生的原因和故障的类型,它们是研究计算机联锁控制系统可靠性的基础和
系统可靠性设计的基本依据。
一、故障分析
1.故障:指系统硬件的物理缺陷、设计制造的不完善或软件设计中隐含
的错误。
2.差错:指系统中由于故障而造成的信息或状态的不正确,是故障的结
果。
3.失效:由于硬件的物理性能发生的改变,不能完成预定的功能,称做
“失效。这种失效是物理器件的失效。另外,系统未能正确提供标准的服务
或丧失了完成规定功能的能力,也是失效,这种失效称为“系统失效”,是
出现差错的结果。
4.失败:故障、差错和失效的出现都有可能造成系统不能够正常工作,
此时称为系统操作失败。
可见,故障、差错、失效与系统失败构成了一个因果链,即因物理器件
的失效导致的故障引起了差错,而差错又引起系统失效,最终形成了操作失
败。
二、故障产生的原因
系统产生故障的原因有物理原因和人为原因两个方面。
物理原因,包括系统内部元器件的缺陷和系统外部环境条件变化两个因
素。系统的元器件缺陷包括生产期间的氧化穿孔、安装时出现的开路以及元
器件通电运行时的老化等缺陷;外部环境因素包括电磁干扰、机械振动和冲
击等。
人为原因,包括无意识的操作错误和操作失误以及有目的的对系统的破
坏。
三、计算机系统故障的分类
研究故障的分类是为了更好地把握故障的主要特征,根据不同的准则,
有多种故障分类方法。主要的分类有:
1.按故障的性质分类
故障可分为逻辑性故障与物理性故障。逻辑故障指系统中某一点的逻辑
值与正常值相反的故障。故障的逻辑值可能是固定的,也可能是变化的。物
理性故障是指由直接物理性原因引起的故障。由系统自身的缺陷和不良所导
致的物理故障称为内在故障,而由外来因素诱发的物理故障称为诱发故障。
2.按故障的持续期分类
故障可分为永久故障、瞬间故障和间歇故障。永久故障是由于硬件发生
了不可逆转的变化而引起的故障,它是一种静态型故障,其故障特征可再现;
瞬间故障指持续时间不超过某一确定的最大时间长度的故障,它通常由暂时
的环境因素引起,通常并不造成硬件物理性能的损坏,其特征是故障不具有
再现性;间歇故障是再生性故障,它出现的周期不确定,一般是由元器件性
能不稳、接触不良、设计不正确等原因引起的,其特点是具有再现性,是一
种可重复出现的非永久型故障。
3.按故障的表现分类
故障可分为物理层故障、逻辑层故障、数据层故障和系统层故障。物理
层故障指电子电路中的电路故障,可分为元件级、逻辑门级和集成芯片级故
障;逻辑层故障指物理层故障在逻辑层表现出的逻辑值变异;数据层故障指
由于硬件故障或环境干扰等原因引起的在计算机系统存储单元中表现出的
数据变异;系统层故障指故障在系统功能级的表现,即系统的输出不符合系
统功能的设计要求。
4.按硬件和软件分类
除了上述故障分类方法,还包括按部件分类、因果关系以及影响范围等
故障分类方法。
四、可靠性基本概念
1.可靠性的定义
系统的可靠性是指在规定的条件下,规定的时间内,系统完成规定功能
的概率。在该定义中,“规定功能”意味着不能希望系统完成设计功能以外
的功能,如果系统的设计功能不能满足运用的需要,仅说明系统设计得不好,
并不是可靠性差;“规定的时间”也意味着不能要求系统永远不坏,它总有
一个合理的正常工作期限;“规定的条件”意味着需要给系统工作一个必要
的环境条件,只有在这个条件之下系统才能够正常工作。
可靠性是一个与概率密切相关的统计指标,仅对一件产品来说是没有意
义的。这就需要拿出大量样本(产品)对它们做可靠性试验,才能得出产品的
可靠性评价。
2.可靠性的技术指标
描述可靠性的两项重要指标:
⑴失效率λ(t)
λ(t)的含义是:在t时刻
显示全部