早期故障率
Ⅰ 耗损故障期的故障率是什么
设备故障率浴盆曲线及特点
通过对设备故障进行研究,发现大部分机械设备故障率曲线如图1所示。这种故障曲线常被叫做浴盆曲线。按照这种故障曲线,设备故障率随时间的变化大致分早期故障期、偶发故障期和耗损故障期。
早期故障期对于机械产品又叫磨合期。在此期间,开始的故障率很高,但随时间的推移,故障率迅速下降。此期间发生的故障主要是设计、制造上的缺陷所致,或使用不当所造成的。进入偶发故障期,设备故障率大致处于稳定状态。在此期间,故障发生是随机的,其故障率最低,而且稳定,这是设备的正常工作期或最佳状态期。在此间发生的故障多因为设计、使用不当及维修不力产生的,可以通过提高设计质量、改进管理和维护保养使故障率降到最低。在设备使用后期,由于设备零部件的磨损、疲劳、老化、腐蚀等,故障率不断上升。因此认为如果在耗损故障期开始时进行大修,可经济而有效地降低故障率。 1.2 现代化设备的故障率曲线
随着科学技术的发展,大量新技术、新材料不断涌现,特别是电子技术、自动化技术的广泛应用,设备正朝着精确化、自动化方向发展。设备的结构、各工作单元的关系和环境变得越来越复杂,这给设备维修工作带来了新问题。
人们通过研究发现一些用现代技术装备的设备,故障规律与浴盆曲线相背离。经过近30多年的研究,设备的故障率除了浴盆曲线外,还有五种情况[1],如图2所示。
曲线A显示了恒定的或者略增的故障率,有明显的磨损期。曲线B显示了缓慢增长的故障率,但没有明显的磨损期。曲线C显示了新设备从刚出厂的低故障率,急剧地增长到一个恒定的故障率。曲线D显示设备的故障为恒定值,出现的故障常常是偶然因素造成的。而曲线E显示设备开始有高的初期故障率,然后急剧下降到一个恒定的或者是增长极为缓慢的故障率。
通过对民用飞机的故障进行统计调查发现,4%的设备遵循典型的浴盆曲线,2%的设备遵循曲线A,5%的设备遵循曲线B,7%的设备遵循曲线C,14%的设备遵循曲线D,不少于68%的设备遵循曲线E。一般来说,在实际运行中,设备的故障率应该是图2所示的五种曲线中的一种或几种的合成(浴盆曲线可以看作曲线A、D和E的合成),其故障率可能与民用飞机的故障率不完全相同。但是,设备故障率取决于设备的复杂性,设备越复杂,其故障曲线越是接近于曲线D和E。
Ⅱ 汽车故障变化规律呈现出三个明显阶段是
故障程浴盆形式,
初期短时间内故障比较集中出现,
中期很长一段时间不怎么出现故障,
后期又高频率爆发故障,
故障率随时间的变化像个浴盆的截面,
详细解释如下:
------------------------------
第一部分 – 浴盆曲线、早期失效和老化
可靠性专家经常使用一种名为浴盆曲线的图来描述成批产品的寿命。浴盆曲线由三个阶段组成:故障率减小的早期失效阶段,随之是故障率低且相对恒定的常态寿命阶段(也称作“有效寿命”),最后为故障率增加的磨损阶段。本文介绍了早期失效、常态寿命和磨损这三种模式是如何组合,从而生成全部的产品故障分布的。还叙述了在产品寿命的每一阶段减少故障的方法,并说明了老化在使用得当的条件下,可以通过筛选出早期失效的故障来明显降低工作故障率。本文分为两部分进行介绍。第一部分介绍了浴盆曲线以及早期失效和老化。第二部分将介绍浴盆曲线其余的两个阶段:常态寿命故障和寿命末期的磨损。
浴盆曲线并不是描述单一项目的故障率,而是描述一个产品总体随着时间的相关故障率。一些个别的单元可能会在相对早期的时候失效,其余的单元(我们希望是大多数)会一直工作到磨损出现,还有一些会在一般称作常态寿命这个相对较长的时期内失效。在早期失效阶段中出现的故障绝对是不受欢迎的,一般是由缺陷和失误引发:材料缺陷、设计失误、装配错误,等等。常态寿命故障一般认为是随机的,是由“过度的应力”引起的。但是,如我们所见,许多通常认作是常态寿命故障的故障,实际上却是早期失效故障。磨损是一种无法避免的事实,由疲劳或材料的损耗(如轴承中润滑油的损耗)引起。产品的有效寿命是受其自身当中寿命最短的部件所限制的。产品的制造商一定要确保所有指定的材料都能满足预期的产品寿命。
注意,浴盆曲线一般用作说明产品故障三个关键阶段的可视化模型,不用作描述某一类产品预期表现图解的标准。很难有足够的短期和长期故障信息来实际对一类有标准浴盆曲线的产品进行建模。
还要注意,这三类故障分布的实际时间段会有很大的区别。早期失效并不意味着“在90天内失效的产品”或者任意其他的时间段。早期失效是产品故障率降低的时间段,可能会持续很多年。与之相对的是,在预期产品寿命很久之后也不总会发生磨损。这是在观测中的产品使用几个月之后故障率渐增的一个阶段。当然,站在保修的角度来看,这就是一场灾难!
我们对整个浴盆曲线所说明的特性很感兴趣。早期失效阶段是一个故障率降低的阶段,但它是不受欢迎的,因为大量在短时间内发生的故障,会引发早期的顾客不满和保修费用。理论上来讲,在常态寿命中的故障是随机的,但是就长时间的检测结果,故障率是相对恒定的。因为这些故障可能导致保修费用或增加服务支持费用,我们希望浴盆的底部尽可能的低。我们不希望在产品预期的有效寿命时期发生任何磨损型的故障。
早期失效——它是由什么引起的以及可以对它做些什么?
站在顾客满意度的角度,早期失效是不可接受的。它们造成了“一用即坏”的产品并破坏了顾客的信心。它们是由设计到或构建到一个产品中的缺陷而引起的。因此,为了避免早期失效,产品的制造商一定要确定出消除缺陷的方法。适当的说明、充分的设计容差以及足够的部件降额,都可以有所帮助,经常会实际应用,但是即便最好的设计构思也不能含概工作中所有部件可能的交互作用。在最佳设计方法之余,应在最早的研发阶段就开始应力试验,用来评价设计缺陷,揭露特定的装配和材料问题。这样的试验称作HALT(高加速寿命试验)或HAST(高加速应力试验),应该进行,根据需要提高应力水平,直到促成故障。应对故障进行研究,做出设计改进来使产品更加强壮。这样的方法有助于消除可能会在现场造成产品故障的设计和材料缺陷。
在一个产品制造开始之后,应力试验仍然是重要的。应力实验在生产中有两种不同的用法。一种目的(通常称作HASA,高加速应力审核)是来确认由装配或材料变异引发的会导致故障的缺陷,并采取措施来排除这些缺陷的根本原因。另一种目的(通常称作老化)是使用应力试验作为一种进行中的100%的筛选,来排除根原因不能消除的产品中的缺陷。
第一个方法,消除根原因,通常是最好的方法,可以明显减少早期失效。仅对早期产品进行100%的应力筛选费效比一般最高,随着确认出根原因之后则减少筛选到一个审核品中(或完全消除),过程/设计是校正过的,排除掉了重大问题。不幸的是,一些公司适时的开展了100%的老化过程,并持续了这一过程,强调现象而忽略了确认根原因。只是不断的重复对同样的缺陷进行排除和返工。对于大多数产品,无论是从费用角度还是从可靠性改善的角度,这么做都是无效的。
有一种典型的产品,其进行100%老化被证明是有效的。这是一种代表技术发展水平的技术,如带领科技前沿的半导体晶片。在硅和微小构成变化之间存在大量的缺陷,不用利用现有水平的技术来排除。这些缺陷可引发一些零件在较产品总量主体相当早的时间内就失效。老化是一种筛选出这些虚弱零件的有效方法。这一点将稍后在本文中进行介绍。
引领前沿技术的老化
为了说明老化是如何改善高科技零件的可靠性的,我们使用一个与故障率与时间关系曲线有些相似的图表,残数图,可以直接显示总量中有多少个单元在特定时间内未失效。比如某图中显示,在最初20年发生的故障(大约4%)中,大多数故障都是发生大约一年左右,如我们从以上早期失效范例中所看到的那样。因为恒定故障率水平较低,这个图显示了一百年来的故障。当然,不会存在一百年后还未发生的磨损模式,但是这里不考虑磨损分布。电子部件,和机械配件不同,很少在工作几十年之前就有很明显的磨损现象。
我们并不关心远远超出十年的故障,所以让我们来关注仅包含头十年的同一个模型。它已经含概了用于生成该仿真模型中的样本故障点。这使得我们可以查看故障是源于哪一总量的(早期失效或常态寿命)。
我们可以看出,这类图看上去类似浴盆曲线中早期寿命和常态寿命部分,实际上包含了这两种分布。例如,我们看出超过2%的单元在第一年中失效,但是十年间才有3%的失效。实际上,在这一模型中十年之后依旧是早期失效,但是故障率是不断减少的。实际上,在这一模型的十年范围内,出现了很少的常态寿命故障。这个范例中,常态寿命故障总量中只有两个故障(所有故障中的~5%)。大约有95%的故障都是早期失效故障!这就是集成电路(IC)工业使用复杂固态装置所观察到的。即便是在工作十年之后,IC的主要故障原因依旧是早期失效。也就是说,故障依旧是由缺陷导致的。
在这种情况下,老化可以有所帮助。如果在发货前先使用了三年这个零件,就可以筛选出超过80%的会在十年之内失效的零件(2½%用3%除)。所以如果我们提出一个有效老化零件三年的方法,就可以消除大部分的早期失效,剩余零件的可靠性就比原始零件的高。当然,经过三年老化的零件也会在现场持续工作十年,总共为十三年。
原始零件(没有老化)十四年的故障分布,以及经过了三年老化的零件的预期十一年的故障分布,可以进行对比。在这个范例中,原始部件在三年到十三年(或者老化部件从零到十年)的总的累积故障大约为0.6%。如果不进行老化,头十年就会有大约3%的累积故障。这说明了通过老化,累积故障大约减少了五倍,或者换句话讲,如果存在一种重大的早期失效故障模式,则通过老化十年中的累积故障会减少2½%。注意在头一年或头两年的时间内,可靠性的相对改进尤为明显。在两年内,老化后预计只有大约0.1%的故障,而如果不进行老化,这个数字则会将近2½%。比值接近25:1!
实际上,制造商不会有两到三年的时间用来老化。因此需要使用加速应力试验。在IC工业中,通常有两种应力可用来加速老化的有效时间:温度和电压。升高的温度(相对于正常工作温度而言)可以提供几十倍的加速度(10x到30x都是正常的)。增强的电压(相对于正常工作水平)可以为许多类型的IC提供更高的加速因子。范围在1000:1或者更高的组合加速因子,对于许多IC老化过程都是正常的。因此,几十个小时的老化时间就相当于了一到五年的有效工作时间,明显减少了带有早期失效缺陷的零件比例。
如果我们尝试对没有明显早期失效问题的产品进行老化又会怎样呢?举个例子,我们很容易就能发现,老化两年后的部件有~2%的故障,但是继续工作两年之后还会有~2%的故障。在十年间,将有10%的故障。注意,恒定的故障率(等价于浴盆曲线的常态寿命部分)是作用于剩余的总量的,而随着单元的失效,剩余的总量一直减少。参考最后一个范例中的同样的老化条件,如果我们先使用这些零件三年,然后再使用十年,我们会得出一个什么样的结果呢?通过这一筛选的单元的累积故障非常接近于9.5%。而不经过老化,十年间的累积故障还是一样的,大约为9.5%。对于恒定(常态寿命)故障率,老化是没有收益的。
很明显,对于以磨损故障模式(故障率随着时间升高)而失效的部件,老化实际上会得出比没通过老化的单元还要糟糕的部件。原因很简单,就是故障率在零件工作的每个小时内都在增加。增加工作时间只是增加了故障在未来任意时间段发生的可能性!
结论
在第一部分中,我们介绍了浴盆曲线的概念,并讨论了与第一阶段早期失效相关的问题,以及一些实践,如用来解决这类故障的老化。如文中所述,虽然老化通常不能作为一个可行的减少早期失效故障的经济方法,但老化已经证明了对根原因缺陷不能消除的艺术级半导体有效。对于更多的产品,应力试验,如HALT/HAST应在设计和早期生产阶段进行使用,以促成故障,并对形成的故障进行后续分析,采取通过再设计消除根原因的纠正措施。在第二部分中,我们将研究浴盆曲线的后两部分:常态寿命故障和寿命末尾的磨损。