新闻详细

ASQ QP 分享《老工具的新窍门 - 为FMEA引入边界风险和风险敏感性优先数》

发布日期:2017-12-07 09:57:53

在失效模式及影响分析(FMEA)中输入的排序评分被低估是有可能的,从而导致形成较低的风险优先数(RPN);


计算RPN对输入评分错误和由于这些错误形成的边界风险进行敏感度计算,能够得到更准确的FMEA结果和做出更好的减缓风险决策。


失效模式及影响分析(FMEA,又称故障模式及影响分析)是经常用于在管理潜在过程和设计风险时的风险评估工具。毫无疑问,在开展FMEA活动时也会存在相应的失效(故障)模式。

准确的FMEA结果需要有准确的风险排序输入,然而并不是总能获取完整和准确的信息。如果FMEA的风险排序输入是以集体讨论为基础,即是以技艺经验为基础而且有时是出于主观判断,那么就必须有一种方法来评估与排序评估不确定度相关的敏感度风险。

有一种基于结果的解决方案,使参与FMEA的人员可达到上述目的,它为当前的FMEA实际做法引入了边界风险和风险敏感度的概念:

  • 通过提出更多的认识帮助团队做出减缓风险的佳的决策,而且有即时效用;

  • 明确识别出那些潜在失效(故障)模式和风险评估,它们对因输入风险排序的不确定性而改变边界条件可能会非常敏感;

  • 指出关键少数的风险敏感度优先数(RSPN)值,相对于多数已成功减缓的低灵敏度风险;

  • 可以让团队对许多低灵敏度风险适当调低发生频率,以更新FMEA;

  • 利用标准FMEA电子表格,通过少数简单公式和两个附加列阐明边际风险。


运用FMEA和RPN减缓风险

FMEA从上世纪60年代中开始使用,最初是由航天航空业引入。这是一种很普及的工具,因为它提供了一种减缓风险的主动方法,可以预防潜在的质量问题。FMEA适合多种用途,包括过程、产品和服务。经常被用于建立对制造过程的控制。

对于生产过程, 该工具指导用户对过程进行详细分析并形成文件,识别潜在失效模式,评估与失效模式有关的当前风险,根据风险与采取措施减缓潜在高风险之间的关系,对潜在失效进行优先排序。定期重审或更新,使其成为持续改进的有效催化剂。

失效模式是指可能使一项设计或过程不满足设计或过程要求的方式,是对特定运行情况下出现不合格的描述。一个失效的影响对某个顾客可能是关键性的,它以顾客可能会注意到或经历到的角度进行描述。

FMEA团队可依据风险优先数(RPN)做出决策,RPN是三个独立排序评级数的乘积。这三个变量采用标准评级表,经常采用从1~10的量表进行评级。评级1指最良好状况(低风险),而评级10是最差情况(高风险)。

严重度(Sev)是表明失效模式对顾客影响程度的。频度(Occ)代表失效或失效起因发生的频率。探测度(Det)是指当前的过程控制所能探测出该过程薄弱点的水平。过程控制有可能探测出缺陷以及会导致缺陷的过程错误。

利用任何电子表格工具能够很容易地得到RPN值。RPN的电子表格公式如下:

RPN=Sev×Occ×Det

FMEA的电子表格模板有多种形式。对于不同应用、不同分析采取不同的评级准则都是可以接受的,只要把评级标准形成文件在单次FMEA中始终保持一致即可。对于10点制量表,最低的RPN值为1(=1×1×1),而最大的RPN可能值为1000(=10×10×10)。


FMEA的潜在失效

进行一次FMEA有时会比从其用法中推断结果更具挑战性。表1考虑了一个FMEA示例中部分条目。几乎每个人都熟悉驾驶和“保持在自己的车道上”这个过程,这已经成为避免超越自己职责范围的比喻。

表1 一个FMEA示例的局部

其中一个重要的失效模式是在一个未隔离的两车道公路上驾驶时,一辆汽车时从对面车道横穿至你的车道上。这种情况有可能造成两车以每小时55英里的速度迎头相撞。这种失效模式有几个潜在的起因,其中之一是司机的走神。多数情况下,仅有的过程控制是在两车道中间涂上黄色的分隔线进行视觉标识。通常这种做法给公路用户带来的是更多的焦虑而不是安慰。

即使由具有必备技能的不同小组各自独立应用FMEA工具,RPN结果仍会有明显的不同。这样的观察结果表明,工具取得的效果取决于明确的标准、有意义的用法说明、有效的培训和该过程方面专家的参与等先决条件。

你可以运用FMEA识别与实施FMEA本身有关的失效模式。这样的分析能立刻提出FMEA文件不充分或不完整相关的潜在失效模式。

有一种可能性, 团队会遗漏一些潜在的失效模式、其对特定关键顾客的潜在影响以及失效模式的潜在原因。这些对组织的潜在影响没有被认清或是未能减缓风险,是因为FMEA团队没能认识到特定关键过程的风险,因而不能采取适当的措施。表2列出了这些失效模式的潜在原因。

表2 FMEA工具的潜在失效模式(部分)

潜在失效模式 失效的潜在影响 潜在原因

不充分或不完整的FMEA文件(全面失效)

未识别且未减缓风险 未识别且未减缓风险
对失效机制不适当的识别

不准确的RPN值

(不准确且不客观)

未能减缓风险

严重度评分是基于失效模式(不正确)而不是基于失效的影响(正确)

主观地将严重度与频度和/或探测度进行关联
频度的评分是基于失效的影响(不正确)而不是基于失效的机制(正确)
高估了探测概率
探测度评分基于一个不明确的顾客
主观地将探测度与频度关联
探测度利用更多的视觉检验得到改进
用随机质量检查提高了探测度评分

对顾客关注不足是形成不充分FMEA文件的一种失效机制。例如将过多的运行关注点嵌入于最终用户上,就可能失去对下一阶段运行顾客的关注。

当一个团队愿意仔细研究最终用户的需求而又没有来自顾客之声(VOC)的实际数据,同时也没有考虑下一运行阶段的需求,但其实这些第一手VOC数据又是随手可得的,这时就会出现问题。

对失效机制不恰当的识别是另一种FMEA文件不充分的潜在原因。这些原因的描述方式应是以某些事件可以被纠正或可以被控制的形式。需要注意的是,应尽可能地避免含糊不清的语句。

缺少解决方案则不是原因。例如当一辆汽车从对面车道驶入你的车道时,“忘记带太阳镜”就不是失效机制。“环境”不是充分描述,因为它太模糊。“太阳太晃眼”可以是一个有效原因,但没有戴太阳镜不是原因,它只是一种潜在的解决方案。

其对组织的潜在影响未能减缓风险是因为FMEA团队可能低估了特定的关键风险并且没能采取适当措施。这种失效模式的潜在原因同样在表2中加以罗列。

严重度(Sev)是要关注顾客。Sev仅适用于失效对顾客的潜在影响,但失效的影响与潜在失效模式之间存在着一些混淆。利用潜在失效模式来为Sev评分就被误导了,并且大部分情况将会低估风险,因为其本身没有包含对顾客的影响。

Sev应当不依赖频度(Occ)和探测度(Det)而独立确定。认为Occ和Det改进结果会自动改进Sev的想法是不正确的。在公路的中心黄线上开槽可提供能听见的警告,但失效的潜在影响仍然存在,最坏的情况仍然是死亡事件。因此,在路面上开槽改进了Det的结果但并没能改进Sev。

频度(Occ)是关注失效或失效原因的发生机制。对Occ排序最好是按实际数据进行,但并不是总能获得好的数据。Occ仅适用于失效原因的发生频率,但有时会将失效原因与失效影响相混淆。

利用失效的影响来为Occ评分经常会低估风险,因为影响的频率会低于或等于失效原因的频率。实际因司机走神发生迎头相撞的频率低于所有司机走神所发生的频率。司机出现走神远多于许多人所能认识到的数量。

在实施FMEA时,过程控制所能探测到失效的能力很容易被高估,这是由于估计总会有某些主观性。探测度(Det)是关注于过程控制在影响运行前探测出失效存在的概率。

那些在发生后才能探测到失效的过程控制应当比在发生前就探测到失效机制并预防失效的过程控制评分低。

缺陷可以被认为是个别有害的保留风险。因此,当过程控制要依靠经过程控制后的某种形式的后续检验时,团队还给Det做出较好的排序做法是值得商榷的。

探测度(Det)的排序是关注所运行的当前过程中的控制能力。而下一阶段运行的顾客必须在所有风险评估中加以考虑,也包括对Det的评估。

对Det的排序评分不应仅因为相关Occ评分的改进而给予更好的评估。例如,当一个政府机构开展“驾驶时不发短信”的活动。可能会显示出司机行为的改变,结果是导致司机走神的频率有了实质性的降低。这可以改进对司机走神的Occ评分。

而另一方面,探测到并对发短信司机开罚单的过程控制能力还是保持未变,因为提高意识活动的成功不应影响Det的评分。而过程控制仍因警方能力保持不变。

虽然视觉检查和随机质量检查有其作用,这些形式的过程控制对风险评估Det评分的影响有限。这两者都不能探测到失效的发生机制从而能够系统地预防所有失效。

当出现失效,有些会最终以某种形式经过运行而达到顾客手中。如果视觉检验是Det唯一的方法,在其脱离运行前探测到失效的概率仍是有限的。

如果增加第三个或第四个人员进行视觉检验,仅凭视觉检验也并不能显著增加探测出失效的概率。随机质量检查不可能探测到孤立的缺陷,也不应影响Det的评分。

不准确RPN值的潜在影响不能缓解风险,因为FMEA团队可能低估特定的关键风险,从而不能采取适当措施。一些组织仍使用专断的RPN临界值,若超过此值应需要采取措施,而低于此值则不需要采取措施。

注意到最近工业界的主流想法并不建议运用RPN临界值来确定是否需要采取措施,这一点很重要。不准确的RPN值低于某一专断的采取措施临界值,会导致团队满足于某些特定的失效模式。

在Sev、Occ或Det上出现的边界错误会显著降低RPN值,有可能使其值低于采取措施的临界值。表3提供了输入评分错误如何影响RPN值的说明示例。

表3 潜在的边界错误如何影响RPN值的示例

该示例所用专断的采取措施临界RPN值为100,而当Sev=10,Occ=8,但Det给予了不准确的评分为1。结果是RPN值为80(=10×8×1)。由于80低于100,团队会认为不必采取相应措施。

考虑Det评分的不准确可能性,要求纠正边界值,给其再加上一个单位。用Det=2代替Det=1,这样RPN值就从80变为160(=10×8×2),这种改变在表4中有进一步说明。

表4 潜在边界错误如何影响RPN值的图表示例

注意这个特定的纠正使RPN值增加了100%。因为160大于100,团队就会需要采取措施。这与先前的决策相反。


RPN的敏感性

要承认有些RPN值对输入的排序错误更为敏感,这一点很重要。敏感性包括在相关变量与独立变量之间的边界关系。

一般来讲,RPN敏感性是指三个输入的评分:Sev、Occ或Det中每改变一个单位所导致的RPN值重新估算。即使边界错误没有使RPN值降低至需要采取措施的临界值以下,FMEA团队仍可能被误导形成不准确的措施优先排序。

敏感性分析可以帮助团队理解潜在输入评分错误会对所计算的风险数的影响。RSPN是关于RPN值对于可能的偏低输入评分灵敏度的特定测量方法。它是在对三个输入评分中最小值加1后重新计算的RPN值。

设计这种方法是为识别出对RPN值最大可能的提升,以及它可以显示出改变三个输入评分中最小的一个边界值时会发生的变化。可以在传统的FMEA模板的RPN列右边增加一列RSPN。RSPN的电子表格公式如下:

RSPN=max(Sev,Occ,Det)×med(Sev,Occ,Det)×[1+min(-Sev,Occ,Det)]

在RSPN公式的基础上,你可以按各种Sev评分建立一个RSPN与RPN值的矩阵。表5显示了一个对于Set=10的RSPN/RPN的矩阵一部分。此特定示例假设RPN采取措施的临界值为100。这些矩阵显示了RPN小于采取措施临界点同时RSPN高于该临界点时的多种情况。

表5 Sev=10时RSPN/RPN矩阵的一部分

比较保守的团队所用的方法是为所有RSPN值大于RPN采取措施临界值的情况都要规定措施计划。团队可以利用FMEA工具进行敏感性分析,类似利用RSPN/RPN矩阵分析,简单地把数据在新的RSPN列中进行排序。

表6从一个用RPN值按从最高到最低排序的FMEA示例,其中RPN采取措施临界值为100。这个示例展示了几种情况,对不准确输入评分的敏感性可能使团队决策从“没有理由采取措施”变为“需要采取措施”。

表6 对RPN值分类的FMEA示例

RSPN值代表当FMEA团队在计算原始风险数出现最坏情况的边际错误时,重新计算的风险数。

当然,输入评分可能不仅是边界值不准确,这意味着有时评分不确定性可能比边界值更显著。RSPN方法只是提供了一种标准化方法来比较多个失效模式中RPN值与潜在边界错误之间的相对敏感性。


计算边界风险

在RSPN方法中,边界风险优先数(MRPN)是相对于三个输入评分中最小值变化一个单位时RPN值变化的大小。它是RSPN值与RPN值之间的差。

MRPN值很容易在任何电子表格工具上形成,可以在FMEA模板中RSPN列右边增加一个MRPN列。MRPN的电子表格公式为:MRPN=RSPN-RPN。

MRPN值很重要,因为它代表了基于潜在边界错误而改变风险数的大小。以10分制量表为例,它能够显示最低的MRPN可能值为1(1×1),而最高的可能值为100(10×10)。

数据分类后的MRPN值为FMEA团队提供了另一种形式的敏感性分析。这种附加信息能够影响团队对特定失效模式进一步降低风险。团队可以选择用较高的MRPN值,例如用高的Sev评分,来重新考虑措施计划的有效性。

表7显示RSPN和MRPN指数如何添加到现有的FMEA模板中。这些列不用时可以隐藏。以这种方式方法增加FMEA工具无需做太多工作。

表7 增加了RSPN和MRPN列的FMEA模板示

敏感性分析对特定失效模式提供额外的了解,具有产生显著优势的潜力,能够更有效地降低风险。


作者简介:

尤金·布考斯基(Eugene R.Bukowski):美国印地安那州通用电气医疗保健机构的高级工程经理,美国质量学会(ASQ)资深会员、ASQ注册六西格玛黑带;在北卡罗来那州达拉谟的杜克大学获得电子工程的硕士学位及密歇根州弗林特的凯特林大学获得制造管理学硕士学位。

译者:箫笙(CAQ)