新闻详细

ASQ QP分享《言之有据 - 确保根本原因分析由事实和数据所驱动,而非未经证实的观察或猜测》

发布日期:2016-10-10 16:09:05
  • 根本原因分析(RCA)应以事实和过硬的数据作为支撑;

  • 收集并说明这些事实,应当运用科学的方法遵循PDCA循环进行;

  • 绝大多数质量专业人员已经熟练掌握了科学方法,但在根因分析这种特定形式中往往很少涉及。


根本原因分析(RCA)应当具有实证性——也就是说要基于数据和事实开展。尽管这似乎是显而易见的,但在关于RCA的文献中鲜有提及实验、假设检验的必要性,甚至将其视为一个有待调查的缺陷要素。

许多经验丰富的工程师试图通过故障模式和影响分析(FMEA)对失效部分进行分析,以查明问题所在,却全然忽略了检查失效的部分。

对FMEA的简要了解并不等同于RCA。观察FMEA或许可以启发出一些观点,但根本原因却无法在文件中得到确认,并且FMEA中也不可能罗列出一个新的失效原因。查阅文件或许是寻找失效原因的第一步,但绝非实证RCA的唯一步骤。

一位有着数十年质量工作经验的资深顾问提出,质量功能展开(QFD)可以被称为RCA的一个好的开始。在被告知实证方面的必要性后,他答道,“你应该深入到生产实践,将作业指导书视为QFD的一部分。”

翻阅作业指导书有助于开展工作,使查看部件效果更佳。作业指导书不会告诉调查员缺陷是否仅仅是由于部分设计上的欠佳所导致。多里安?谢宁(Dorian Shainin)提醒我们要“与局部对话(talk to the parts)”;对于一些质量专业人士而言,这种提醒是不可或缺的。


科学方法与根因分析

对于质量专业人员来说,科学方法都是其工具箱中不可或缺的重要组成。比如,运用诸如石川图(又称鱼骨图)、统计方法等传统质量工具可以收集到数量可观的数据。事实上,科学方法已经被人们所熟知,其基本要素也可能已为大多数工程师掌握。然而,由于来源不同,对科学方法的描述也有所差异。

科学方法由下列环节组成:识别问题,收集数据,进行实验,基于方法甚至怀疑生成与数据相吻合的假设,根据假设做出预测,以及将预测结果与实验结果进行比对。

由一个假设引出另一个假设,进而形成一个反馈循环——基于原始假设生成的结果可以与现有数据做比较。预期结果和实际结果之间的差异将成为变更假设的依据。

有时,有关失效(故障)的调查是在对已有初始信息的细枝末节有所掌握的前提下才能展开;此时,科学方法的作用便得以凸显。为了查明导致缺陷发生的根本原因,有必要进行失效场景重建,从而开展现状调查。这里需要对最有可能的原因进行猜测,并尝试模拟它的作用。这些实验能够帮助我们找到问题的根源,同时在验证过程中获得新的见解。

下一步,研究人员必须找到一个合理假设用以解释当前的失败。带着问题对局部或者整体展开系统调查,不失为一种生成初始假设并进行测试的有效方法。

在这种情况下,实验或简单或复杂,比如,质量工程师对小型机电组件失灵进行调查,怀疑是一颗小的固定螺钉扎入了套管而导致故障产生。

他将正常运转的零件和故障零件相连接,试图通过产生的信号证实自己的假设。当看到只有正常零件生成信号后,这名质量工程师将零件开启到工作状态并用锤子砸它,模拟扎入固定螺钉的效果。由于用锤子敲击组件同样会生成一个示波器符号,因此假设被推翻了。

或许实验并非确认问题根源的理想途径,但它能有效地用于排除错误的假设,从而使质量工程师能够及时调整方向,查找引发失效的其他潜在原因。

一般来说,我们做出的假设应当是谨慎、恰当、易懂并可驳倒的,同时还要具备总括性;这也就意味着假设不宜过多。我们可以将其概括称为“奥卡姆剃刀定律”,即从两个相互矛盾的假设中选择更朴素或相对没有那么复杂的一个;并且,这个假设必须是可驳斥的(“奥卡姆剃刀定律”又称“奥康的剃刀”,是由14世纪英国逻辑学家、圣方济各会修士奥卡姆提出。该原理提倡化繁为简,认为保持事物的简单化是对付复杂与繁琐的最有效方式;概括来说就是“如无必要,勿增实体”,即“简单有效原理”——译者注)。

这一关于假设的原理基于卡尔?波普尔(Karl Popper)的证伪主义观点:假设必须是可证伪的。不具备可证伪性的假设显然是无从辩驳且其科学性有待考量。无论假设正确与否,我们都很难对其加以评估,因为它看似真实。

回顾机电组件的示例我们可以发现,已知假设是“凹陷导致故障”,一个简单的实验就能很快将其推翻。事实上,建立一个假设,数据是关键。

假设所需数据通常是现成的,不然可能就要经过数据收集和分析进而形成首轮试探性假设。调查人员在开展根因分析时往往已经对问题根源有了先入之见,但仍需运用数据对假设做出评定。否则,假设只不过是未经证实的个人观点。

一些常规质量工具(如帕累托图和石川图或趋势图)在此或许可以派上用场。如果现有数据不足以支撑合理假设的形成,那么调查人员可以通过探索研究的方式收据收集。

与严格意义上的科学方法相比,探索研究对组织架构的要求没有那么严格,但这也并不意味着可以将其与那种以纯粹偶然的方式寻找数据的做法相混淆。在此过程中,调查人员能够很快提出假设,并通过更为结构化的测试迅速做出接受或排除的判断。

需要注意的是,我们应当将探索研究视为数据收集的一部分,区别于为确定根本原因而开展的研究活动。对于收集得到的原始数据,美国著名统计学家约翰 图基(John Tukey)创造的探索性数据分析(EDA)不失为一个行之有效的检验方法(探索性数据分析是一种为了形成值得假设的检验而对数据进行分析的方法,是对传统统计学假设检验手段的补充——译者注)。

在图基的描述中,EDA被比喻为侦探的工作。根据他的观点,分析数据、探测作业情况等活动除了需要运用工具之外,还要对证据搜寻方向有明确认知。侦探在办案时首先需要查找能够向法官提交的线索,之后通过数据分析收集并最终确认证据。EDA运用图表对杂乱无章的数据进行描述、分析,查明其中是否隐含与预期不符或是表现异常的特性。

EDA的实施可能就像用一幅趋势图描述故障在不同时间段的出现情况那样简单。例如,测量数据即使是来自不同的产品批次,也可以通过箱线图进行对比,从而判断各批次之间是否可比;所得到的信息就可以用于生成假设。

运用EDA方法形成的众多假设或许并不会直接指向问题的根源,但它们却能为启动后续调查提供依据。在调查过程中对假设进行评估并从中获取认知,同样可以引导研究人员接近正确项。当掌握了充足的数据后,研究人员便可运用约翰 普拉特(John Platt)的强推论(strong inference,SI)观点所提供的坚实的科学方法完成RCA。

普拉特建议形成多个假设用以评估。在初始假设建立并进入调查环节后,做出强推论需要遵循以下三个步骤:

  1. 设计一个备择假设或学说;

  2. 设计一个判定性实验,尽可能地排除其他假设;

  3. 完成实验。

随着这一过程的不断重复,每一种假设都得到了不同程度的修正。初始假设的作用在于预测实验结果。对此,普拉特的主张是真实的事物应当具备可预见性;没有预测就没有认知。除了缺乏认知,不能被用于预测的假设因其准确性无从评定而同样毫无价值。

在质量工程师调查机电组件失灵的案例中,“凹陷导致故障”作为初始假设,备择假设是“凹陷不会引发故障”;判定性实验是故意敲击组件以查明它们在外力撞击作用下能否保持正常运转。需要记住的是,未能成功推翻某一假设并不表示该假设是正确的。

波普尔曾指出,我们永远无法证明假设的正确性,因为它总会被未来某个时间出现的新数据推翻。事实上,对于那些经过严格检验并最终留存的假设,我们可以认为它们是正确的。

理论上来说,每个实验的结果都应该被用来改进原有假设,或是生成一个可以通过实验加以验证的新假设。我们应该将实验视作一个循环而非直线过程,研究人员在每个周期或迭代的指引下逐步向潜在真相靠近。

乔治 伯克斯(George E.P. Box)、斯图亚特 亨特(Stuart Hunter)和威

廉 亨特(William G. Hunter)建议使用迭代推理-演绎过程。

演绎法强调从一般性前提出发,通过推导得出具体结论。举例来说,工程师发现一台机器停工,分析后判定是某个系统阻碍了机器的正常运转,因而得到结论:系统故障导致机器不能正常工作。

归纳法则是根据已有经验事实推导出一般性的初步结论,是从特殊到一般的过程。例如,工程师注意到过度拧紧螺栓会造成螺纹磨损,因此怀疑磨损螺栓是由于拧得过紧。

在迭代推理-演绎过程中,演绎法的作用在于形成初始假设。此后要对该假设进行验证,并将首次测试结果与假定的结果做对比,进而得出结论。如果假设被推翻,则要运用归纳法,根据已知结果提出新的假设。事实上,迭代推理-演绎过程持续重复,这种循环也将引导实验人员最终抓住事物的本质,即找到问题的根本原因。

在开展探索性数据分析时可以使用的科学方法包括演绎推论和PDCA循环,后者又被称为“戴明循环”。PDCA循环是查找、验证根本原因的基本原则,其结构性和灵活性的优点已被业界广为认可。


PDCA循环的三个阶段

开展根因分析活动时,我们可以将PDCA循环的应用划分为三个阶段,每个阶段对应着各自需要遵循的步骤。PDCA循环的第一个阶段是即时行动阶段;第二个阶段是RCA阶段,其中又可能包含着多个PDCA循环;第三阶段即最终阶段,是由改善活动组成。

在即时行动阶段,第一步是要在发现问题或做出决定后选择正确的改进方法。

广泛应用于汽车行业的8D报告,能够帮助问题得到彻底解决。报告涵盖了如下内容:团队组建情况,对当前问题的描述以及即时措施相关信息,问题的根本原因,纠正措施的设计与实施,防止问题复发的持续性活动。

六西格玛或其他方法同样可以使问题得到妥善解决,这里的关键是要确认这种方法能否适用。

第二步是组建团队。团队的规模、组织架构以及团队涉及领域的复杂程度都要与待解决问题相适应。例如,质量技术人员由于长期上夜班而导致作息失调,那么他可能就会向有着类似经历的机床工人寻求帮助,借鉴他们的经验以克服这种失调。组织如果想实现六位数的资本积累,就需要规模更为庞大、结构更加多元的人员队伍。

实践中, 防控措施好像并不是RCA的一个直接构成要素,因为人们在RCA描述时常常容易忽视这项内容——或许是觉得它与改善活动或实效分析无关。

然而一旦检测出故障,就必须考虑是否采取预防措施。如果第一道工序就出现问题,那么可能除了停机检修直至查明原因之外别无他法。

客户在使用设备过程中不时遇到的零件缺陷故障,是顾客投诉的来源之一。对于此类问题,我们应当给予重视,对一些生产环节加以严格控制,如零件的库存条件、在途运输情况以及交付状态等。

一旦进入追根溯源环节,团队就要准备进入下一阶段;这也是即时行动阶段的最后一个步骤。图1对此做出了说明。


开展RCA的第一步是对问题进行描述并加以量化。所有相关的描述语句应当足够清晰,以便明确问题所在。在有条件的情况下,尽量用数字表述实际状态,如“节约10000美元”“理论上应该是7±0.05毫米,但最终实际为7.1毫米”。在调查初期,零散的信息或许并不足以用来量化问题;但当可用数据积累到一定规模之后,问题量化就成为必然的选择。

还要注意的一点是,收集数据是为了充分掌握信息以形成一个试验性的假设,并在后续的PDCA循环中对其进行实证评估。对于实证评估的用时我们很难估算,或许通过对局部情况的快速查看就能判断所做假设是否符合实际,或许是要经历一场旷日持久的耐久性试验。最终得到的测试或评估结果,都将与假设结果进行比对。

如果假设被推翻,在此过程中获取的任何一种认知都可以用来建立新的假设,并开始新一轮循环。如果提出的假设顺利通过评估,那么就要对其进一步验证以确保该观点的正确性,进而判定其“根因”属性。

理论上,我们通常使用“5why”分析法对识别出的根本原因进行验证;即对每次查找出的问题原因连续提出5个“为什么”。这种方法有助于发现问题的根本原因。如果查找到的不是根本原因或者不是真正的根源,就需要开始新一轮的PDCA循环。图2对RCA过程中的PDCA循环进行了描述。


纠正措施和改善活动可能不是RCA的直接部分,但在必要时,它们往往配合着控制措施一起,共同作用。在对策实施阶段,首先是要对拟采取的纠正(改善)措施;此后,将制定的对策在小范围内展开,以确保措施的有效性,防止产生负面影响。

出现故障可能就意味着要采取纠正活动并对改进部分实施100%的检查。如果结果未能收到理想效果,组织就要制定新的行动方案、重新开始PDCA循环;如果检查发现目标达成,就可以对纠正措施加以推广,从而实现更大规模的改进。此外,组织还要积极捕捉更多机会实现自我改善(如通过与同类产品或流程的对比查找不足)。

与之相应地,有关文件、资料也应得到及时更新,包括FMEA、控制计划、作业指导和经验教训数据库等(见图3)。


实证经验在RCA中的必要性或许早已被人们视为常识,但在实际应用环节却往往被忽略。组织一旦决定要采取即时行动改善当前不利局面,那么就要开始对数据进行收集和分析;也就是说,决策受数据驱动。一个经验丰富的工程师能够意识到出现失效,并深信自己清楚问题根源所在。然而这里潜藏着一定风险——如果仅仅是作为一种观点,而非经过实践验证的事实,那么其采用的纠正措施很可能发挥不了任何作用。

此外,对于经验主义者来说,改善措施的实施前提是问题的根本原因得到确认。制定的行动方案必须经过验证,这样才能确保后续活动的顺利开展。如果在RCA方面缺乏实证经验,那么很可能将个人观点错认成为客观事实。



作者简介:

马修·巴萨罗(Matthew Barsalou):统计问题解析领域资深黑带,就职于德国基尔夏因博兰登(Kirchheimbolanden)的博格华纳涡轮增压系统工程有限公司(BorgWarner Turbo Systems Engineering GmbH)统计方法研究部门。从德国达姆施塔特市(Darmstadt)的达姆施塔特远程应用科学大学(Wilhem Büchner Hoschschule)取得工商管理和工程学硕士学位,并在位于美国堪萨斯州海斯市的福特海斯州立大学(Fort Hays State University)获得文学专业硕士学位。作为A SQ资深会员,巴萨罗同时还是ASQ注册质量技术人员和质量工程师、注册六西格玛黑带以及注册质量经理(组织卓越绩效);此外,他还担任了智能解决方案认证精益六西格玛资深黑带、《质量进展》杂志技术评论专员、统计司统计文摘的编辑以及ASQ德国区国家顾问等职务。

译者 华婷