更全的杂志信息网

故障根本原因分析在TSQ诊断中的应用

更新时间:2016-07-05

0 引言

随着市场竞争的日趋激烈,加之品牌效应带来的溢价能力,越来越多的中国企业逐步地从以低价竞争为主的经营转向高质量、高附加值的经营。因此,以产品质量可靠性为中心,全面提升企业质量竞争优势和品牌效益的企业发展战略已经成为越来越多的中国企业转型升级的重要抓手。在当前经济形势下,提高产品质量,增强竞争力,对扩大市场需求具有重要的意义。因此许多企业都比较注重产品是否合格,通常都会为产品做合格判定,但是目前有关检测标准、检测方法、检测设备和检测要求的研究机构有很多,而对于产品检测后不合格该如何解决这一问题,企业就十分困惑。比如:为什么产品出厂前100%检验合格,而1年后翻修率却高达10%甚至20%,其他企业的产品的翻修率却只有5%甚至1%或者更低?这会使许多企业管理者感到困惑。为了解决企业面临的高退货率、高返修率、高投诉和质量损失严重而无法解决等问题,我们提出了一套在不少行业和企业实践后并正在不断地完善的行之有效的解决质量可靠性问题 (故障)的方法,即质量可靠性整体解决方案 (TSQ:Total Solution for Quality&Reliability)[1]。 TSQ 面向顾客的需求,从质量可靠性故障和问题出发,针对企业的产品、组织和流程查找问题,减少质量可靠性损失(故障率、维修量和废品率等),开展针对问题的检测,从退货率、维修率和质量损失等切入,引导企业利用技术工具和管理手段持续改进质量水平,提升产品的档次和附加值 [2]

对于电子产品来说,电子元器件是电子产品的基本组成单元,是电子元件和电子器件的总称,电子元器件的可靠性工作主要包括两个方面:一是评价可靠性水平;二是提高可靠性。评价可靠性水平的方法包括可靠性数学预计、可靠性试验评价等;而提高可靠性则必须通过失效机理研究、工艺监控和可靠性设计等方法来实现 [3]

TSQ共有35个硬件模块工具和39个软件工具,每个模块工具都有各自的特点和作用。其中,故障根本原因分析,旨在通过成熟的方法、先进的仪器设备和专业的人才来确保准确快速地定位产品故障的根本原因。不少企业面临这样的困境,在顾客投诉、退货、产品测试和制造问题等频频发生的情况下,技术人员、工艺人员和质量人员等苦于找不到这些问题的根本原因,造成无法采取针对性的纠正措施。故障 (失效)根本原因分析的核心就是要通过各种方法、手段来定位故障 (失效)的根本原因,以推动采取实际有效的能够预防再次发生类似问题的措施 [4-6]

在TSQ诊断中,故障根本原因分析被广泛地应用。本文介绍了TSQ的关键工具模块——故障根本原因分析在某企业产品DC/DC芯片失效中进行关键问题查找、故障定位和改进的过程与效果。

1 背景

某集研发、设计、生产和销售打印产品为一体的国际化企业,其生产的产品热销全球40多个国家和地区。某款打印机内电控板发生大规模失效,此电控板由公司负责设计,交由外协厂生产。经过公司内部分析,电控板失效原因定位为基板上某DC to DC芯片 (应用为24 V to 3.3 V)损坏。

此类故障经常发生,占产品总体故障的比例超过6‰,公司内部除分析出芯片烧毁、输出pin脚(3.3 V)对地短路、输入pin脚 (24 V)与输出pin脚 (3.3 V)短路等失效表现以外,一直无法找到此类故障发生的根本原因。尝试通过增大输入电压测试、增大输出电流测试等验证方案来验证故障现象,但始终无法复现芯片的损坏现象。

2017年12月的一天,接到师市宣传部的任务,要为中央采访团安排两位老军垦接受采访,第一时间,我想起了李庆堂,一位年近八旬的老军垦。就在几天前,我在社区活动中心碰到了老人,他正在和几位老伙计讨论着团场改革的问题,“以前是只挥坎土曼,现在是既要会用坎土曼还要会挑货郎担”,带着河南口音的一句话,点中了此次改革的要旨。

林昏晓踌躇了一下,突然神秘兮兮地说:“那我给你取一个吧?我叫林昏晓,你呢,干脆当我妹妹算了,叫林夕晓。”

2 分析过程

2.1 实验室分析

利用体视显微镜对失效样品进行外部检查,主要是检查样品在安装、试验和使用等过程中引起的损坏。芯片的典型形貌如图1所示,从图1中可以看出芯片样品已经烧毁,芯片表面塑封料已经碳化,输入引脚 (pin2)发生熔断,熔断处可见金属熔球。

2.1.1 外部检查

软管都取出来了,王姐还不死心,缠着段主任说:您别放弃呀,求您再给试试呗。段主任摇头说:没必要了。王姐说:那总不能让我妹夫这样过一辈子吧?您再给想想别的办法。段主任说:我这是没办法了,你转到胸外科,看看他们有没有好办法吧。王姐说:成,胸外科我也有熟人,您估计他们有什么好办法?段主任说:开胸。

图1 芯片失效的外观形貌

2.1.2电参数测试

1)实施顶层设计,混合所有制改革思路清晰。建立改革工作组织机构,研究制定政策文件,形成了中国石油混合所有制改革的纲领性顶层设计方案。按照“引入社会增量资金、盘活存量资产、通过合资合作实现合作共赢”的思路,本着“宜混则混、宜控则控、宜参则参”的原则,部署了分类、分层推进混合所有制改革,子公司股权多元化,加大合资合作力度,加快多种经营企业混合所有制改革和推进资产结构优化调整5个方面的改革工作。

样品的电参数特性可用于确定失效样品的失效特性,鉴别样品的失效模式,所以利用晶体管图示仪测量失效样品各引脚间的I-V特性,并与良品进行对比。结果显示测试的4只失效样品的输出引脚 (pin3)对GND均呈短路特性。

构景要素以自然、人文为主线,交通为纽带,民俗文化为趣味点,形成主题各异、形象鲜明的旅游精品线路,造出“同饮黄河水,共赏民俗情”的主题式旅游[10]。民俗文化有着独特的文化内涵、浓烈的原始气味、厚重的历史氛围、显著的地域差距、欢愉的生活情调及丰富多彩的表现形式,对游客产生强大的吸引力和感召力。

2.1.7 实验室综合分析

2.1.4 声学扫描检查 (CSAM)

声学扫描显微镜是利用超声脉冲来探测样品空洞、内部空隙、裂缝、不良黏结和分层剥离等缺陷的。为了检查样品的不同材料界面的粘接情况,利用扫描声学显微镜对失效样品和良品样品进行声学微区成像分析,主要是检测引线框架、芯片或引出端焊板的模塑化合物分层、模塑化合物的空洞和裂纹、芯片粘接材料中未粘接区域和空洞等。分析结果如图3-4所示,从图3-4中可以看出样品分层主要是在芯片正面,其中失效品1正面塑封料已经碳化,塑封料与芯片之间分层,塑封料和引线框架之间分层,失效品2正面塑封料和引线框架之间分层。样品背面未见有明显的分层现象。

2.1.3 X射线检查

翻转课堂:教师在课堂上提供知识的讲解,学生在课后完成练习和作业,即常规传统的课堂教学模式。然而,翻转课堂则要求学生在课前完成知识点的学习,课堂变成了学生之间、教师与学生之间相互与交流的场所,如知识点的举一反三、灵活运用、答疑解惑等,这样学生与学生之间,教师与学生之间更容易产生知识点和思想火花的碰撞,从而取得更理想的教学效果。教学视频短小精悍、教学信息清晰明确、重新建构学习流程、复习检测方便快捷是“翻转课堂”四大鲜明的特点。

样品开封的目的是为了暴露封装内部器件芯片,以便检查失效样品内部的组装是否符合要求,是否存在与失效模式有关的内部结构异常或缺陷。由于样品是塑料封装,所以采用化学开封方法对失效样品进行开封。失效样品开封后整体及内部芯片烧毁形貌如图5所示,从图5中可以看出样品输入端烧毁,烧毁的中心区域位于与输入引脚相连的MOS1区域,烧毁处附着碳化的塑封料,金属化铝热熔融,呈现出典型的过热烧毁特征。使用干法刻蚀手段去除芯片表面的钝化层,样品整体形貌及输入端形貌如图6所示,可见样品与输入端相连的MOS1大面积烧毁,并且烧毁处可见多处熔坑。

经济中的人口可按未成年人口、劳动力人口和老年人口分为三类群体。由于本文重点分析人口老龄化效应,且未成年人口对经济增长并无贡献作用,因此令:L为总人口数,L1为劳动人口数,L0为老年人口数,L=L1+L0。定义变量P为老年人口数占总人口数的比重,表达式如下:

图2 样品在X射线下及取下后PCB板铜箔上的的空洞形貌

图3 样品正面C-SAM形貌

图4 样品背面C-SAM形貌

图5 样品开封及内部芯片烧毁形貌

图6 样品芯片去层后整体及输入端形貌

2.1.6 扫描电子显微镜 (SEM)观察

为了更加清晰地观察失效样品内部芯片烧毁的形貌,以及内部芯片是否存在缺陷,采用扫描电子显微镜 (SEM)对失效样品芯片进行放大观察,典型的形貌如图7所示。从图7中可以看出,失效样品芯片MOS1大面积烧毁,烧毁处硅熔融,可见多处熔坑,呈典型的过热烧毁形貌。

2.1.5 开封、内部目检

图7 样品内部烧毁形貌扫描电镜图

为了检查样品内部的缺陷、损伤,利用X射线检测系统对失效样品进行检查。结果如图2所示,从图2中可以看出样品内部的芯片区域存在大面积的空洞。为了分辨样品空洞所在的具体位置,将失效样品取下进行观察,发现空洞位于样品散热基板与PCB铜箔之间。由于DC to DC芯片属于发热较严重的元器件,芯片与PCB铜箔之间的接触是散热的主要途径,空洞的存在会导致样品散热能力变差。

由以上分析结果可见,失效样品芯片烧毁的区域主要位于输入和输出端的2只MOS管区域,烧毁都呈现过热过功率烧毁的特征。从对样品进行的X-ray检查的结果可知,失效样品背面金属散热基板与PCB铜箔之间存在大面积的空洞,大面积的空洞会导致样品通过芯片基板向外散热的能力变差,而这是样品的主要散热通道,从而导致样品散热不良,使工作温度接近上限的样品的温升进一步地升高,最终导致样品内部的芯片因过热而被烧毁。

2.2 现场测试

为了验证实验室分析结果,现场诊断的过程中,抽取某型号的打印机产品现场进行热试验,试验现场如图8所示。在打印机内部各个易发热部位使用专用胶水粘贴热电偶,让打印机模拟实际的工作状态,即持续打印和间断打印 (打印5 min,停机1 min),在此过程中持续地监测各个部位的温度参数,结果如图9所示,发现此款DC to DC芯片 (Q303)工作过程中壳温的最高温度达到93℃。

图8 热试验现场图

图9 现场热试验测试结果

通过查阅器件的规格书,得到相关的热参数如图10所示,可见芯片结到外壳的热阻θJC为19℃/W,现场诊断发现此芯片工作状态输出为3.3 V/0.6 A,即功率为1.98 W,芯片结到外壳之间的温差可以通过热阻和功率大致计算,为19×1.98=37.62℃,当壳温为93℃时,芯片结温为93℃+37.62℃=130.62℃。规格书上对于芯片的使用温度有明确的规定,如图11所示,芯片结温最高温度为125℃,所以当打印机处于工作状态时,芯片的结温已经超出规格书规定的最高温度,与外场故障率较高的情况基本一致。

图10 DC to DC芯片规格书热参数

图11 DC to DC芯片规格书使用条件

3 分析结论

经过实验室分析结合现场诊断,可知此DC to DC芯片失效是由于样品背面金属散热基板与PCB铜箔之间存在大面积的空洞,大面积的空洞导致芯片通过基板向外散热的能力变差,而这是芯片主要的散热通道,从而导致样品散热不良,最终在打印机工作的过程中,芯片温度超出规格书规定的最高温度,导致内部芯片过热烧毁。

由于该电控板由公司负责设计,交由外协厂生产,因此,结合分析结论,建议该企业采取以下两种改进措施。

a)督促外协厂整改

其中,分散决策用上标d来表示,集中决策用上标c来表示,利益协调分配机制用上标h来表示,最优决策用上标∗来表示;分散决策下,系统的总利润函数为:

由于芯片金属散热基板与PCB铜箔之间的空洞是由芯片的焊接工艺决定的,因此可要求外协厂进行焊接工艺全面整改,并验证整改效果。

b)加强物料管控

对于电控板物料,可利用C-SAM等手段进行抽检。同时,由于芯片是由此企业购买并交付代工厂使用,因而也可采购耐高温性能更好的芯片。

4 结束语

TSQ就是将管理方法和测试实验技术有机地结合,根据企业的特点、流程,提出整体解决方案,从而达到降低不合格率和返修率,提升企业质量管理水平和实物质量的目的。本文介绍了TSQ的关键模块工具-故障根本原因分析在企业诊断当中的实际应用,明确了某企业故障频发的DC to DC芯片的失效机理,查找到了失效原因,并提出了有针对性的改善措施,从而最终提高了产品的可靠性。

参考文献:

[1]张增照.TSQ技术提升企业质量品牌竞争优势 [N].中国电子报,2012(2):19.

[2]彭文忠.质量可靠性整体解决平台 [J].中国质量,2012, 32 (9):21-23.

[3]邓永孝.半导体器件失效分析 [M].北京:宇航出版社,1991.

[4]ZHANG Zengzhao, FAN Zonghui, ZHANG Chanyu.Principles and applications of total solution for quality&reliability[J].IEEE International Conference on Reliability,Maintainablity, and Safety (ICRMS), Aug.6-8, 2014:1-5.

[5]范忠辉,张增强,陈钼,等.质量可靠性整体解决在机械装备领域的实践 [J].电子产品可靠性与环境试验,2017, 35 (5):53-59.

[6]张婵玉,徐新兵.平衡矩阵技术在TSQ诊断和工艺改进中的应用 [J].电子产品可靠性与环境试验,2017,35(6):29-33.

张婵玉,徐新兵,范忠辉
《电子产品可靠性与环境试验》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号