寿命和生命周期
生命周期指的是一个生命的发展历程:出生、成长、开花结果、回归土壤等。人类的一生由三个阶段组成——婴幼儿时期、壮年时期以及老年期。
图1. 人类生命周期的三个阶段
那么您是否知道半导体也有生命周期呢?和人类一样,半导体也有着它的“寿命”,其会随着时间的推移而逐渐老化。半导体的生命周期代表着半导体生命开始和结束之间的那段时期,它是产品可靠性的测量尺度之一。在本文中,可靠性是指在给定的使用环境条件下,某个零部件、材料、产品或系统能够在一定时间内保持所需的基本质量并执行任务的可能性。
人们经常混淆质量(Quality)和可靠性(Reliability)的概念。一般来说,质量是以”DPPM”(每百万缺陷数)为尺度来衡量的,而可靠性则以”FIT”(失效率)和“MTBF”(平均故障间隔时间)来衡量。另外,可靠性加入了”时间”的概念来估计未来的质量,这在质量本身的定义中是不存在的。可靠性相关技术是在1942年第二次世界大战期间发展起来的,旨在解决军事装备中经常出现的缺陷问题。其始于对军事装备生命周期的研究,后来受军用真空管可靠性问题的影响,专家开始积极对各种产品和零部件进行可靠性评估。
表1. 质量和可靠性之间的区别
图2所示为浴盆曲线(Bathtub Curve)。在可靠性工程中,浴盆曲线被定义为“失效率与时间的直观曲线图,阐释了产品生命周期的三个阶段”。[1]
图2. 浴盆曲线
人类的一生
正如前文所述,人类的一生分为婴幼儿时期、壮年期以及老年期三个阶段。在第一阶段,也就是婴幼儿时期,人类体力和免疫力相对较弱,疾病和相关并发症的发生率较高,死亡率也较高。因此,国家卫生主管部门将婴幼儿归类为“高风险人群”,并在发生传染性疾病时给他们提供十分谨慎的保护。鉴于此,产科和产后护理中心会针对新生儿设置单独的洁净室,以防止感染并确保安全管理。此外,父母还要给婴儿精心护理,直到他们健康长大。
图3. 新生儿洁净室
相较于其他阶段,壮年期的人类身体更为强壮,免疫力也更好,因此壮年期也被称为黄金岁月。虽然一般情况下人类在这一时期精力最为旺盛,身体也最为健康,但也需要注意防止意外事故的发生。韩国统计局关于年轻人和中年人死亡原因的调查数据显示,交通事故、癌症和自杀位居死亡原因榜单前三。此外,除自杀外,年轻人和中年人意外死亡的原因依次是交通事故、坠落、溺水和火灾。[2]这些意外事故在眨眼间就能夺走年轻、宝贵的生命,所以必须时刻保持谨慎,防止意外事故的发生。
图4. 意外事故实例
进入老年阶段,人类的生理和身体活动能力减弱,主要器官功能开始衰退,疾病发生率也明显上升。随着时间的推移,人类加速衰老,老年群体死亡率也因此上升。韩国统计局关于65岁或以上老年群体死亡原因的调查数据显示,癌症位列第一,其次是心脏病和脑血管疾病。[2]癌症属于致命性疾病,会导致细胞紊乱。纵观人类整个生命周期,癌症是导致死亡的最主要原因。长期饮食和生活习惯等外部因素,以及家族史等遗传因素,是引发癌症的主要原因。
图5. 晚年生活
半导体的生命周期
与人类生命周期类似,半导体的生命周期同样可以分为三个阶段。如图6曲线图所示,半导体可以被一个名为浴盆曲线的模型分为“早期失效期”、“使用寿命期”和“耗损失效期”三个阶段,分别对应于人类生命周期的婴幼儿时期、壮年期以及老年期。下图中的红色曲线代表“观察到的半导体失效率”,是浴盆曲线各阶段失效事件分布曲线的综合体现。各阶段的失效原因和失效模式1截然不同。接下来,我们来看看各阶段失效事件的类型和特征。
图6. 半导体浴盆曲线
首先,“早期失效期”就如人类婴幼儿时期,在该阶段,随着时间的推移,失效率会逐渐降低。这一阶段也被称为“infant mortality”或“early failure”。由于这一时期的失效率是半导体的初始缺陷造成的,所以这期间的失效率被称为早期失效率(EFR)。而鉴于失效率是随着时间逐渐降低的,所以也称其为递减失效率(DFR)。在这一阶段,质量问题引发的失效事件主要由制造过程中的缺陷或设计错误导致。早期失效期通常会持续几个月到一年时间。为此,半导体制造商会通过“老化2”测试提前剔除潜在缺陷器件。在这一阶段发生的失效事件可以通过完善设计和加强质量控制来改善。
图7. 老化测试的效果
在经历了“早期失效期”后,半导体会进入“偶然失效期”,此时失效率处于浴盆曲线最低水平,并随着时间的推移保持在恒定水平。顾名思义,在这一阶段,失效事件主要由偶发事件造成。“偶然失效期”也称为“使用寿命期”。无论何时,应力引发的失效事件都具有恒定失效率(CFR)。例如:由用户操作期间的静电引起的静电放电(ESD)3缺陷、由过压引起的过电应力(EOS)4缺陷以及由闩锁5引起的偶然失效模式。
最后,“耗损失效期”是指失效率随着时间的推移逐渐增加的阶段,或者产品经历“偶然失效期”后到达的寿命末期阶段。这一阶段通常被称为“耗损失效期”。在这一阶段,内在故障发生的频率更高,失效率随着产品使用寿命的增长而逐渐增加。这一阶段的失效率称为递增失效率(IFR)。当材料的损坏累积和耗损缺陷随着时间的推移而增加时,就会出现耗损失效型缺陷模式。取决于系统情况,由电迁移(EM)6、时变击穿(TDDB)7、热载流子注入(HCI)8和热疲劳引起的半导体物理缺陷类型可能在几年到几十年内发生。因此,为了探究这一阶段缺陷递增的趋势和类型,应利用可靠性裕度测试,即通过施加极端测试条件、延长评估时间等来检查缺陷模式。[3]
梦想成真——半导体可靠性的提高
从2000年到2019年,人类预期寿命增加了6年多。[4]随着尖端科学技术的进步,提高半导体存储器可靠性的梦想也正在逐步实现。在动态随机存取存储器(DRAM)中,一个晶体管和一个电容器构成一个单元,即基本单元。例如,16GB的DRAM表明一个芯片中有160亿个单元。然而,只要这160亿个单元中有一个出现故障,整个芯片都将被归为缺陷芯片,因此,整个系统对于质量和可靠性的需求非常高。为了应对这一点,新一代DRAM标准DDR5采用In-DRAM ECC9可靠性改进设计方案。In-DRAM ECC由与系统ECC一致的ECC码组成,能够自行更正DRAM单元中的1位错误。此外,由于它可以纠正先前DDR4系统中无法纠正的缺陷,整个系统的可靠性将可以被极大提高。通过这项技术,采用SK海力士DDR5的系统韧性有望比上一代提高20倍。[5]
在第四次工业革命时代,随着5G、自动驾驶汽车、人工智能、智慧医疗等信息通信技术的快速进步,与“人类生活和信息安全”紧密相关的设备数量将有所增加。同时人们也将更加重视设备的可靠性。在这个全新的时代,“高可靠性”将和“高带宽、低功耗和高容量”一同构成最新的客户需求。因此,为了满足这一时代的需求,SK海力士将一如既往的致力于为客户提供高度可靠的产品。
图8. In-DRAM ECC应用于DDR5的可靠性改进效果
术语的定义
1失效:指产品无法根据最初设计执行所需功能,并丧失相关功能。
2老化(测试):指在“早期失效期”预先剔除可能存在缺陷的半导体产品的半导体测试。在这一过程中,通过在半导体产品上施加超出工作条件(如电压和温度等)的加速应力来检测早期缺陷。
3静电放电(ESD):指释放静电。就半导体而言,静电放电保护电路用于防止外部或内部静电造成的损坏。
4过电应力(EOS):指会导致半导体器件损坏的过度电击。外部过量电流或电压引起的过电应力会导致半导体布线、器件等大范围损坏。
5闩锁:由于外部电压波动、电噪声或电离辐射,位于CMOS产品中的寄生双极晶体管被导通。因此,闩锁指的是由于产生的瞬态电流而使产品无法正常使用。
6电迁移(EM):当向半导体金属线施加高密度电流时,构成金属布线的原子会出现质量传输现象。
7时变击穿(TDDB):一种依据从向氧化膜施加电场到介电击穿所花费的时间来评估氧化膜可靠性的方法。
8热载流子注入(HCI):一种通过向金属氧化物半导体场效应晶体管(MOSFET)的漏极区域施加电场应力来预测受热载流子影响的器件劣化程度和寿命的评估方法。
9纠错编码(ECC):当DRAM单元发生错误时,能够识别和纠正错误的一种编码。
参考文献
[1] JEDEC, JESD74D, “Early life failure rate calculation procedure for semiconductor components”, 2007 Feb
[2] Statistics Korea, “Cause of Death Statistics in 2019”, 2020 Sep
[3] JEDEC, JEP122H, “Failure mechanisms and models for semiconductor devices”, 2016 Sep
[4] WHO, Leading causes of death and disability 2000-2019: A visual summary, https://www.who.int/data/stories/leading-causes-of-death-and-disability-2000-2019-a-visual-summary
[5] SK hynix newsroom, “SK hynix Launches World’s First DDR5 DRAM”, Press Center, 2020 Oct, https://news.skhynix.com/sk-hynix-launches-worlds-first-ddr5-dram/
金相德 撰写
Vice President and Head of Advanced Quality & Analysis at SK hynix Inc.
李吉宰 撰写
Project Leader (PL) of Reliability Quality Engineering at SK hynix Inc.
曹世珉 撰写
Technology Leader (TL) of Reliability Quality Engineering at SK hynix Inc.