人工智能与高性能计算(HPC)正以空前的速度发展,将动态随机存取存储器(DRAM)和NAND闪存等传统存储技术发挥到极致。为了满足人工智能时代日益增长的需求,业界正在探索超越传统存储技术的新兴存储技术。
在这些新兴存储技术中,因其能够填补DRAM和NAND闪存之间的性能差距,储存级内存(SCM,Storage-Class Memory)1已然成为关键的发展方向。了解到SCM的潜力后,SK海力士开发了仅选择器存储器(SOM,Selector-Only Memory)2。这项突破性的创新,重新定义了SCM,并增强了公司在面向AI的存储产品阵容方面的实力。
1储存级内存(SCM,Storage-Class Memory):一种新兴的非易失性存储技术,将DRAM的速度与NAND闪存的持久存储能力相结合。在性能、成本和存储容量方面,该技术弥补了DRAM和NAND闪存之间的差距。
2仅选择器存储器(SOM,Selector-Only Memory):一种采用硫属化物薄膜制作而成的交叉点存储器器件,可同时执行选择器和存储器的功能。
Rulebreakers’ Revolutions系列最终篇文章将全面介绍SOM研发背后的历程,以及SK海力士严谨的研发方法所起到的关键作用,同时探讨此项技术对人工智能和高性能计算未来发展的影响。
使命:通过下一代SCM超越传统存储器
人工智能时代的到来引发了数据爆炸式增长。从大语言模型(LLMs)3到多模态AI(Multimodal AI)4,各类AI系统均需要高性能存储器以实现快速访问和处理海量数据,并执行复杂计算。然而,想要实现这种下一代性能,必须在成本效益和能源效率之间取得平衡,这无疑对存储技术提出了更高的要求。
3大语言模型(LLM):以海量文本数据为基础进行训练的高级人工智能系统,能够根据提供的上下文理解和生成类人文本。
4多模态AI(Multimodal AI):一类机器学习模型,能够处理和整合包括文本、音频及视频在内的不同类型的数据。
为满足日益增长的需求,高性能计算系统正逐步从传统的以CPU为中心的架构向以存储为核心的架构转型。这些以存储为中心的系统通过在存储器中直接支持数据处理,最大限度地减少了数据移动,从而显著提升了系统性能和效率。
在这一转变过程中,业界正在探索能够超越传统存储能力的全新存储技术。其中,作为一种有前景的解决方案,SCM应运而生,有效填补了DRAM与NAND闪存之间的性能差距。作为一种非易失性存储器,SCM兼具DRAM的速度和成本效益,以及NAND闪存的大容量。此外,CXL®5技术的出现,使得存储器与CPU、GPU和加速器等设备之间实现了无缝连接,为在高级计算中应用SCM创造了新的机遇。
5CXL®(Compute Express Link®):连接CPU、GPU、存储器和其他组件的下一代接口,有效提高高性能计算系统的性能。
在了解这项技术的性能后,SK海力士接受了开发下一代SCM产品SOM的挑战,该产品有望彻底改变行业格局。
SK海力士的SOM超越传统存储器,打破下一代存储器壁垒
超越3DXP:以严谨的研发与协作,解锁SOM新篇章
在研发 SOM之前,SK海力士曾通过另一项SCM技术——3D XPoint(3DXP)取得了巨大进展。研发于2010年代中期的3DXP技术,是一项非易失性存储技术,它利用相变存储器(PCM, Phase-Change Memory)6,根据材料电阻状态的变化来存储数据。该技术采用无晶体管的交叉点架构(Cross-Point Architecture)7,特点是在垂直引线的交点处布置选择器(Selector)8和存储单元。通过将3DXP存储单元堆叠成无晶体管的三维架构,该产品实现了高存储密度。
6相变存储器(PCM,Phase-Change Memory):一种能够实现纳米级非易失性电数据储存的技术。PCM存储转换所采用的加热材料,使其在非晶态和晶态之间转换,此两种状态分别对应二进制数字的0和1。
7交叉点架构(Cross-Point Architecture):一种使数据存储在网格状结构中两条或多条线的“交叉点”处的存储器架构。
8选择器(Selector):在存储阵列中,一个用于调节流向和流出存储单元的电流的器件,帮助实现特定单元的精确访问,同时阻断不需要的路径,以实现更准确的读取和写入操作。
尽管3DXP具有一定潜力,但SK海力士发现当它面向20纳米级以上的工艺技术时,其可扩展性会遭遇瓶颈。因此,公司将重心转向了具有替代性的下一代SCM产品。公司着手研发了SOM,这是一种开创性的交叉点存储器件。该器件采用了一种名为双功能材料(DFM,Dual-Functional Material)的单层硫属化物(Chalcogenide)9薄膜,能够同时实现选择器和存储器的功能。与3DXP技术相比,SOM无需单独设置选择器和PCM。换而言之,SOM中的选择器无需配备独立存储单元,从而提升了选择器的功能性。此外,SOM采用了优化的交叉点阵列,使其具有更低的存储单元堆叠纵横比(Aspect Ratio)10,以实现更好的可拓展性和更大的存储密度。
9硫属化物(Chalcogenide):一种由至少一个硫属阴离子(如硫)和一个电正性元素(如金属)组成的化学化合物。
10纵横比(Aspect Ratio):存储单元的高度与宽度的比例。
与3DXP技术相比,最大的变化之一是用双功能材料(DFM)替代相变材料。这一转变使得SOM具备了先进的规格。首先,与相变材料不同,DFM不需要时间来执行相变,因此其写入速度得到了显著提升。尽管相变材料在相变过程中需要高写入电流来进行焦耳加热,但使用DFM可以显著降低所需的写入电流。此外,DFM在高温下运行时表现出更高的稳定性,有效减少了热干扰(Thermal Disturbance)11。相较于相变材料,DFM提升后的耐热性确保了其具有更优异的循环耐久性,从而提高了整体的耐用性。
11热干扰(Thermal Disturbance):一种现象,对一个存储单元进行编程时产生的热量,由于热扩散而意外影响了相邻单元的状态,从而可能破坏数据的完整性。
SOM用DFM取代3DXP技术所采用的相变材料
如果没有SK海力士严谨的研发态度和高效的内部协作,SOM的成功开发将难以实现。例如,公司在研究基于硫属化物的选择器和存储器材料时发现了DFM。通过采用全新的双极运行模式代替传统的单极运行方式,团队成功地同时实现了选择器和存储器的功能特性。
相较于开发前的预期,SK海力士在研发过程中大幅降低了SOM的功耗。当传统优化方法被证实不足以满足需求时,公司决定全面审视材料、设计和运行算法。为此,各个研究团队齐心协力,共同推进该项目,并探索新方法。通过模拟测试,他们评估了新材料和运行技术的应用情况,有效解决了所有潜在问题。这一严谨的过程使功耗相比初步预测降低了约三分之一,是SOM开发过程中的一项关键进展。
揭秘全球最小的SOM
SK海力士成功研发出全球最小的SOM,这是首个全集成(Fully Integrated)12的16nm半间距(Half-Pitch)13SOM产品。在备受瞩目的2024年度IEEE VLSI技术与电路研讨会(2024 VLSI Symposium)上,这一在SCM领域具有革命性意义的成果正式发布。
12全集成(Fully Integrated):与学术研究中基本的单个存储单元原型不同,在单元阵列级别实现电路和制造工艺的完全集成。
13半间距(Half-Pitch):在一个半导体中,互连线之间最小中心距离的一半。
与3DXP技术相比,SOM的写入速度从500纳秒(ns)缩短至30纳秒,写入电流也从100微安(µA)降低到20微安。此外,循环耐久性从1000万次提升至超过1亿次,这一数据充分体现了SOM在耐用性方面的显著增强。此外,SOM还具备出色的持久性,能够在极端条件下有效保留数据。测试结果表明,在125°C的高温环境中,它仍能保持数据存储时间超过10年。
SOM提供了从超快的写入速度到卓越的数据持久性等方面的突出性能
值得关注的是,这款16nm的SOM是目前市场上最小、最具可拓展性和高性能的交叉点存储解决方案。随着人工智能领域的不断发展,SOM的成功研发巩固了SK海力士在面向AI的存储器领域的主导地位,与HBM、AiMX以及CMM-DDR5等产品形成了良好的互补。
展望未来,针对SOM的研究将极大地推动下一代存储技术的广泛进步。其影响力已延伸至蓬勃发展的异构集成领域,使得专为AI数据中心及诸多AI解决方案供应商量身定制的创新系统集成方法得以实现。随着计算架构逐渐转向以存储为中心的计算模式,SOM的技术革新将在塑造人工智能和高性能计算未来方面发挥关键作用。
打破常规者专访:全球RTC,金明烨TL
为了进一步了解SK海力士在SOM开发方面的创新方法,本文采访了全球革命性技术中心(Global RTC, Global Revolutionary Technology Center)(负责下一代半导体研发工作)的金明烨TL。他分享了在开发SOM过程中所面临的主要挑战,以及员工们所采用的打破常规的思维方式。
在SOM开发过程中,您面临的主要挑战是什么?
“主要挑战在于决定成为行业的先行者,着手研发全球首款16nm半间距的SOM。这一过程涉及从专注于传统基于PCRAM的3DXP存储器,过渡到同时为SOM的可拓展性和性能优势做好充分准备,这其中蕴含着诸多不确定性。”
在主导SOM研发工作的过程中,你最自豪的时刻是什么?
“在2022年的IEEE国际电子器件会议(IEDM)上,我们率先在业内提出了SOM潜在的性能和可拓展性优势。随后,在2024年的超大规模集成电路(VLSI)国际研讨会上,这些主张得到了有力验证。那一刻,我感到无比自豪。会议中,我们展示了全球首款全工艺集成且半间距为16nm的SOM研究成果,成功实现了业内的最小尺寸。”
SK海力士企业文化的哪些方面,有助于激发创造力并克服局限性?
“首先,SK海力士的新行为准则是基于SK管理体系(SKMS)中的VWBE14价值观,及SUPEX15原则而建立的。尤其值得一提的是‘提升标准’和‘一个团队’协作理念,前者鼓励员工在追求卓越的过程中不断设定更高的标准,后者则倡导成员们将彼此视为一个团队紧密协作。正是因为这些指导原则,使我们持续展现出无尽的创造力,不断实现突破性的成就。”
14自觉自愿地发挥才智(VWBE, Voluntarily and Willing Brain Engagement):是SK管理体系(SKMS)中强调的员工价值观之一。
15SUPEX:SK海力士的“SUPEX”理念蕴含着实现“人类可以达到的最佳水平”的意义,代表了公司实现尽可能高水准的使命。
“总之,我认为创新的秘诀是:以挑战精神拥抱新变化;在不确定面前勇于尝试、不惧失败,并灵活地汲取新知。”
本系列其他文章
[Rulebreakers’ Revolutions] MR-MUF热控技术取得突破,HBM迈向新高度
[Rulebreakers’ Revolutions] SK海力士全球首次应用HKMG工艺,突破移动端DRAM微细化壁垒
[Rulebreakers’ Revolutions] 创新设计方案带领HBM3E攀登新高峰
[Rulebreakers’ Revolutions] SK海力士如何在多样化服务器CPU市场中实现服务器DRAM验证流程的成功
[Rulebreakers’ Revolutions] 面向当今数据中心的灵活协作式 eSSD 虚拟化开发
[Rulebreakers’ Revolutions] SK海力士以设计创新,赋能GDDR7速度突破新界限
[Rulebreakers’ Revolutions] CXL技术如何在人工智能时代扩展数据中心存储容量的极限