-
- SK海力士携手英特尔共同发布关于DDR5应用于英特尔CPU的性能验证白皮书
- 较上一代产品,SK海力士DDR5 DRAM使服务器带宽提升70%,功耗降低14.4%
- SK海力士计划将获取性能认证的DDR5 DRAM作为主力产品,加速改善公司下半年的业绩
9月14日,SK海力士宣布与英特尔公司(Intel)共同发布白皮书,该白皮书证实,SK海力士DDR5服务器DRAM搭载英特尔CPU,其性能达到了行业领先水平。该白皮书在SK海力士和英特尔官方网站同时发布。
自DDR5 DRAM研发阶段,两家公司就开展了紧密合作。白皮书介绍了在过去8个月中,第四代英特尔®至强®可扩展处理器1 (4th Gen Intel® Xeon® Scalable Processor,以下简称第四代至强处理器)搭载DDR5 DRAM进行性能验证所得出的结果。
近年来,服务器行业对低功耗、高性能半导体的需求日益增长。白皮书中强调,此次两家公司将通过提供性能及能源效率均为行业领先水平的存储器和CPU,携手开启一个推动数据中心进化的新时代。
白皮书指出,英特尔第四代至强处理器的性能较第三代提高了2.9倍2。同时,SK海力士DDR5 DRAM的功耗较DDR4 DRAM降低14.4%。特别是在功耗与性能的比率(效能功耗比)3上,在适用第四代至强处理器的服务器中DDR5与DDR4相比,其整数计算(Integer)和浮点运算(Floating Point)4方面分别高出1.22倍和1.11倍。
因此,两家公司预测,如果服务器客户未来利用第四代至强处理器和DDR5搭建数据中心,将有助于改善能源效率,构建可持续的数据中心。此外,通过高效运营数据中心,客户总体拥有成本(TCO)5也会有所降低。
SK海力士DRAM商品企划担当副社长柳成洙表示,“如白皮书中所展示,使用搭载英特尔CPU和SK海力士DDR5 DRAM的服务器,相较上一代产品,数据处理速度更快,功耗更低。特别是在生成式人工智能(Generative AI)等应用中,可以有效运用需要处理海量数据的高密度的DRAM。”
柳副社长还补充道:“期待我们的服务器芯片客户能够从白皮书提供的重要数据中受益,有效帮助其业务发展。”
英特尔内存与IO技术副总裁Dimitrios Ziakas博士表示:“英特尔一直与SK海力士及行业的其他厂商保持合作,以通过第四代英特尔®至强®可扩展处理器实现DDR5的最佳运行环境与性能表现。这些努力都是为了提供强大的、兼备卓越性能和能效的数据中心系统解决方案,使我们的共同客户受益”。
SK海力士计划通过与英特尔最新的合作项目,继续加强服务器市场的产品布局。根据预测,下半年市场对DRAM需求将会增长,公司计划以第四代(1a)及第五代(1b)DDR5 DRAM为主力产品加强市场领先竞争力,并加速改善业绩。
[参考] 英特尔与SK海力士合作发布的DDR5生态系统白皮书主要内容(点击查看白皮书全文)
- 白皮书概要:带宽提升70%6,功耗降低14.4%7,整数计算提高1.59倍。
白皮书包含了服务器客户在使用DDR5产品时可以参考的详细测试数据,主要内容涵盖了第四代至强处理器与DDR5存储器结合时所体现的速度、性能、功耗等。
图1: SK海力士DDR4和DDR5的服务器带宽对比
首先,同在3,200Mbps的传输速率下,DDR5相较于DDR4,其服务器带宽(Server Bandwidth8)增加了20%。实际上,DDR5在4,800Mbps传输速率下的服务器带宽,比DDR4最高速率3,200Mbps的服务器带宽提高了70%9。这是DDR5改进设计结构的结果,与DDR4相比,它最大限度地减少了内部传输延迟并允许更高的传输速度,扩大了服务器的整体带宽。
图2: SK海力士DDR4和DDR5的传输速度和功耗对比
此外,本项研究中,SK海力士还证实了DDR5的功耗较DDR4减少14.4%。在此过程中,HKMG(High-K Metal Gate)等新技术发挥了重要作用。HKMG是在DRAM晶体管内的绝缘膜上采用高K栅电介质,在防止漏电的同时还可以改善电容(Capacitance)的新一代工艺。采用该工艺的存储器具备更高的功耗效率。
研究结果表明第四代至强处理器的内置加速器表现也较为出色。与上一代处理器相比,企业使用该内置加速器处理目标工作负载时,每瓦(watt)性能效率可提高2.9倍。通过这些技术的综合应用,第四代至强处理器和DDR5实现了将服务器带宽提高50%,同时功耗减少14.4%的优异效能功耗比。
通过发布白皮书,可以确认第四代至强处理器和DDR5组合系统下的运算性能,两家公司利用系统测试工具“SPEC CPU 2017”对此进行了性能比较。
结果显示,与上一代系统相比,整数计算和浮点运算分别改善了1.59倍和1.43倍。单位功耗下的系统性能也表现十分出色,在整数计算和浮点运算中分别提升了1.22倍和1.11倍。
在内存延迟及速率测试工具“Intel MLC(Intel Memory Latency Checker)”的验证下,系统性能也同样突出,跟上一代相比,读取性能和写入性能分别提升1.4倍和1.51倍。
“英特尔”、“英特尔logo”或其它“英特尔标志”等商标权均归英特尔公司或其子公司所有。
1第四代英特尔®至强®可扩展处理器(Intel® Xeon® Scalable Processor):是英特尔新一代服务器,用CPU支持PCIe Gen5及新一代DDR5内存标准。
2相较于上一代英特尔®至强®可扩展处理器,在同等工作量下,搭载嵌入式加速器,其效能功耗比率提升了2.9倍。
新配置:1-节点,2个预生产的第四代英特尔®至强®可扩展处理器(60核),含英特尔®存内分析加速器(英特尔®IAA),基于预生产的英特尔平台和软件,启用超线程,启用睿频,总内存1024GB,(16x64GB DDR5 4800), 微代码 0x2b0000a1,1×3.84TB P5510 NVMe,英特尔®以太网控制器X540-AT2, Ubuntu 22.04.1 LTS, 5.18.12-051812-generic, QPL v0.2.1,accel-config-v3.4.6.4, ZSTD v1.5.2, RocksDB v6.4.6 (db_bench), 英特尔于2022年11月进行测试。基准:1-节点,2个第三代英特尔®至强®可扩展处理器(40核)搭载超微SYS-220U-TNR,启用超线程,启用睿频,关闭SNC,总内存1024GB (16x64GB DDR4 3200),微代码0xd000375, 1×3.84TB P5510 NVMe,英特尔®以太网控制器X540-AT2, Ubuntu 22.04.1 LTS, 5.18.12-051812-generic, ZSTD v1.5.2, RocksDB v6.4.6 (db_bench), 英特尔于2022年11月进行测试。
3效能功耗比 (Performance per watt):每一定单位功率每秒可处理的数据容量指标。
4浮点运算(Floating Point):浮点数表示法是与定点小数法相对的概念,它通过改变小数点的位置来区分整数和小数,并方便进行计算。例如,对于原始实数123.485,可以用1.23485×10^2或0.00123485×10^5等表示方式进行计算。
5总体拥有成本(Total Cost of Ownership, TCO):包括初期投资、电力费、设施运营费、维护费等在内的所有成本。
6该数据由SK海力士在2022年12月运行的模拟实验中得出。
7基于SK海力士功耗计算器模拟计算得出的DDR4及DDR5产品功耗。
8带宽: 数据传输的路径,带宽的增加意味着同时可以更有效地处理更多数据。
9带宽对比: 基于DDR4’s 3,200 Mbps的传输速率,与DDR5 3,200 Mbps 及 4,800 Mbps 传输速率的带宽对比