北京2024年9月24日 /美通社/ -- 在AI驱动的技术革命浪潮中,液冷正凭借其高密度、高功率散热的显著优势,成为新型数据中心的关键技术选项。浪潮信息对液冷技术进行了多年的探索与实践,深耕服务器液冷优化设计,除了业界目前广泛尝试的CPU和GPU液冷,对高功耗内存、固态硬盘、OCP、PCIe卡、电源等部件液冷也进行了深入研究。其中,面对内存密度和散热功耗增加的挑战,浪潮信息提出了创新的"枕木架构"内存液冷方案,比传统风冷散热效率提升一倍,在维护便捷性、系统安全性以及设备兼容性等方面具有显著优势,并已在通用高密度服务器实践应用。

内存密度和功耗增加带来新挑战,内存散热由风冷走向液冷

步入液冷时代,CPU液冷技术已逐渐成熟,随着系统性能的不断提升,对内存性能及数量的要求越来越高,而受主板空间限制,内存间距越来越小。最新第五代英特尔®至强®可扩展处理器平台支持的最窄内存间距仅为7.5mm,相比原来最高的10.7mm,缩减了30%。由此,散热功耗也随之上升,如DDR5的散热功耗可达15W,传统风冷散热将难以满足需求。尤其是在相同配置下,液冷服务器内CPU采用冷板散热,无CPU风冷散热器,导致流入内存模组的风量减少,内存风冷散热将面临更加严峻的挑战。

最窄内存间距仅为7.5mm
最窄内存间距仅为7.5mm

目前,业界内存液冷方案主要采用水冷和导热两种方式。其中,水冷方案是通过与水冷板的紧密贴合,利用冷却介质带走热量。导热方案是指内存与导热结构件紧密贴合,冷却介质给导热结构件降温,间接带走内存热量。由于热量传输路径短,在低内存配置下,业界广泛应用内存水冷方案,但随着内存配置增多,内存槽间距减小,内存水冷方案的适配性不足。

在传统的内存水冷方案中,每两条内存中间需要配置一块冷板,形成"三明治"架构,每块冷板为两片不锈钢片焊接组成,随着内存间距缩小,水冷板需要变薄,加工难度也随之增大。同时,由于主板和冷板等组件的公差累积,内存模块插拔困难,尤其是内存损坏后,单条热插拔维护困难,可能还需要拆卸更换整个内存模组,运维难度大,不仅耗时耗力,还可能导致系统停机,严重影响数据中心的运行效率和稳定性。

"枕木架构"内存液冷,解耦设计实现便捷运维

面对内存密度和散热功耗增加的挑战,浪潮信息提出了创新的"枕木架构"内存液冷方案,采用导热方式,更适合多内存配置下的液冷散热。该方案从铁路枕木设计中汲取灵感,由铝制散热片、热管、夹片和内存组成一个内存模组,类似于枕木,铺陈在两端由冷板流道构成的轨道上,通过架构创新和优化导热方式来解决内存液冷散热难题,与传统风冷散热相比,散热效率提升了一倍,实现高效散热、便捷运维。

铁轨枕木与内存枕木架构设计
铁轨枕木与内存枕木架构设计

 

铁轨枕木与内存枕木架构设计
铁轨枕木与内存枕木架构设计

"枕木架构"内存液冷方案利用内置热管的散热器将内存产生的热量传递至内存模组的两端,并通过导热垫片与两侧的冷板接触,最终由冷板内的冷却介质带走热量,相比于传统液冷方案的"三明治"架构,有助于实现更加紧凑的内存排布主板设计,降低冷板加工难度及成本。

同时,在"枕木架构"内存液冷方案中,每条内存配备单独散热铝片,在系统外组装形成最小维护单元,极大地提高了液冷内存组装效率和可靠性,降低了内存在系统内拆装时可能对内存颗粒和导热垫片造成的损伤。内存模块的解耦设计大大提升了单条内存热插拔的便捷性,当内存损坏时,只需将该条内存模组取出维护,而不用将内存模块整体拆卸,有效解决了多内存配置下的插拔难题,大幅提升运维效率。

在实现便捷运维的基础上,"枕木架构"内存液冷方案还具有多项实用性优势。与传统的内存冷板相比,枕木架构减少了焊接点,显著降低了漏液风险。这一改进不仅提高了系统的安全性,也减少了维护成本和潜在的故障率。同时,枕木架构设计能够适应不同的内存槽位间距和颗粒厚度,展现出良好的标准化潜力,为多代内存提供了兼容的散热解决方案。

"枕木架构"内存液冷方案的诞生,是浪潮信息对传统散热技术的一次革命性突破,通过巧妙的结构设计,升级了当前内存液冷方案,解决了内存散热及维护难题,为内存液冷提供了更加便捷高效、安全可靠的优选方案,为数据中心的绿色发展提供强有力的技术支撑。