前言
随着人工智能、大数据、AIGC 等技术的爆发式增长,服务器芯片功率密度持续攀升,传统风冷技术受限于空气低导热系数、低比热容的物理特性,难以满足高热流密度散热需求。液冷散热技术凭借高效传热优势,成为破解算力中心“高能耗、高散热压力”的关键路径。冷板式液冷技术克服了浸没式、喷淋式液冷对设备改造要求高、成本高的短板,又实现了对传统风冷系统的跨越式升级,能够将算力中心PUE降至1.2 以下,支持单机柜功率密度从风冷的8-10kW提升至30kW以上。
本文基于冷板式液冷技术的发展逻辑与产业实践,系统梳理其发展必然性、技术原理、系统架构、关键部件、解决方案及维护管理要点,深入剖析技术特点与应用场景,并展望未来发展趋势,旨在为算力中心行业提供全面、专业的技术参考,助力推动算力基础设施向高效化、低碳化、智能化转型。
一、冷板式液冷发展必然性
算力中心作为数字经济的核心基础设施,正面临着功率密度激增与能效提升的双重压力,冷板式液冷技术的崛起成为行业发展的必然选择,这一必然性源于算力需求、技术瓶颈与政策导向的多重驱动。
在算力需求层面,人工智能、大数据等技术的爆发式增长,进一步推动算力中心单机功率密度提升,大型算力中心的单机架功率密度已接近8kW,大型算力中心的单机架功率密度已接近8kW。传统风冷技术依赖空气作为传热介质,受限于空气低比热容与低导热系数的物理特性,在散热效率上已触及瓶颈,无法满足高热流密度器件的散热需求。
从技术适配角度看,冷板式液冷技术具备与现有算力中心基础设施的高度兼容性。相较于其他液冷技术,冷板式液冷无需对服务器核心架构进行大改造,仅通过加装冷板模块即可实现散热升级,改造难度低、成本可控,能有效衔接存量算力中心的迭代与增量算力中心的建设,解决了新技术落地中的兼容性痛点。
在能效与政策层面,“双碳”目标下,算力中心作为高耗能场景,其PUE指标受到严格约束。冷板式液冷系统通过液体工质的高效传热特性,可将算力中心全年PUE降至1.2以下,较传统风冷系统降低0.15以上,大幅提升能源利用效率。同时液体工质的高比热容特性降低了循环系统能耗,配合余热回收技术可实现能源梯级利用,契合数据中心绿色低碳发展的政策要求。
算力中心的规模化扩张与选址灵活性需求也推动了冷板式液冷的发展。该技术省去了传统风冷系统庞大的末端空调设备,显著提升了建筑空间利用率,且受地理位置与气候条件的限制更小,能够实现全国范围内的低PUE运行部署,满足算力资源分布式布局的现实需求。
二、冷板式液冷技术原理
冷板式液冷技术是一种间接接触式散热方案,其核心原理是通过金属冷板作为传热中介,将发热器件产生的热量传递至循环流动的冷却液中,再通过热交换系统将热量最终排放至外界环境,整个过程遵循热传导与强制对流换热的基本规律,实现发热器件的精准降温。
具体传热路径可分为四个关键环节:
热传导环节,冷板通过机械压力或导热介质与服务器芯片、显存等核心发热器件紧密贴合,发热器件运行产生的热量借助固体导热原理,从器件表面传递至冷板金属基体。冷板通常采用铜、铝等高热导率材料制造,能够快速构建热量传递通道。
对流换热环节,在循环动力模块的驱动下,低温冷却液进入冷板内部流道,与冷板内壁形成强制对流换热。冷板内部通常设计有微通道、肋片等强化结构,这些结构能够增大换热面积并破坏边界层,提升冷却液与冷板之间的传热系数。冷却液吸收热量后温度升高,完成从冷板到液体工质的热量转移。
系统热量输运环节,吸收热量后的高温冷却液通过管路系统输送至热交换模块,在模块内部与一次侧冷源进行热量交换。该环节依赖液体工质的高比热容特性,远高于空气的1.01kJ/(kg·K)),在较小的流量下即可实现大量热量的高效输运,降低系统循环能耗。
热量排放环节,通过热交换模块转移至一次侧的热量,经冷却塔、干冷器等设备传递至大气环境中,完成整个散热循环。在部分场景下,高温冷却液携带的热量还可通过余热回收装置进行梯级利用,转化为热水等可用能源,实现能源的高效配置。
根据冷却液在散热过程中是否发生相态变化,冷板式液冷技术可分为单相与两相两类。单相系统中冷却液始终保持液态,仅通过温度变化实现热量传递;两相系统中冷却液在冷板内吸收热量后汽化,利用相变潜热强化散热,散热能力可达300W/cm²以上,但技术成熟度与产业链完善度仍待提升。目前,单相冷板式液冷因技术成熟、成本可控成为市场主流应用方案。
三、液冷技术分类
液冷技术依据不同的分类标准可划分为多个类别,核心分类维度包括传热介质与发热器件的接触方式、冷却液是否发生相态变化,不同分类体系下的技术路线在原理、性能与应用场景上存在显著差异。
(一)按接触方式分类
根据冷却液是否直接接触发热器件,可分为间接接触型与直接接触型。
1.间接接触型液冷:以冷板式液冷为典型代表,其核心特征是发热器件与冷却液之间存在金属冷板等隔离介质,热量需经固体传导后再传递至液体工质。该优势在于兼容性强,无需对服务器内部元器件进行防水改造,可直接适配现有硬件架构,且冷却液选择范围广,维护成本较低。
2.直接接触型液冷:包括浸没式液冷与喷淋式液冷两种主要形式。浸没式液冷将服务器整机或核心部件完全浸入不导电的冷却液中,通过液体直接接触实现热量交换;喷淋式液冷则通过喷嘴将冷却液雾化后直接喷射至发热器件表面,利用喷淋冲击与相变实现高效散热。直接接触型液冷的散热效率更高,但对冷却液绝缘性要求严格,且对设备改造与维护技术要求较高,初期投入成本显著高于冷板式。
(二)按冷却液相态变化分类
根据散热过程中冷却液是否发生气液相转化,可分为单相液冷与两相液冷,该分类标准适用于所有液冷技术路线。
1.单相液冷:冷却液在整个散热循环中始终保持同一相态,仅通过温度升高实现热量吸收,在放热端通过温度降低完成热量释放。单相冷板式液冷是该类别的典型应用,技术成熟度高,系统稳定性强。其不足在于散热能力受限于冷却液的比热容与温度差,对于极高热流密度场景适配性有限。
2.两相液冷:冷却液在吸热端吸收热量后发生汽化相变,利用相变潜热实现高效热量传递,在放热端通过冷凝重新转化为液态。该技术的散热能力远超单相液冷,尤其适用于300W/cm²以上的高热流密度场景。两相冷板式液冷虽具备潜力,但受限于相变换热的复杂性与系统控制难度,目前仍处于技术攻坚阶段,尚未实现大规模商业化应用。
(三)按冷板覆盖范围分类
该分类专为冷板式液冷技术定制,根据冷板覆盖的发热器件范围可分为局部液冷与全液冷。
1.局部液冷:冷板仅覆盖服务器中的高功耗核心器件,通过精准散热解决主要热源问题,剩余约30%的热量则通过机房空调或液冷背门等辅助风冷系统带走。该方案改造成本低、实施灵活,是存量算力中心升级的优选方案。
2.全液冷:通过定制化冷板设计,覆盖服务器所有发热器,实现100%热量的液冷散热,无需辅助风冷系统。该方案散热效率更高、系统集成度强,但对设备结构改造要求高,更适用于新建高功率密度算力中心。
四、冷板式液冷系统架构
冷板式液冷系统采用“一次侧-二次侧”双循环架构设计,通过冷热隔离与能量梯级传递实现高效散热,两个系统既相互独立又协同工作,共同保障算力中心的散热需求。这种架构设计不仅提升了系统的灵活性与可靠性,还为不同场景下的冷源配置提供了适配空间。
(一)一次侧系统
一次侧系统又称冷源侧系统,核心功能是提供稳定的冷量供给,并将二次侧传递的热量最终排放至外界环境,是整个液冷系统的能量输出端。其组成包括冷源设备、循环管路、动力模块及辅助控制组件,系统设计需紧密结合项目所在地的气象条件与二次侧冷量需求。
1.核心组成
冷源设备:根据制冷方式可分为机械制冷与自然冷却两大类。机械制冷系统主要采用风冷冷冻水系统、水冷冷冻水系统等,可提供12℃-18℃的中温冷冻水,适用于高温高湿等恶劣气候条件;自然冷却系统则通过开式冷却塔、闭式冷却塔、干冷器等设备,利用室外空气冷量实现散热,可提供30℃以上的冷却水,在温带及寒带地区可实现全年免机械制冷运行。冷却塔与干冷器用于一次侧系统的热量排放。干冷器则通过管内液体与管外空气的强制对流换热实现散热,无需消耗水资源,适用于缺水地区,但夏季高温时需配置喷淋或湿帘系统增强散热。
板式换热器:板式换热器是连接一、二次侧的关键设备,由一系列波纹状金属板片组成,板片间形成细小流道,一、二次侧冷却液通过板片进行热交换,不直接接触。其优势在于换热效率高、体积小、易拆卸清洗,适用于液-液换热场景。板式换热器的选型需匹配系统换热量与流阻要求,板片材质通常选用不锈钢或钛合金,以适应不同冷却液的腐蚀性,密封垫则需选用耐温、耐化学腐蚀的橡胶材料,确保无泄漏运行。

循环动力与换热组件:包括循环水泵、板式换热器等关键设备。
循环动力模块为冷却液的流动提供驱动力,其性能直接影响冷却液的流量稳定性与系统能耗。该模块主要由循环泵、驱动电机与控制单元组成,核心部件为循环泵。循环泵的选型需基于系统流量需求、管路压力损失与运行可靠性综合考量。关键性能指标包括流量范围、扬程、效率与可靠性。流量范围需匹配系统冷负荷,通常按设备最大功耗的1.2倍设计,确保散热冗余;扬程需覆盖管路沿程阻力与局部阻力之和,预留10%-20%的余量;泵组效率应不低于70%,以降低系统运行能耗。为提升可靠性,循环泵通常采用冗余设计,单台故障时自动切换至备用泵,保障系统连续运行。
驱动电机与控制单元需实现泵组的精准调速,通过变频控制技术,根据发热器件的实时功率调节泵组转速,实现流量的动态匹配,避免能耗浪费。控制单元需具备过载、过流、缺水保护功能,与系统监控平台联动实现状态预警。
控制模块:通过温度传感器、压力传感器实时监测系统状态,根据室外环境温度与二次侧供液需求,自动切换制冷模式。
2.运行特性
一次侧系统的供液温度需结合当地气象条件与二次侧需求确定,推荐供水温度不超过35℃,在冷却需求许可时可采用W45或W+供水温度以减少机械制冷能耗。系统供回水温差通常控制在6℃-10℃,较大的温差可降低循环流量,减少动力系统能耗。根据应用场景不同,一次侧可采用多种组合方案:高热高湿地区常用“冷水机组+冷却塔+板换”方案;缺水地区适合采用集成干冷器的风冷冷水机组;全年低温地区则可直接采用闭式冷却塔/干冷器方案。
(二)二次侧系统
二次侧系统又称末端侧系统,直接与算力设备对接,负责将服务器等器件产生的热量高效传递至一次侧系统,是散热需求的直接响应端。其架构设计强调流量均匀分配、泄漏防控与设备兼容性,核心是实现冷量的精准输送。
1.核心组成
冷量分配单元(CDU):作为二次侧系统的核心枢纽,负责冷却液的流量分配、压力调节与状态监测,具备与一次侧换热器的对接功能,可实现供液温度与流量的精准控制。
从结构组成看,CDU主要包括板式换热器、循环泵、流量调节阀、过滤器、传感器与控制系统。板式换热器实现一、二次侧流体的高效热交换,采用波纹状金属板片增大换热面积;循环泵为二次侧冷却液提供动力,通常选用低噪音、高可靠性的离心泵;流量调节阀可针对不同算力设备的散热需求,实现单路或多路流量的精准调节;过滤器则用于拦截冷却液中的杂质,保护末端冷板与设备。
CDU的性能指标直接影响系统运行效果,关键指标包括换热效率、流量调节精度、压力损失与控制响应速度。其换热效率需与系统冷负荷匹配,通常要求换热器传热系数达到2000-5000W/(m²·K);流量调节精度应控制在±5%以内,以满足不同功率器件的散热需求;压力损失需低于0.1MPa,减少循环动力消耗。在控制功能上,CDU需支持与数据中心监控系统联动,实时显示供回液温度、压力、流量等参数,具备超温、超压、流量异常等故障报警与自动保护功能。
根据安装形式,CDU可分为柜式(外置于液冷机柜)与框式(内置于液冷机柜)两种,柜式CDU适用于大规模算力集群,框式CDU则适用于高密度小型机柜场景。
末端散热组件:包括冷板模块、流体连接器与机架歧管等。冷板直接贴合发热器件,机架歧管负责将CDU输出的冷却液分配至各冷板,流体连接器则实现管路与设备的快速对接与断开。
冷板模块结构设计与材料选型决定了热传导效率,是实现精准散热的关键末端部件。
冷板的核心设计在于材料选择与内部流道结构。材料方面,需兼顾高热导率与轻量化需求,铜因导热性能优异适用于高热流密度场景,但成本较高且重量较大;铝则凭借成本优势与适中的导热性能成为主流选择,部分高端场景采用铜铝复合结构实现性能与成本的平衡。
内部流道结构是强化对流换热的核心,常见设计包括直通道、蛇形通道、微通道与分流肋片结构。冷板的流道设计需根据发热器件的功率分布与安装空间,采用仿真模拟优化,实现散热性能与压力损失的平衡。
循环管路与监测系统:管路采用环形或直连方式布置,其中环形管网因无死端、流量均匀性好的特点被广泛应用;监测系统通过压力传感器、流量传感器实时检测管路泄漏风险,通过微小压降或流量变化识别异常状态。
冷却液:关键性能指标包括比热容、导热系数、粘度、沸点与冰点。比热容与导热系数直接决定散热能力,数值越高越好;粘度需适中,过低易导致泄漏,过高则增加泵组能耗,通常要求在40℃时运动粘度低于20mm²/s;沸点需高于系统最高运行温度,冰点需低于当地最低环境温度,确保全年稳定运行。此外,冷却液需具备良好的材料兼容性,对铜、铝、不锈钢等金属无腐蚀,对橡胶密封件无溶胀,且具备低毒性、难燃性等安全特性。
2.运行特性
二次侧供液温度直接影响散热效率与设备安全性,从节能角度建议控制在40℃-48℃,同时需比室内露点温度高出2℃-3℃以防结露。供回水温差通常为5℃-10℃,需与冷板散热能力及循环流量匹配。二次侧系统采用闭式循环设计,冷却液在封闭管路内流动,可有效避免杂质污染与水分蒸发,保障系统长期稳定运行。其管路连接需采用标准化接口,便于设备维护与扩容,单个设备或管路段可通过阀门独立隔离,确保检修时不影响整体系统运行。
(三)双循环协同机制
一次侧与二次侧通过板式换热器实现能量传递与流体隔离,二次侧吸收热量后的高温冷却液进入CDU内的换热器,与一次侧低温冷却液进行热交换后降温,再重新输送至冷板模块;一次侧则将吸收的热量通过冷却塔等设备排放至外界。这种协同机制既保证了末端散热的精准性,又实现了冷源利用的高效性,同时通过隔离设计降低了设备泄漏风险,提升了系统整体可靠性。
五、冷板液冷方案技术特点
冷板式液冷方案作为当前算力中心散热的主流技术路线,其技术特点集中体现为高效性、兼容性、经济性与可靠性的平衡,满足高热流密度散热需求,及契合算力中心规模化建设与运营的实际诉求,具体可概括为以下六个方面。
(一)散热效率适配性强
冷板式液冷方案通过液体工质的高效传热特性,可实现从低功率密度到高热流密度场景的全覆盖。对于常规服务器(功率密度50-150W/cm²),采用单相冷板式方案即可将器件温度控制在85℃以下;对于AI服务器等高端设备(功率密度150-300W/cm²),通过优化冷板流道结构与冷却液流量,仍能保持稳定散热;未来通过升级至两相冷板式技术,可进一步支撑300W/cm²以上的超高功率密度需求。这种梯度适配能力使其能够应对算力设备迭代带来的散热挑战。
与传统风冷相比,冷板式液冷的散热效率提升显著。液体工质的比热容是空气的4倍以上,导热系数是空气的25倍以上,在相同散热需求下,冷却液的流量仅为空气流量的1/10左右,大幅降低了输送能耗。冷板与发热器件的直接接触避免了空气传输过程中的热量损失,散热效率可达90%以上,远高于风冷系统的60%-70%。
(二)设备兼容性优异
冷板式液冷方案的核心优势之一是对现有算力中心基础设施的高度兼容性,无需进行大规模改造即可实现升级。在服务器层面,仅需在CPU、GPU等核心发热器件上加装冷板模块,无需改变主板布局、电源接口等核心结构,适配市面上主流服务器品牌与型号。对于存量算力中心,可采用局部液冷方案,仅对高功耗设备进行改造,剩余热量通过原有风冷系统带走,实现新旧散热系统的协同运行。
在机房基础设施层面,冷板式液冷系统可直接与传统冷冻水系统兼容对接,通过CDU实现与现有空调冷源的整合,无需重建冷源系统。其管路布置与机柜安装方式与传统机房相近,占地面积仅比风冷系统增加5%-10%,可充分利用现有建筑空间。这种兼容性大幅降低了技术升级的门槛与成本,为存量机房改造提供了可行路径。
(三)能效与成本平衡
冷板式液冷方案在能效与成本之间实现了优化平衡,满足了绿色低碳要求,具备商业化推广的经济性。在能效方面,该方案可将算力中心PUE降至1.2以下,部分采用自然冷却的场景甚至可低至1.1,较传统风冷系统每年可节省15%-20%的能源消耗。液体工质的高温供液特性提升了余热回收效率,可将服务器散热转化为热水用于供暖或工艺用水,实现能源梯级利用,进一步降低综合能耗。
在成本方面,冷板式液冷方案的初期投资虽高于风冷系统(约增加30%-50%),但全生命周期成本具备显著优势。通常情况下,初期投资溢价可在2-3年内通过能耗与维护节省收回。
(四)运行稳定性高
冷板式液冷系统采用闭式循环设计,减少了外界环境对系统的影响,运行稳定性显著优于风冷与开式液冷系统。闭式循环使冷却液不与空气直接接触,避免了水分蒸发、杂质污染与微生物滋生,降低了管路堵塞与设备腐蚀风险。系统采用冗余设计,CDU、循环泵等核心部件均配置备用单元,单台设备故障时可自动切换,保障散热不中断。
在运行控制方面,系统通过多点传感器实时监测供回液温度、压力、流量等参数,能够根据算力负载变化动态调整运行状态。针对泄漏风险,系统采用多层防护措施:管路采用无缝钢管或工程塑料,接头选用快插式密封结构,同时配备泄漏检测传感器,可在泄漏初期发出报警并切断相关管路,避免造成设备损坏。
(五)部署灵活性强
冷板式液冷系统的部署受地理位置与气候条件的限制较小,具备全国范围内的适配能力。对于高温高湿地区,可采用“机械制冷+冷却塔”的一次侧方案;对于缺水地区,可选用风冷冷水机组或干冷器;对于温带及寒带地区,全年可利用自然冷却模式运行,仅在极端高温时启动机械制冷。这种灵活的冷源配置使系统在不同气候区均能保持低PUE运行。
在空间部署上,该系统省去了风冷系统庞大的空调末端设备,机柜布局密度可提升20%-30%,相同算力需求下机房占地面积减少15%-25%。系统支持模块化部署,可根据算力扩容需求分阶段增加CDU与冷板设备,无需一次性投入全部资金,适配算力中心的渐进式建设模式。
(六)标准化程度高
经过多年发展,冷板式液冷技术已形成较为完善的标准体系,涵盖设备接口、性能测试、工程实施等多个环节。在接口方面,CDU与管路的连接采用GB/T36672等国家标准接口,冷板与服务器的对接遵循PCIe规范,确保不同厂商设备的兼容性;在性能测试方面,已建立包括散热效率、压力损失、泄漏率等在内的测试方法标准;在工程实施方面,形成了从站点勘测、管路铺设到系统调试的标准化流程。
标准化程度的提升降低了系统设计与集成成本,推动了产业链的成熟。目前,市场上已涌现出多家具备冷板、CDU、冷却液等核心部件量产能力的厂商,形成了完整的供应链体系,进一步支撑了冷板式液冷方案的规模化应用。