01. 液冷云舱建设方案的必要性 

随着传统行业数字化转型加速及智算等新兴行业应用需求驱动,智算需求增长趋势明显,功率密度持续上升,制冷系统由单一制冷方案演变为多元化制冷方案,液冷技术需求旺盛。算力需求高速发展为基础设施、建设方案带来的多方面的不确定性变化,因此需要更为高效节能、灵活快速、低成本的基础设施建设方案以应对市场变化的不确定性,加快完善数据中心领域的建设布局。

智算中心对基础设施的需求和商业模式有别于现有数据中心建设模式,需要结合业界前沿,打造出适应高性能 IT 设备的发展趋势的技术与建设方案。提高市场竞争性,降低智算中心造价,提高智算及云业务利润,实现智算中心的模块化、标准化建设,以适应客户项目灵活部署。针对需求,基于冷板式液冷系统自主开发出液冷云舱产品,能够弹性适配新建及改扩建等不同类型的场景,实现预制化、模块化、灵活部署和快速交付。

02.液冷云舱建设方案的优势

液冷云舱的建设方案采用兼容列间空调和液冷CDU的多元化方案,以实现制冷量的按需匹配,达到节能降耗的需求。通过风冷、液冷两类管道预留,实现制冷模式的灵活适配,风液混合部署,提高功率兼容性和冷量利用效率,适配高功率密度设备部署需求。利用预制化和模块化技术,达到液冷产品的标准化和集成化,以便快速交付业务。通过集约化供冷和供冷资源的池化,实现不同设备和环境的混插混用,以及跨楼层、跨机房的冷量柔性化动态调节。

(1)灵活性强:液冷云舱模块化架构可预集成液冷机柜、智能配电、冷却单元等核心组件,支持按需扩容,单舱体可独立运行或多舱级联,实现柔性扩展能力。

(2)高效散热能力:液冷云舱配置独立的CDU和列间空调,结合“芯片-机柜-机房”三级液冷循环,动态匹配不同负载场景,减少无效能耗,兼容智算和常规通算服务器,弹性适配不同算力场景。

(3)高可靠性:将动环、IT网管以及整个机房资源纳入数字化管理平台,支持未来 AI智慧化系统接入,实时分析负载与温度场,动态调节泵速、流量及冷却路径;配备漏液检测、压力传感与几余泵组,毫秒级隔离故障模块,提升系统故障自愈能力,实现智慧运营。

 03.系统架构及解决方案 

液冷云舱采用单相冷板式液冷架构,各子系统基于标准化机柜模型搭建,创新采用新型风液同源冷却技术和解耦型标准化液冷机柜技术,打造冷板式液冷云舱全栈解决方案,如图2所示,弹性适配不同场景快速交付,实现预制化、集成化、快速部署适配服务器未来发展。

3.1 基本技术条件

液冷云舱采用冷通道/热通道封闭,主要由通道门、控制天窗、翻转天窗、固定天窗、云舱框架等组成,其中通道门为自动平移门。风冷部分采用列间空调制冷,封闭通道密封系统采用模块化装配式设计,可根据服务器上架量按需布置CDU、IT 机柜、液冷机柜、配电柜、空调等,每个单元均能独立安装,并能与相邻的单元连接。密闭通道系统使云舱内的冷热气流隔离,有效提高气流利用率。

液冷云舱的外壳、柜体(包括液冷机柜、网络机柜、空调等)、走线架、框架等金属表面统一颜色为砂纹黑(RAL9005),机柜尺寸:宽600x深1200x高2200mm,外观示意图如图9所示。

液冷云舱的不同组件可按实际需求灵活搭配,主要组件在工厂预制,运抵施工现场后根据实际条件进行拼装。液冷云舱结构框架与机柜及其他功能柜接缝处采用毛刷、密封条等做密封处理,各部件参考如图10 所示。
云舱通道顶部或门楣处预留监控摄像头、烟雾报警器、温度传感器等监控器件的安装位置,门控端柜或构件处预留门禁的安装位置。云舱通道标准宽度为1200m,可按用户要求根据实际情况合理调整。
3.2 冷量分配单元 CDU
冷量分配单元 CDU 主要功能是将热量从热源(如服务器等)传递到冷却介质中,从而实现对设备的有效冷却,作为整个液冷系统的“心脏”,负责提供并调节低温冷却液,为冷却液提供循环动力,通过换热器将其热量传递至一次侧系统冷源,实现冷却介质的降温。CDU 设备组成包括板式换热器、二次侧循环水泵、定压补液系统、膨胀罐、过滤器、控制调节阀、温湿度传感器、压力传感器、温度传感器、流量计、控制系统、触摸屏、电源模块、智能电表等配件,如图3所示。
智能变频水泵系统保证末端冷量分配稳定,将满足使用需求的冷却液经水泵提升压力,通过管路、分水器进入负载,在负载吸热后再次返回CDU,变频水泵热备运行,通过动态调节流量与扬程匹配负载需求,实现能效最优。
高效钎焊板式换热器隔离一二次侧溶液,将室内二次侧热量转移至室外一次侧,实现冷却液的温度降低。结合高精度过滤系统,防止系统堵塞,保证服务器冷板稳定运行。智能监控系统实时采集温度、压力等数据,故障自动切换保障安全高效。
通过快接卡盘实现快速安装,自动补液系统集成液位-压力双闭环控制,简化操作维护。

3.3 解耦型液冷机柜

解耦型液冷机柜包括机柜框架、分集液器、快速接头及连接软管、机柜供回水管、供电单元等,如图4所示。采用标准化接口矩阵式配置方案,构建“液路+电路”双解耦架构,实现不同液冷连接形式的服务器按需部署于液冷机柜,兼容不同厂商的服务器。通过多重漏液防护设计,配备双向自密封的液冷连接器,提高了系统的可靠性和安全性,保障液冷系统在整个生命周期内的可用性。

3.3.1 机柜柜体

机柜柜体主葬体殮列采用局部焊接、整体拼装成型,表面喷涂。机柜系统主要由机柜框架、导轨、侧板、网孔门、顶底板、扎线板等组成。

(1)机柜尺寸:宽 600mmx深 1200mmx高2200mm,机柜外形尺寸的偏差不得超过(-3,0mm),外表面对底部基准面的垂直度公差不得大于士3mm;机柜用于安装设备(电源框、服务器、交换机等)的有效空间不小于 47U,机柜方孔柱每U高度为 44.45mm,并在安装孔侧方丝印数字标识。

(2)机柜满足 19 英寸和 21 英寸服务器设备和交换机的安装,同时兼容 0CP 标准设备安装。

(3)机柜可以并排安装,机柜并柜后柜体之间不应有明显的透光缝隙。采用水电分离管理,后部左侧安装分集液器;右侧安装 PDU 或 Busbar 供电(根据实际项目需求进行调整)。

3.3.2 分集液器

分集液器安装于液冷机柜内部,具备分液、集液和排气等功能。分集液器一般由排气阀、分支管路和主管路等组成。

(1)分集液器主管管材 304 不锈钢无缝方管,不少于 20 支路以上的分集液器建议外径 50mm*50m,厚度 3mm。焊接采用氩弧焊工艺,焊接应满焊,焊接前应对焊口清污,焊缝表面不应有裂纹、焊瘤、气孔、咬边及未填满的弧坑和凹陷存在。

(2)分集液器满足主路上限流量下的压损不超过 15kPa,分集液器内部最大工作压力,承压能力不低于 1. 0Mpa。

(3)分集液器分支管路接口管径、数量及类型与机柜内设备类型相匹配,能够实现即插即通、即拔即断,接口自封闭,无滴漏。

(4)分集液器管路设计需考虑机柜流量均匀,液冷机柜最大流量和最小流量之间的不平衡率控制在 10%以内,且满足所有服务器设计散热需求。

3.3.3 机柜供电单元

液冷机柜通过集中供电系统为机柜内部用电设备提供电力,柜内供电系统主要有两种形式,一种为盲插型供电单元包括电源框(Power Shelf)和供电母排(Busbar)组成,供电电压为+48V~+54V;另外一种为常规的 PDU 供电单元。

3.3.3.1 盲插型供电单元

(1)电源框

电源框将交流电转为直流电,支持+48V~+54V 恒压直流输出给服务器等设备供电。单机柜内可安装多个电源框,每个电源框高度 10,含6个电源模块和1个电源监控模块,供电能力>33kw。每个电源框可以独立运行,也可以多个电源框并联运行。

电源插框固定在机柜上,电源的气流方向需与机柜其余 IT 设备保持一致,前进后出采用卡扣固定机柜前面的左右两侧的立柱上的,电源插框的后部也是卡装在后部左右两侧立柱上,采用转接铜排与 Busbar 连接,如图5所示。

(2) 电源模块

电源模块单路电源输入,支持 AC/DC 单路输入,以及宽市电电压输入范围,极大提升供电可靠性。系统采用模块化设计,即插即用方便扩容,带有RS485 接口、CAN 接口等通信接口,组网灵活。

电源模块额定输出电压为 54Vdc,最大额定功率 5500W,最高效率 97%以上。电源模块通过 INPUT 端口从外部接入,输出汇集到电源框铜排上,电源模块外观如图。

(3)供电母排(Busbar)

供电母排 Busbar 位于机柜的背面,可实现左右步距调整,可满足盲插方式为服务器设备及交换机设备供电,Busbar 的规格性能应满足以下要求:

1)供电母排载流量:在环境温度 30°C时,>1400A/+54V

中国联通智算中心冷板式液冷云舱设计方案

2)母排压降:200mV

3)Busbar 正负方向:从机柜后侧看,左负右正液冷服务器采用盲插方式通过标准化盲插端子和供电母排对接,实现标准化接口和热插拔快接方式供电,如图7所示:

液冷服务器采用盲插方式通过标准化盲插端子和供电母排对接,实现标准化接口和热插拔快接方式供电,如图7所示:

3.3.3.2 PDU 供电单元

根据实际项目需要及服务器设备类型不同,机柜供电单元可调整为PDU 供电单元,通过 PDU 为机柜内用电设备提供电力。

(1)液冷机柜应配置两套独立、可拆卸、可更换的固定式配电单元(PDU),用于机柜内设备两路电源的引入、分配、连接、保护及分合(通断)。

(2)PDU 的输入电源制式为三相交流 380V,每套 PDU 的供电容量均应与机柜用电功率对应,输出分路容量应能满足各设备用电需求。

(3)PDU 外壳应采用金属或高阻燃塑胶材料(PC-ABS),能够有效抗射频、电磁波干扰;面板应采用高阻燃塑胶材料(PC-ABS),阻燃特性符合 UL94-V0 等级和国家相关规定。整体外观应平整、美观、协调,各部件安装牢固、紧凑,无松动。

PDU 输入端应设接线端子组,可以连接 25m? 以下的电缆,各输出分路应按用户要求设插座或接线端子组,为设备提供接电条件。

3.4 二次侧管路

液冷云舱从室内换热单元 CDU 出口到液冷机柜分集液器入口的管路定义为二次侧管路系统,包括 CDU 支管路、主干管、分支管、配套阀门、集水盘、漏水检测等,具备分液、集液和排气等功能,如图8所示。

二次侧管道系统采用预制化、去工程化设计,现场安装无需进行焊接,所有组件均在工厂内完成预制生产,硬管材质采用牌号 ASTM 304 及以上不锈钢,有效确保冷却液的纯净度,避免结垢堵塞和腐蚀问题。软管采用 EPDM 材质,耐压性能、柔韧性更好,提高基础设施对智算服务器安全运行的保障程度。

单个环路系统中 CDU 与液冷机柜采用 N+1 的冗余配置,具备定位漏液监测功能,提高管路系统安全性。二次侧管路设计压力不低于10bar,可有效应对系统突发压力变化情况。二次侧管路将冷却液分配至液冷机柜,各支路分流均性≤10%。

3.5 水氟双冷源空调

液冷云舱采用风液同源冷却架构,空调末端采用水氟双冷源机组,可与液冷CDU共用水冷冷源,实现液冷云舱风液比无极调节,满足多元化业务的应用场景,适配服务器未来发展和智算中心的大规模部署。

水氟双冷源列间空调为双盘管水冷直接膨胀式空调机组。空调形式为列间,设置于云舱机柜间。机组包含双盘管分别为氟盘管+水盘管,设备具有三种运行模式:机械制冷、混合预冷、自然冷却,如图 11 所示。

当冷却水供水温度较高时,设备运行在机械制冷模式,压缩机开启;随着冷却水温度降低,回风先经过水盘管进行预冷,不足的冷量由氟盘管承担,压缩机变频运行;当冷却水温度足够低时,压缩机及氟盘管停止运行,热负荷完全通过水盘管换热由冷却水带走。

采用标准机柜式结构支持水平前送风,空调示意图如图12所示,可以灵活安装于模块化机房内,支持并柜安装或列装,并具有以下特点:

a)结构灵活:匹配模块化机房的灵活交付;

b)系统可靠:实现无需集中式冷源补冷的风液同源设计;

c)性能优异:充分利用自然冷源以提高空气冷却部分的能效比:

d)场景广泛:具有优异的制冷性能和广泛的应用场景;

水氟双冷源空调能够有效满足智算数据中心预制化快速交付和模块化灵活部署的建设需求,适配风液同源、弹性风液比的应用需求。

 04.AI数字化管理平台 

液冷云舱的 AI数字化管理平台整合智能传感、监测和智能调度系统,通过监控屏幕的数据呈现,实现对云舱内液冷 CDU、列间空调、液冷电源、环境等状态的不间断监控。通过整合云舱系统的数字化仿真、漏液监测和智能调度能力,实现集约化管理和自有产品的纳管。

(1)智能监控功能

液冷云舱智能化管理平台由一体化监控单元、传感器、数据交换设备、显示屏等硬件组成,具备对设备数据的采集、存储、分析、告警、展示等,实现对动力、环境、消防、视频、空调等系统的监控和告警预警、消防联动等功能。

4.AI 数字化管理平台

液冷云舱的 AI 数字化管理平台整合智能传感、监测和智能调度系统,通过监控屏幕的数据呈现,实现对云舱内液冷 CDU、列间空调、液冷电源、环境等状态的不间断监控。通过整合云舱系统的数字化仿真、漏液监测和智能调度能力,实现集约化管理和自有产品的纳管。

(1)智能监控功能

液冷云舱智能化管理平台由一体化监控单元、传感器、数据交换设备、显示屏等硬件组成,具备对设备数据的采集、存储、分析、告警、展示等,实现对动力、环境、消防、视频、空调等系统的监控和告警预警、消防联动等功能。

智能化管理平台具有良好的可视化界面,根据实际需求可提供全面的管理功能。监控系统应对云舱内温湿度、漏水监测、烟雾监测进行监控并按控制逻辑发出告警信号。融合数字化仿真和控制模型孪生技术,将数字化仿真和智能调度所需数据生成和算法进行验证,作为漏液预测和调度决策的技术底座。

(2)健康管理功能

液冷云舱智能化管理平台可对液冷CDU、空调告警信息实现显示、管理和分析,具备健康度评价等功能,包含安全性和功能性评价,支持对CDU、列间空调和二次侧管路等进行智能健康管理。

AI健康管理功能依据负载变化(如 AI训练任务峰值)和 PUE 目标,动态调节冷却液流量分配、循环泵频率和空调风机转速等。通过毫秒级监测杜绝热失控和漏液风险,实现健康管理与节能降耗协同,守护高价值算力设备,推动数据中心全生命周期主动健康保障。

 05.经济效益分析 

液冷云舱可实现预制化、标准化快速部署,相比从设备采购、现场加工、组装施工、调试等的传统建设模式,理论测算采用液冷云舱建设模式可大幅降低部署周期,综合建设周期缩短 10%。

采用高效节能的硬件设备和节能技术的应用,降低了数据中心的能耗和运行成本。单机柜可达 20-60kW,水氟双冷源空调在指定工况下达到较高的全年能效比,对比传统风冷数据中心液冷云舱预计能效提升 20%。

通过智能化管理系统,实现对数据中心的实时监控和自动化管理,提高了智算数据中心的运营效率。

——《智算中心冷板式液冷云舱技术白皮书》