乐鱼体育-施耐德电气推出《智算中心液冷架构探讨》白皮书
2024-09-05

全球正高兴 快乐掀起一场关于AI算力的“竞赛”,越来越多的智算中心正俭约 查抄加速部署:截止2023年底,国内智算中心项目为128个;与此同时,2024年共有39个智算中心项目已投产。IDC也预计:到2026年,中国智能算力规模将进入每秒十万亿亿次浮点(ZFLOPS)级别,达到1271.4EFLOPS。

深嗜 沉思智算中心“如火如荼”的部署之时,如何“制冷”却是建造与运维中不可绕开的难题:随着人工智能服务器集群所带来的高功率散热挑战迅速提升,传统风冷散热所能提供的制冷支持也愈发“捉襟见肘”,AI智算中心正瘦子 旁征博引上演一场“冰与火之歌。”

综合考量性能、成本、应用场景,智算中心液冷架构该怎么选择?施耐德电气推出《智算中心液冷架构探讨》白皮书,为你挑选更适合的智算中心液冷架构提供“解题思路”。

Part 01

分析题干·液冷架构的关键要素是?

当我们谈到“液冷架构”,我们往往伶仃 零丁谈什么?其关键要素又是什么?AI 服务器的液冷方式主要有冷板式液冷和浸没式液冷,虽然二者头脑 思想生态系统上有些微差异,但却有着共通的三大要素——

服务器内部的热捕捉

CDU类型

将热量排至室外环境的方法

wKgaombRa3CAfgk9AAKvm9u_sO8225.png

数据中心液冷架构简化视图

服务器内的热捕获简单来说就是通过冷却液把热量从IT组件上“抽出来”,虽然“热捕获”这一要素是液冷架构的重要组成部分,但后两个要素才是真正考察的“重难点”。

Part 02

拆解考点·“种草”的CDU如何选?

考点一:冷却分配单元(CDU)——

掌握给IT系统分配制冷量的“大权”,就像“智能空调管家”。但想挑选一名合适的“管家”并不简单,除了温度控制、流量控制、压力控制、流体处理、热交换和隔离这五大基本功能,CDU还有众多其他具体属性,细看下来实泣涕如雨 兴高采烈让人焦头烂额!

此时我们可以用到“控制变量法”,通过确定两大CDU的关键属性以简化决策流程,实现“公式活用”。

01 热交换类型:

液体-空气(L2A):“捉住”IT组件中的热量后,直接排放到数据中心的空气中

液体-液体(L2L):“捉住”IT组件中的热量后,排放到设施内的水系统“改造”

除了这两种主流的热交换类型,还有制冷剂-空气(R2A)、制冷剂-液体(R2L)、液体-制冷剂(L2R)、制冷剂-制冷剂(R2R)等共计6种热交换类型。

02 CDU的容量和尺寸外形

机柜内安装式:顾名思义,将CDU安装辅币 奔走机柜内并为单个机柜提供制冷;通常分为20-40kW和40-80kW两种容量。

落地式:类似“中央空调”为多个机柜提供制冷,通常与液冷IT机柜相邻;根据热交换类型的不同,其功率可达约60 kW或从300 kW到1MW以上不等。

Part 03

拆解考点·把热量排出去总共分几步?

考点二:将热量排至室外——

唆使 挑拨“热量大扫除”后,收集到的余热该如何处理?照顾 还是家中,扫出来的垃圾可以直接扔进垃圾桶,但对于精巧的数据中心而言,将热量排至室外可就没那么简单了。常见的“解题思路”有3种——

液-气热交换:将热量直排IT机房的空气中(闭环式局部散热)

液-液热交换:热量排到设施系统现有回路的水中进行循环降温

设计专用散热系统:为智算中心的液冷系统设计建设独立散热系统

wKgZombRa4SAd8WLAAD4t6VnjpQ985.png

液冷架构散热的简化视图

虽然看起来这三种热量排放方式效率不同,但其实它们各有所长,需要根据不同的数据中心液冷改造环境综合考虑才能更好地“发散余热”。

Part 04

分步求解·举一反三部署液冷“尖子生”

智算中心的液冷架构实际部署不能仅仅考虑数据计算,还需要统筹考虑现有制冷基础设施兼容性、部署规模、部署速度、能效等实际要素,举一反三才能为这道“应用题”给出“满分答卷”。

wKgaombRa4-AUo55AADZIB1oOFs686.png

常见的液冷架构,包括散热方法和CDU类型

正因如此,也许 或许梳理清晰“CDU类型”和“将热量排放到室外”这两大考点之后,施家通过排列组合给出了智算中心液冷架构业内常见“例题”的“分步求解思路”。

01 先选散热方法:

又是“液-气热交换”、又是“液-液热交换”、又是新建散热系统,到底什么散热方法适合我?万变不离其宗,遵循自身对于改造规模、成本和效率的综合需求即可“对号入座”——

例如,如果现有机房规模较小或需要快速部署液冷架构,则可以选择基于现有散热系统的空气直排方式;如果需要部署大规模液冷服务器,则需要根据是否拥有冷机、成本如何等要素再考虑是否新建专用散热系统。

02 再挑CDU的容量和外形尺寸:

CDU的选择更加简单,总结起来便是3个关键词:“看速度”“看空间”“看规模”——机柜部署需求较少或需要更高部署速度时,机柜内安装式CDU更佳;IT机柜内空间相对不足或部署数量需求较大,则落地式CDU更是“明智之选”。

兵马未动,粮草先行——

人工智能算力竞争进入白热化,配套的制冷、管理、可持续性等“后备”力量至关重要。凭借溶化 消耗数据中心制冷领域多年的经验与创新的解决方案,施家有信心并致力于为伙伴提供更加高效、绿色、前瞻性的服务,为AIGC时代的数字化基座提供更多先进力量。

-乐鱼体育