大模型推高算力能耗,液冷是节能的好办法吗?

步入AIGC时代,算力需求愈发呈指数级增长,AIGC的大模型训练、实时交互等均需要海量算力的支撑。第一财经记者在第二届外滩大会期间了解到,向AI的新型数据中心基础设施建设对大算力的需求激增,但节能降耗问题依旧面临诸多挑战。

数据中心节能仍面“多重挑战”

以人工智能为代表的生成式大模型的繁荣将为智算中心的建设带来更快发展。而高算力往往也伴随着高能耗,据统计,2022年全国数据中心总耗电量约2700亿千瓦时,占全社会用电量的3.1%,超过两座三峡水电站年发电量。


(相关资料图)

浪潮信息服务器产品线总经理赵帅对记者表示,如今数据中心节能降碳面临“多重挑战”:从能耗构成看,数据中心总能耗包括IT设备能耗和制冷、配电等系统的能耗,其中,制冷系统用电量已与IT设备相当,占总用电量高达43%。因此,优化制冷系统成为数据中心提高能源效率的重要环节。

随着芯片功耗与服务器功耗持续上升,全球数据中心单机柜功率也快速增长,赵帅预计到2025年平均功率将达到25kW。高功耗芯片,高密度服务器及单机柜密度的演进,导致传统风冷制冷模式在换热性能及能耗优化方面逐步受限。

其次,算力供给的核心是IT设备,但就其容量而言,IT设备的利用率通常十分低。例如,服务器的利用率往往只有5%到15%,处理器为10%到20%,存储设备为20%到40%,网络设备的利用率为60%到80%。然而,当设备闲置时,其仍会消耗在最大利用率下消耗的大部分功率,一台标准服务器即使不工作也要消耗30%到40%的最大功率。如何最大程度减少IT设备空闲,让闲置的算力跑起来至关重要。

同时,赵帅强调,在提供每单位算力的同时减少能源消耗,提升能源转换效率也是实现数据中心绿色低碳发展的关键。

业界呼吁行业标准早日统一

建设绿色节能的算力中心,能够有效推动数字经济发展和节能减排协调统一。而服务器作为算力中心的三大基础设施之一,是构建算力中心的核心要素,整体功耗能占到总能耗的40%-50%。因此,服务器技术水平将直接影响到算力中心的绿色低碳程度。

不过记者从多位行业人士处了解到,目前,业界对于国家及地区宏观能效调控以及规模化算力中心的能效标准均有定义,但对于整机及部件尤其是使用环节的碳排放评测缺乏统一标准。因此,亟需推行绿色算力评测,引导服务器厂商采用绿色相关设计。据了解,当前服务器液冷行业尽管技术已经相对成熟,但是各家公司都有不同的解决方案。上游器件从IT设备开始,到冷却分配单元(CDU),再到液体冷却系统,每个环节都有各自的标准。

“以冷板为例,现在做冷板没有一个固定的标准,下游需求方只要求你能给我解决散热问题就行了,具体什么规格他们不管。还有快接头,每一家需求的快接头都是不一样的,这导致了一方面企业产品生产无法达到一个规模的条件,对于能耗的标准化测定也就难以达成,另一方面企业的生产成本自然就没有办法下降。”赵帅告诉记者。

据业内人士透露,当前,按照行业普遍的实践来看,使用数据中心使用液冷的方案要比使用风冷的方案多花费10%-20%的成本,企业需要花上约一年半到两年的时间才能收回投资成本。同时,标准的不一致意味着下游厂商在选择了某一个公司的解决方案后,就会与该公司深度绑定,多个解决方案之间不具备替换的互操作性,这对许多用户来说也是一个很大的挑战。

当前中国信息通信研究院已经开始联合行业头部企业,构建并发布“绿色算力评测体系”。“绿色算力评测体系”定义单位碳排放下算力指标,系将数字计算的低碳方案直接定位到服务器单元,并从数据中心基础单元出发,关注产品在使用周期内的算力碳排比,旨在达到服务器性能要求的前提下,满足低碳、绿色、PUE等要求,实现最小颗粒度的碳排放量化可视指标,将有效推动绿色节能服务器设计发展。当前,行业标准已经呼之欲出,不过国家标准尚不知何时出台。

关键词: