2024 数据中心行业十大发展趋势

2023年,我们见证了人工智能(AI)的爆发,它正在改变人们的工作、生活、以及与技术交互的方式。以ChatGPT为代表的生成式AI也因其显著的进步和广泛的应用,在去年引起了极大的关注。随着人工智能的不断发展和成熟,将有可能彻底改变从医疗保健、金融、生产制造到交通、娱乐等众多行业。市场对人工智能的巨大需求推动了新的芯片和服务器技术的发展,这些变化将对数据中心的建设、电力需求、水资源消耗、供配电和制冷技术与架构带来颠覆性的挑战。如何应对这些挑战,将在新的一年成为行业备受关注的议题。

作为数据中心、行业关键应用领域基础设施建设和数字化服务的全球领导者,自2018年起,施耐德电气已经连续第7年在年初发布《看得见的未来—数据中心行业的新趋势与新突破》系列洞察,开创了行业趋势前瞻解读先河,并持续引领未来变革方向,为数据中心行业注入强劲发展动力。立足深刻的行业洞察和实践,施耐德电气致力于揭示新一年数据中心行业会发生哪些变化,这些变化和趋势对数据中心运营商的价值和意义,以及对这些行业变化的看法和价值主张。以下是施耐德电气全球数据中心科研中心对2024年发展趋势的预测。

趋势一:智算中心将引领数据中心建设

2024 数据中心行业十大发展趋势

过去十年,云计算一直是推动数据中心建设与发展的主要驱动力,目的是为社会提供数字化转型所需的通用算力。但是,AI的爆发带来了巨大的算力需求,为了满足AI大模型的训练和应用推理,我们需要建设大量的智算中心。施耐德电气根据全球数据中心的用电量,GPU芯片和AI服务器未来的出货量等数据,估算出全球智算中心目前的电力需求为4.5 GW,占数据中心总57 GW的8%,并预测到2028年它将以26%-36%的年复合增长率增长,最终达到14.0 GW至18.7 GW,占总93 GW的15%-20%。这一增长速度是传统数据中心年复合增长率(4%-10%)的2到3倍。算力的分布也会由现在的集中部署(集中vs. 边缘为95%:5%)向边缘迁移(50%:50%),这意味着智算中心将引领数据中心建设的潮流。根据工信部的规划,我们国家智能算力的占比将在2025年达到35%,年均复合增长率在30%以上。施耐德电气认为相较于传统数据中心,智算中心的建设需要在确保高能效和高可用的前提下,实现可持续发展和更具前瞻性,也就是最小化对环境的影响,尤其需要提高适应性来满足未来IT技术(高功耗的芯片和服务器)的需求。

趋势二:AI将推动机柜功率密度骤升

2024 数据中心行业十大发展趋势

机柜功率密度对数据中心的设计与造价具有较大的影响,包括供配电、制冷以及IT机房的布局等,一直都是数据中心比较关注的设计参数之一。Uptime过去几年的调研结果显示,服务器机柜的功率密度正在稳步但缓慢地攀升。机柜的平均功率密度通常低于6千瓦,大多数运营商没有超过20千瓦的机柜。造成这一趋势的原因包括摩尔定律使芯片的热设计功耗维持在相对较低的水平(150瓦),同时高密服务器通常被分散部署在不同的机柜以降低对基础设施的要求。但AI的爆发将改变这一趋势,施耐德电气研究发现,用于训练的AI机柜功率密度可以高达30-100千瓦(取决于芯片的类型和服务器的配置)。而造成这一高密的原因是多方面的,包括快速提升的CPU/GPU热设计功耗,CPU为200-400瓦,GPU为400-700瓦,未来还会进一步升高;AI服务器的功耗通常在10千瓦左右,由于GPU是并行工作的,AI服务器需要以集群的方式紧凑部署,以降低芯片和存储之间的网络时延。机柜功率密度的陡增将给数据中心物理基础设施的设计带来巨大挑战。

趋势三:数据中心正在从风冷向液冷过渡

2024 数据中心行业十大发展趋势

风冷一直都是数据中心IT机房冷却的主流方式,如果设计得当,可支持十几个千瓦甚至更高的机柜功率密度。但随着对AI训练性能的不断追求,开发人员不断提高芯片的热设计功耗,对这些芯片进行风冷变得不切实际。虽然一些服务器供应商通过重新设计芯片的散热器、增加服务器风量以及进出风温差,以不断突破风冷技术的极限,配置40-50千瓦风冷型的AI机柜,但这会使风扇的功耗呈指数级增加。例如,AI服务器风扇可以消耗高达25%的服务器功率,但传统服务器的典型值只有8%。施耐德电气认为芯片的冷却才是液冷的主要驱动力,20千瓦机柜功率密度是风冷和液冷相对合理的分界线。当AI机柜功率密度超过这一数值时,应重点考虑采用液冷服务器。相较于风冷,液冷还带来了诸多好处,包括处理器可靠性和性能提升、能源效率提升、用水量减少以及噪音水平降低等等。目前,对于高密的AI服务器,供应商通常提供风冷和液冷两种方案,但对于下一代GPU,液冷将是唯一选择。

趋势四:配电的安全可靠在智算中心更加重要

2024 数据中心行业十大发展趋势

对于传统数据中心,不同工作负载同时达到峰值的概率极低。比如,典型的大型数据中心峰均比通常在1.5-2.0或更高。但在智算中心,由于AI训练负载缺乏变化(峰均比接近1.0),工作负载可以在峰值功率下,运行数小时、数天甚至数周。其结果是增加了上游大型断路器脱扣的可能性,以及宕机的风险。同时,由于机柜功率密度的升高,需要采用更高额定电流值的断路器、列头柜、小母线等。而在电阻变小的同时,可以通过的故障电流也就更大,这意味着IT机房出现拉弧的风险也会升高,保证该区域工作人员的安全是必须解决的难题。施耐德电气建议在设计阶段采用模拟软件对电力系统进行弧闪风险评估,分析可产生的故障电流,并且对可靠性进行分析,以便为特定场地设计最佳解决方案。这项研究必须从中压开关柜分析至机柜层面,同时建议如果新建数据中心IT机房的AI训练工作负载超过60-70%,需要根据下游各馈线断路器的总和来确定主断路器的大小,设计时不再考虑同时系数。

趋势五:标准化将成为液冷推进的关键

2024 数据中心行业十大发展趋势

冷板式液冷和浸没式液冷是数据中心液冷的两种主流方式。究竟选择哪种液冷方式以及如何实现快速部署一直都是行业热议的话题。随着越来越多AI服务器采用冷板式液冷,冷板式液冷也更容易与传统的风冷系统兼容,受到很多数据中心运营商的青睐。但是服务器厂家液冷的设计方式多种多样,快速接头、盲插和Manifold的兼容性存在诸多问题,IT与基础设施的责任边界也模糊不清,这大大限制了液冷在数据中心的接受度和推广。相较于冷板式液冷,采用碳氟化合物流体的浸没式液冷不仅价格相对较高,而且很多碳氟化合物属于对环境有害的人工合成类化学物质,面临越来越多的行业监管与政策压力。因此,浸没式液冷除了采用油类冷却液,可用的碳氟化合物流体将越来越少。施耐德电气建议IT厂家提供更为标准化的设计方案,包括流体的温度、压力、流量、设备的接口等,并且提供更加明确的责任边界。施耐德电气将在第一季度发布液冷白皮书,来帮助数据中心更好地部署液冷技术。

趋势六:数据中心将更加关注WUE

2024 数据中心行业十大发展趋势

水资源短缺正在成为许多地区的严重问题,了解和减少数据中心的水资源消耗变得越来越重要。此前,数据中心水资源消耗未被重视的一个重要原因是用水成本相对用电通常是微不足道的,甚至很多数据中心通过消耗更多的水来提高能效。但是,数据中心的用水已经引起了很多当地政府的关注,尤其在水资源匮乏的地区,政府正在出台各项政策来限制和优化数据中心的用水。这其中包括将WUE作为数据中心的设计指标,采用水电双控政策。因此,减少用水量将成为许多数据中心运营商未来关注的重点领域。施耐德电气通过对数据中心行业用水量的研究,认为数据中心的WUE值在 0.3-0.45 L/kWh之间是一个相对优秀的数值。施耐德电气建议根据数据中心所在地域水资源情况、气候情况和数据中心类型,寻找用电与用水之间的平衡。行业可以采用绝热蒸发、间接蒸发冷却、液冷等各种技术创新,从而减少直接用水量。数据中心运营商应将WUE作为可持续发展目标的一部分,报告用水量/节水量,同时关注用电所带来的间接用水量。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 2024年1月29日 上午10:34
下一篇 2024年1月29日 上午10:43

热点文章

分享本页
返回顶部