下载文档 () / 20
动力,因我们而不同*
从 12 伏或 24 伏系统向 48 伏系统的转变不仅仅是一种趋势——这对商用车而言是一场革命性的变革。在本期10/10播客节目中,产品线经理 Joe Szczerba 与伊顿 48 伏系统工程经理 Renan Perceguetti 展开对话,共同探讨制造商为何选择进行这一转变。了解 48 伏技术如何在优化效率的同时,提供更高的功率密度,支持轻度混合动力和自动驾驶系统等先进功能,并助力实现排放目标。此外,您还将听到真实的成功案例,并了解 48 伏系统在整个移动出行行业中的未来发展趋势。

问题 1:是什么推动了数据中心的发展? 

问题 2:现代数据中心的设计和架构发生了哪些变化?

问题 3:当前,人工智能数据中心面临哪些挑战?

问题 4:如何平衡人工智能数据中心所需的电网电力?

问题 5:什么是负载突发?

问题 6:在应用某些新技术来应对这一问题时,我们该如何成为负责任的电力用户? 例如,如何进行测量?

问题 7:安装电表有何帮助?

问题 8:与其他方法相比,边缘计算为何能更好地检测和管理亚同步事件?

问题 9:未来会发生什么? 有哪些目标解决方案?

问题 10:我们该从何处着手? 具体该如何实施?

spacer
  • JP Buzzell

JP (Joshua) 是伊顿的数据中心首席架构师。在此职位上,他与伊顿的数据中心业务部门负责人 Cyrille Brisson 紧密合作,共同推动并支持公司的全球业务战略。这包括监督下一代参考设计的开发,并协助客户在所有物理层维度(包括供电、制冷、网络和软件)上完成数据中心的整体设计与部署。他还与伊顿的产品及职能支持团队紧密合作,确保在全球范围内提供合适的流程和解决方案,以满足客户不断变化的需求,例如支持并加大人工智能的发展,以及制定碳减排策略。

JP 是数据中心行业首屈一指的思想领袖之一,尤其在液冷领域造诣深厚。正是这份热情促使他加入伊顿,致力于开发液冷技术并不断突破技术边界,从而推动量子计算、人工智能及大规模数据中心的增长与经济效益。

JP 的数据中心职业生涯始于 Facebook(现为 Meta),当时他主要负责数据中心的建设、调试和运营工作。随后,他加入 Oracle Cloud Infrastructure (OCI),担任数据中心运营区域总监。在 OCI 任职期间,他领导了全球机房空间设计工作,并负责开发风冷和液冷标准设计方案。他还统筹协调了电气、机械和网络技术的整合与控制,使集群规模得以从几百个 GPU 扩展至数十万个。

JP 职业生涯的早期是在核电行业度过的。他的工作经验涵盖了从一线技术维护工作——包括电气、机械、控制和质量保证——到监督核反应堆运行的各个方面。JP 拥有托马斯·爱迪生州立大学颁发的核能工程技术理学学士学位(ABET 认证),以及乔治城大学颁发的技术管理理学硕士学位。他常驻美国弗吉尼亚州。

  • Karen Cheung    

Karen 是伊顿先进电表部门的产品经理,在新产品开发和上市方面拥有丰富的经验。Karen 曾主导多款新产品的开发和上市,其中包括伊顿的旗舰电表平台 PXQ。

凭借在计量与通信领域十余年的行业经验,Karen 对关键电力客户的电能质量监测及根本原因分析有着深刻的理解。她的专业技术造诣和对创新的执着追求,使她成为计量技术领域的权威专家和思想领袖。

Karen 拥有匹兹堡大学电气工程理学学士学位,以及西德克萨斯农工大学工商管理硕士学位。

spacer

数据中心增长驱动因素   

KAREN CHEUNG:大家好,欢迎收听 10/10 播客。在本节目中,我们将直击行业领军人物的思维内核,带来那些切中要害的犀利洞见。我是 Karen Cheung,伊顿的电力质量及多回路电表产品经理。

今天,我邀请到了一位正以远见卓识塑造数据中心未来的嘉宾——我们的副总裁兼数据中心首席架构师 JP Buzell。在接下来的 10 分钟里,我们将探讨那些推动着数字化基础设施发展的趋势、挑战与创新,正是这些力量支撑着我们这个数据驱动的世界。

从功率密度到人工智能数据中心的韧性,JP 的独到见解绝对不容错过。让我们开始吧。

KAREN CHEUNG:嘿,JP,你今天过的怎么样啊?

JP BUZZELL:今天真是个棒极了的周五。

KAREN CHEUNG:当然了。好的。那么,为了让收听节目的听众们有个整体了解,我们先从宏观层面开始吧。最近,数据中心呈现出爆发式增长,尤其是随着人工智能需求的不断高涨。你能告诉我们,这种增长背后的驱动因素是什么吗?

JP BUZZELL:我认为除了电力资源日益紧张这一事实之外,还有很多因素在推动这种需求增长。这是最重要的。对吧。虽然大家都喜欢网上的猫咪视频,但这远不止于此。从全球范围来看,随着对人工智能需求的增长,人工智能正为越来越多的企业进军云计算领域、助力其业务发展奠定坚实基础。

这正是推动经济增长的动力。尽管美国是最大的市场,但世界其他地区的人口基数要大得多,对吧? 一个有趣的现象是,印度的 ChatGPT 使用率最高,但市场渗透率仅为 4%。因此,尽管我们在美国看到了这种增长,但预计美国以外的地区也将出现类似趋势。

KAREN CHEUNG:这太不可思议了。鉴于以上种种,你认为这是否改变了现代数据中心的设计和架构?

JP BUZZELL:嗯,我认为变化不大。在计算能力的某些领域,情况基本保持不变。标准计算能力将继续保持快速增长。但出现了一种名为高性能计算的新趋势,也就是大家耳熟能详的“训练算法”,正在不断扩大集群的规模。

JP BUZZELL:大约 4 或 5 年前,一个大型集群的功耗可能在 1 至 5 兆瓦之间,但如今大型集群的功耗已高达 500 兆瓦。这相当于 0.5 吉瓦。而我们的 Avalon 集群功耗甚至达到了 1.21 吉瓦。

KAREN CHEUNG:1.21 吉瓦,哇,那真是令人惊叹。面那么,对这些变化、转型以及高性能计算集群的兴起,我们的数据中心目前正面临哪些具体挑战?

JP BUZZELL:嗯,除了我们需要找到目前缺货的“Flux Capacitor‌”之外,还得想办法如何快速搭建这些集群。因此,这通常是一个需求驱动的周期。为此,我们必须具备速度。速度就是市场上的“硬通货”,对吧。所以,如果一个仅 20MB 大小的集群出现延迟,那意味着大约 1 万个 GPU。

如果每个集群有 100 个 GPU,那么延迟一周可能导致高达 340 万美元的周收入损失。对吧。因此,速度确实是市场上的“硬通货”。而功率则是当前的另一关键要素。过去可能是一个 3 千瓦或 17 千瓦的机架,如今一个机架已达到 120 千瓦,甚至有潜力达到至 1 兆瓦。

JP BUZZELL:这实际上意味着更高的密度以及更快地部署集群的能力。

KAREN CHEUNG:因此,所有这些功率密度的变化正在改变数据中心的实际架构和建设方式。是的。

JP BUZZELL:对的,变化相当大。所以,如果大家在讨论“电网平衡器”并深入研究的话,传统上数据中心总是拥有最多的用户关注度,或者说拥有相关人员或团队。我以前常听到一个说法,就是“我们要打造一座NFL城市”。对吧。大型都市区拥有用户流量,这主要取决于延迟。

接下来要考虑的是数据引力所在的位置。这种数据引力会影响网络枢纽,最终影响电网连接。对吧。我们目前在电网连接方面正面临困境,因为我们的传输能力已经捉襟见肘。因此,用电点与输电点之间的距离成了关键问题。长期以来,发电与用电在输电环节上一直处于分离状态。

但如今,建设输电线路需要 14 年时间,这确实令人担忧。此外,正如我之前提到的,这些数据中心的规模已从 5 兆瓦的集群发展到了 500 兆瓦的集群。这相当于一个小城市的用电负荷在瞬间起起落落。因此,具备能源感知能力并能应对这种负载突发,是一个关键的挑战。

KAREN CHEUNG:好的,这确实是关键。不过,我们还应解释一下“负载突发”的含义。你能否向听众说明什么是“负载突发”,以及它为何如此重要?

JP BUZZELL:好的 关于负载突发。试想一个集群,甚至可以是一个 100 兆瓦的集群。如果回溯 20 年前,或者 5 年前,那样的超大型集群通常只有 150 兆瓦。但当时的负载性质各不相同。这就像音乐厅里有 150 个人,每个人都在演奏不同的曲子;而现在,我们所有人都在同一时间演奏同一首曲子。

JP BUZZELL:也就是说,负载的上升和下降都发生在同一时间。可能从 10%(即 10 兆瓦)开始,然后一路升至 150 兆瓦。试想一下,整个里士满市的所有居民同时回家,同时打开洗碗机,这就会导致电力需求和用水需求出现激增。

JP BUZZELL:对吧? 因此,传统电力基础设施的设计通常允许这种不协调。所以我们需要开始思考,如何通过应用某些新技术来应对这一问题,从而成为负责任的“电力公民”? 那么,其中一个关键问题就是如何进行测量。我觉得你在这方面肯定做了一些工作的吧。你愿意就此展开说一下吗?

KAREN CHEUNG:是的,这是我和我的团队一直在研究的课题。我们之前讨论过同时使用的电力总量。但在这些情况下,重要的不仅是用电量,还有电能质量。正如人们常说的,质量比数量更重要。对吧。但在这些数据中心运行各种不同的 GPU 时,会形成一种非常特殊的用电模式。

KAREN CHEUNG:而且如此大规模的用电,正让一些电力公司感到担忧。因为在这种规模下,这种特殊的用电模式可能会对发电机造成影响。而且,你知道,严重一点的话,可能会导致电力中断和停电。所以解决这个问题的第一步,就是你得先意识到问题存在。对吧。这就是人们常说的。

因此,在保护数据中心、电网、周边社区、城市等基础设施之前,必须具备监测和检测的能力。而数据中心实现这一目标的方法之一,就是利用它们目前正在使用的计量解决方案。他们通过在频谱的授权频段 (rates space) 以及有时在未授权频段 (white space) 中进行配置,从而识别出这些异常的用电模式。

这些解决方案的效果简直令人惊叹。这些正是你会听到的与之相关的专业术语。例如“同步振荡”。没错,这就是我们需要重点关注的问题。

JP BUZZELL:是的。关于亚同步振荡的隔离处理确实很有意思。而且计量工作似乎至关重要。但计量究竟如何帮助解决亚同步振荡问题呢?

KAREN CHEUNG:目前数据中心使用电表的方式是:安装好电表后,用来监测进入建筑物的电力,确保其稳定且质量良好。此外,他们还会观察电力流经建筑物以及在数据中心内瞬变时的相互作用。对吧。因此,我们希望实现的并非标准计量——标准计量通常关注 60Hz(即电力基础频率)

及其以上的频率。也就是说,通常讨论的是谐波等问题。而实际上,我们需要关注 60Hz 以下的频率。这就是所谓的亚同步振荡。对吧。然后,你需要针对该频段进行诊断。因此,你需要一种能够以极高速度和分辨率采样并处理数据的设备。但在寻找解决方案时,有一点需要特别注意:要警惕那些可能过度依赖数据流来解决此问题的电表。

我们不推荐这种方法,因为它将大量工作留给数据中心去接收数据并进行分析,这既具有挑战性,也并无实际帮助。因此,我们建议采用基于边缘计算的解决方案,这意味着所有数据都在电表本地实时处理,电表本身就能为你提供指导。

JP BUZZELL:哦,这太棒了。听说 Wi-Fi 延迟挺大的。所以,你希望在边缘进行处理,以免遗漏任何信息。处理将在边缘进行。但既然“Flux Capacitor”尚未问世,或者在到货前就已售罄,零件也无法到位。下一步行动是什么? 除了“Flux Capacitor”之外,还有哪些解决方案可以用来解决这个问题?

KAREN CHEUNG:是的。在边缘进行处理确实很有道理,因为这样能让解决方案更快、更准确。就像你说的,Wi-Fi 确实有延迟。要知道,数据传输永远会是你的瓶颈。即便传输速率再惊人,也只是电表内部处理数据量的零头。

所以,如果你直接在设备内部处理,就能获取更多数据,得到更精确的结果,而且速度更快,因为处理工作由电表本身完成。你不需要来回传输数据。唯一需要发送的信息就是:“嘿,这里有需要你关注的情况。可能出了点问题,请检查一下。”

这样一来,从总体拥有成本或数据中心的角度来看,最终成本会低得多,因为他们无需采购、安装和维护所有这些额外的计算资源来处理源源不断涌入的海量数据。对吧。当然,这并不是说他们不能进行流式传输,流式传输仍然是一个可选方案,但现在它更多地被用作备份。

这样一来,您既拥有主方案,又拥有安全保障,可以灵活地根据需求在任何地点进行流式处理,无论是大规模还是小规模。当然,这并不意味着一切尽在掌握。你知道。那么,让我问你一个问题,JP。我们之前谈了很多关于检测的内容,这也是我们的起点。

但这其实只是成功的一半。一旦我们发现存在问题,接下来该怎么做? 你对数据中心可以采取的解决方案有什么建议吗?

JP BUZZELL:好的,我认为,了解问题所在是第一步。对吧。这确实是成功的一半。现在我们有了这种计量技术,你就有能力阻止它,或者不用担心 Wi-Fi 流式传输的问题,这样你就实现了边缘处理。但问题是,如何将这个信号发送给能够实际控制它的设备呢?

JP BUZZELL:因此,我们可以使用几种不同的解决方案,例如 UPS 系统和能源感知技术,它们可以缓解这种情况,并充当电网的缓冲。我们还可以使用超级电容器,因为如果将 UPS 作为缓冲,可能会导致电池性能下降。虽然这本质上还是依赖电池,但作为权宜之计,它仍然是一个可行的解决方案。

JP BUZZELL:或者,如果你认为这种情况不会经常发生,但预计未来会频繁出现,那么超级电容器具有更好的特性,它们的充放电速度更快,且随时间推移的性能衰减速度更慢。因此,你可以节省电池本身的资本支出。此外,通过利用该能源感知系统本身,可以优化波形的整体形态。

这样,你就能再次进行峰值削减和波形整形,从而保护电网,成为负责任的电力用户。

KAREN CHEUNG:好的,那么 UPS 的超级电容器、能源感知等方案,对于不熟悉该领域的人来说,听起来可能让人不知所措。对于普通用户而言,该如何去实施我们刚才讨论的这些不同方案呢?

JP BUZZELL:是的,我认为首先,我们不必担心。伊顿拥有一个非常完善的生态系统。仔细想想,我们确实拥有从电网到芯片的全链路技术。从 500 千伏一直到 1 伏直流电,我们完全可以通过工程技术支持整个系统和生态系统。

JP BUZZELL:此外,我们还提供配套服务,包括工程咨询服务,并拥有相关技术,能够帮助客户优化波形,无论他们身处何地,我们都能提供支持。对吧。因此,如果您是像超大规模云服务商 (Hyperscaler) 这样技术要求极高的客户,我们具备专业技术能力,能够满足您的需求。或者如果您只是需要一套交钥匙解决方案,

我们同样能提供相应的方案。归根结底,我们致力于在您所处的任何阶段提供支持,并找到双方的平衡点。这些交流与直流解决方案令人振奋,正如我们之前提到的,虽然我们提供不间断电源 (UPS),但逆变器和直流电网正逐渐成为主流。而我们也掌握了相关技术。其中一项刚刚对外公布、让我非常兴奋的,是 Siemens Energy Eaton 解决方案。我们基本上是与 Siemens Energy 合作,以支持高压向中压的过渡,并在其中加入电池储能系统和现场发电。

我们不可能包揽所有解决方案。关键在于建立恰当的合作伙伴关系,以实现共同发展。

KAREN CHEUNG:明白了。我认为这确实很有帮助。而且,能够根据客户的实际情况提供一些指导,我认为这很有用。好的,太棒了。感谢你的分享。也感谢你今天抽空与我交流,JB。

JP BUZZELL:是的,这次交流非常愉快。也谢谢你, Karen。

KAREN CHEUNG:如果您想进一步了解如何检测和防范亚同步振荡,请访问 eaton.com/preventsso 查阅我们的白皮书。

spacer

立即收听

在您喜欢的播客目录中收听