為了遏制氣候變化,全球企業(yè)正在加快構(gòu)建高性能、高能效的數(shù)據(jù)中心,Equinix 邊緣基礎(chǔ)設(shè)施主管 Zac Smith 也參與其中。
他所效力的 Equinix 是一家全球服務(wù)提供商,旗下管理的數(shù)據(jù)中心超過 240 個,致力于在業(yè)內(nèi)率先實(shí)現(xiàn)氣候中和。
“一萬家客戶依賴Equinix達(dá)成氣候中和的目標(biāo)。他們需要更大量的數(shù)據(jù)以及更高水平的智能,而這通常有賴于AI,且他們希望能夠以一種具有可持續(xù)性的方式來實(shí)現(xiàn)?!盨mith 說道。2000 年代初還在茱莉亞音樂學(xué)院讀研的他,為紐約的音樂家同僚們搭建了網(wǎng)站,由此與技術(shù)結(jié)下不解之緣。
能效穩(wěn)步提升
截至 4 月,Equinix 已發(fā)行 49 億美元的綠色債券。Equinix 將通過這些投資工具來優(yōu)化電源使用效率 (PUE),以期減少對環(huán)境的影響。PUE 是一種行業(yè)指標(biāo),用于衡量數(shù)據(jù)中心使用的能源有多少直接用于計(jì)算任務(wù)。
數(shù)據(jù)中心運(yùn)營商正試圖將 PUE 降至接近 1.0 的理想水平。Equinix 設(shè)施目前的平均PUE為 1.48,而其旗下新數(shù)據(jù)中心的 PUE 最低可低于 1.2。
?
從 PUE來看,Equinix 正在穩(wěn)步提升數(shù)據(jù)中心的能效
Equinix 于 1 月新啟動了一個專門用于提升能效的設(shè)施,在此方向上更進(jìn)一步。其中一部分工作側(cè)重于液冷技術(shù)。
液冷技術(shù)誕生于大型機(jī)時代,在 AI 時代日臻成熟。如今,液冷技術(shù)已經(jīng)以直接芯片(Direct-to-Chip)冷卻的形式廣泛應(yīng)用于全球高速超級計(jì)算機(jī)。
NVIDIA GPU 在 AI 推理和高性能計(jì)算方面的能效已比 CPU 高出 20 倍, 而加速計(jì)算也順理成章地將采用液冷技術(shù)。
通過加速提高效率
如果將全球所有運(yùn)行 AI 和 HPC 的 CPU 服務(wù)器切換為 GPU 加速系統(tǒng),每年可節(jié)省高達(dá) 11 萬億瓦時的能源。節(jié)約的能源量可供 150 多萬套房屋使用一年。
今日,NVIDIA 發(fā)布了率先采用直接芯片(Direct-to-Chip)冷卻技術(shù)的數(shù)據(jù)中心 PCIe GPU,為可持續(xù)發(fā)展貢獻(xiàn)了自己的力量。
Equinix 正在驗(yàn)證 A100 80GB PCIe 液冷 GPU 在其數(shù)據(jù)中心的應(yīng)用,這也是該公司為實(shí)現(xiàn)可持續(xù)性冷卻和熱量捕獲的綜合性方案中的一部分。GPU 現(xiàn)已進(jìn)入試用階段,預(yù)計(jì)將于今年夏季正式發(fā)布。
節(jié)約用水和用電
“這是我們實(shí)驗(yàn)室中引入的首款液冷 GPU,我們倍感興奮,因?yàn)榭蛻羝惹邢Mㄟ^可持續(xù)的方式來利用 AI,”Smith 說道。
數(shù)據(jù)中心運(yùn)營商旨在淘汰用于冷卻數(shù)據(jù)中心內(nèi)部氣體的冷水機(jī)組,因其每年會蒸發(fā)數(shù)百萬加侖的水量。而借助液冷技術(shù),系統(tǒng)僅需對封閉系統(tǒng)中的少量液體進(jìn)行循環(huán)利用,并能夠著重于主要的發(fā)熱點(diǎn)。
Smith說: “我們將變廢為寶?!?/p>
同等性能,更少耗電
在單獨(dú)的測試中,Equinix 和 NVIDIA 均發(fā)現(xiàn):采用液冷技術(shù)的數(shù)據(jù)中心工作負(fù)載可與風(fēng)冷設(shè)施持平,同時消耗的能源減少了約 30%。NVIDIA 估計(jì),液冷數(shù)據(jù)中心的 PUE 可能達(dá)到 1.15,遠(yuǎn)低于風(fēng)冷的 PUE 1.6。
在空間相同的條件下,液冷數(shù)據(jù)中心可以實(shí)現(xiàn)雙倍的計(jì)算量。這是由于 A100 GPU 僅使用一個 PCIe 插槽,而風(fēng)冷 A100 GPU 需使用兩個 PCIe 插槽。
?
NVIDIA 借助液冷技術(shù)達(dá)到了節(jié)省電力和增加密度的效果
至少有十幾家系統(tǒng)制造商計(jì)劃于今年晚些時候在其產(chǎn)品中使用液冷 GPU,包括華碩(ASUS)、永擎電子(ASRock Rack)、富士康工業(yè)互聯(lián)網(wǎng)(Foxconn Industrial Internet)、技嘉科技(GIGABYTE)、新華三(H3C)、浪潮(Inspur)、英業(yè)達(dá)(Inventec)、寧暢(Nettrix)、云達(dá)科技(QCT)、 超微(Supermicro)、 緯穎科技(Wiwynn)和超聚變(xFusion)。
全球趨勢
在亞洲、歐洲和美國,制定能效標(biāo)準(zhǔn)的法規(guī)尚未確定。這也推動了銀行和其他大型數(shù)據(jù)中心運(yùn)營商紛紛加入液冷技術(shù)評估的隊(duì)伍。
液冷技術(shù)的使用范圍并不局限于數(shù)據(jù)中心,汽車和其他系統(tǒng)也需要利用該項(xiàng)技術(shù)來冷卻封閉空間內(nèi)的高性能系統(tǒng)。
可持續(xù)發(fā)展之路
“我們即將開啟新的旅程,”Smith談及這一采用液冷技術(shù)的主流加速器首次亮相時如是說。
事實(shí)上,NVIDIA計(jì)劃于明年推出的一版 A100 PCIe 卡中搭載基于 NVIDIA Hopper 架構(gòu)的 H100 Tensor Core GPU。近期內(nèi),NVIDIA計(jì)劃將液冷技術(shù)應(yīng)用于自有高性能數(shù)據(jù)中心 GPU 和 NVIDIA HGX 平臺。
為推動快速采用,今日發(fā)布的液冷 GPU 可在減少能耗的同時維持性能不變。未來,我們期望這些卡在使用同等能源的條件下,展現(xiàn)更出色的性能,滿足用戶所需。
“僅僅測量功率沒有意義,降低碳排放的同時提升性能才是我們努力的方向,” Smith 說道。
詳細(xì)了解NVIDIA全新發(fā)布的 A100 PCIe 液冷 GPU。