進入了物聯(lián)網(wǎng)時代的我們,或多或少都患上了電源焦慮癥,不由自主地會去操心“智能”的手機、手環(huán)、門鎖等設(shè)備,是否還有足夠的電可用。
這些在物聯(lián)網(wǎng)邊緣端的設(shè)備通常體積小,只能電池供電,電源系統(tǒng)的設(shè)計確實是個卡脖子的問題。不過,對于普通的用戶來說,很多人并沒有意識到,在物聯(lián)網(wǎng)的另一端,也就是數(shù)據(jù)中心所在的云端,所面臨的電源問題也同樣很值得“焦慮”,因為數(shù)據(jù)中心太費電了!
數(shù)據(jù)中心:能耗大戶
作為數(shù)字時代的“云腦”,數(shù)據(jù)中心擔負了海量數(shù)據(jù)的處理和計算工作,而這種高密度數(shù)據(jù)處理背后,則是不斷攀升的耗電量。以中國為例,全國數(shù)據(jù)中心的耗電量的增速已連續(xù) 8 年超過 12%——2017 年,國內(nèi)數(shù)據(jù)中心總耗電量就已經(jīng)達到 1200-1300 億千瓦時,這個數(shù)字超過了三峽大壩和葛洲壩電廠發(fā)電量之和;預(yù)計到 2020 年,這個數(shù)值將達到 2962 億千瓦時,2025 年則會高達 3842.2 億千瓦時。
在全球范圍內(nèi),同樣的趨勢也在發(fā)生,有分析稱到 2025 年,數(shù)據(jù)中心將占到全球能耗的 33%,位居能耗第一把交椅。而隨著 AI 人工智能等需要更充沛算力支持的技術(shù)和應(yīng)用的發(fā)展,實際的數(shù)據(jù)中心能耗增速,很可能比這個更快。
既然是耗電大戶,那么考慮如何讓數(shù)據(jù)中心更省電,就成了人們努力的方向。為此,人們對數(shù)據(jù)中心的能耗構(gòu)成進行了分析:
1. 對于一個傳統(tǒng)的數(shù)據(jù)中心來說,IT 設(shè)備的能耗最高,約占到總能耗的 50%,這部分能耗是直接用來進行數(shù)據(jù)計算和處理的;
2. 其次,制冷系統(tǒng)能耗占比約為 35%,主要是在 IT 設(shè)備運行時為其降溫,確保其能夠在規(guī)定的工作溫度范圍為內(nèi)正常工作;
3. 接下來是配電系統(tǒng)的能耗,主要是 UPS 設(shè)備的能耗和電能在配電系統(tǒng)傳輸和變壓轉(zhuǎn)化過程中的損耗,約為 10%;
4. 最后一項是照明和其他數(shù)據(jù)中心配套支持系統(tǒng)的能耗,約占 5%。
圖 1:傳統(tǒng)數(shù)據(jù)中心的能耗構(gòu)成
為數(shù)據(jù)中心“退熱”
在此基礎(chǔ)上人們又提出了一個衡量數(shù)據(jù)中心能源利用效率的指標 PUE((Power Usage Effectiveness),其含義為數(shù)據(jù)中心全年總耗電量除以其中 IT 設(shè)備全年耗電量,也就是上述數(shù)據(jù)中心能耗構(gòu)成中的 1-4 項總和與第 1 項數(shù)值之比。從這個定義可以看出,PUE 越低則說明數(shù)據(jù)中心在 IT 設(shè)備以外消耗的電能越少, 越節(jié)能。
因此,如何將 PUE 的數(shù)值降下來,也就成了數(shù)據(jù)中心運營者和行業(yè)管理部門最操心的事情。比如在中國,2019 年 2 月國家工信部、國家機關(guān)事務(wù)管理局和國家能源局三部委聯(lián)合發(fā)布了《關(guān)于加強綠色數(shù)據(jù)中心建設(shè)的指導(dǎo)意見》,提出了“到 2022 年,數(shù)據(jù)中心平均能耗基本達到國際先進水平,新建大型、超大型數(shù)據(jù)中心的電能使用效率值達到 1.4 以下”的目標,而以前很多老舊數(shù)據(jù)中心的 PUE 普遍大于 2,可見現(xiàn)實和理想之間的 gap 還是不小的。
從數(shù)據(jù)中心能耗結(jié)構(gòu)中我們可以看出,想要顯著減低 PUE,一個最直接的方法就是減少制冷系統(tǒng)的能耗,因為其在非 IT 設(shè)備能耗中占大頭。為此,人們也是煞費苦心,祭出了不少大招兒。比如采用散熱效率更高的液冷(水冷)方式,或者干脆將數(shù)據(jù)中心建造在環(huán)境溫度較低的地區(qū)——甚至是在北極和海底。更高大上一些的做法還包括將 AI 技術(shù)引入到能耗管理中,谷歌就宣稱建立了 PUE 的神經(jīng)網(wǎng)絡(luò)模型,采用基于機器學習的數(shù)據(jù)中心能耗管理方法,將總的制冷功耗降低約 40%, 從而使得數(shù)據(jù)中心的總功耗降低 15%左右。
從 IT 設(shè)備的電源管理入手
不過上面這些大小招數(shù),都有一個共同之處,就是消除數(shù)據(jù)中心 IT 設(shè)備運行過程中已經(jīng)產(chǎn)生的熱量。而實際上除此之外,還有一個更為根本的措施,那就是從 IT 設(shè)備(比如服務(wù)器)自身出發(fā),通過有效的電源管理提升其能效,盡可能減少能量損耗所產(chǎn)生的熱量。只有在前端和源頭的工作做得更好,后續(xù)冷卻散熱處理的壓力才會更小。
半導(dǎo)體工藝的進步,是減少服務(wù)器中擔負數(shù)據(jù)計算處理工作的 IC 能耗、提升其效率最基礎(chǔ)的方法。不過大家也知道,工藝進入納米級之后摩爾定律的推進速度日漸放緩,在有些方面可以說是舉步維艱,因此單單指望這一個方面的努力,肯定是無法滿足數(shù)據(jù)中心當下的節(jié)能增效之需的,因此我們還需要從其他一些細節(jié)之處去挖潛。
比如說服務(wù)器中主處理器所需的電能,都是經(jīng)過外圍的電源管理器件轉(zhuǎn)化處理后提供的,而以往由于這些電源管理器件的外形尺寸問題,無法將其放置在處理器芯片的附近,而從電源管理器件到處理器之間較長的布線勢必會導(dǎo)致額外的功率損耗,產(chǎn)生更多的熱量。為此,就需要配套的電源管理器件朝向高效率和小型化的方向進行演進。
比如 TDK 新近開發(fā)的新款μPOL? DC-DC 轉(zhuǎn)換器,利用 3D 封裝技術(shù)將電源管理 IC、電感器等元器件集成到一個僅為 3.3 mm × 3.3 mm × 1.5 mm 的封裝中,且能夠支持 6A 輸出電流,與其他同類產(chǎn)品相比,解決方案尺寸縮小了一半,而功率密度則高達 1W/mm3。
圖 2:采用 3D 封裝的μPOL? DC-DC 轉(zhuǎn)換器尺寸更小,能量密度更高(圖片來源:TDK)
這樣的小型化設(shè)計,使得μPOL? DC-DC 轉(zhuǎn)換器在系統(tǒng)設(shè)計時可以盡可能靠近負載點,避免了由于布線距離長而產(chǎn)生的能耗。而且該器件自身還具有出色的散熱特性,可以貼裝在空氣流動不佳的電路板背部,從而進一步提高設(shè)計靈活性并節(jié)省整個系統(tǒng)所占的空間。
圖 3:μPOL? DC-DC 轉(zhuǎn)換器與以往產(chǎn)品的比較(圖片來源:TDK)
未來世界將是數(shù)據(jù)驅(qū)動的,這已經(jīng)成為了人們的共識;而為了實現(xiàn)這個目標,首先就要有足夠的能量去“驅(qū)動”這些數(shù)據(jù),在這個方面人們的體認也在不斷深化。伴隨著這一發(fā)展過程的,是一系列電源管理技術(shù)的進步??紤]到數(shù)據(jù)中心在未來世界能耗結(jié)構(gòu)中的地位,我們從電源管理中獲得的每 1%或者是 0.1%效率的提升,都會成為數(shù)據(jù)中心的“退熱貼”,為數(shù)據(jù)中心的“健康”運轉(zhuǎn),乃至整個社會的節(jié)能減排做出實實在在的貢獻。