近期市場關注NVIDIA (英偉達)GB200整柜式方案(Rack)各項供應進度,由于GB200 Rack在高速互通界面、熱設計功耗(TDP)等設計規(guī)格皆明顯高于市場主流,供應鏈業(yè)者需要更多時間持續(xù)調(diào)校、優(yōu)化,預期最快將于2025年第二季后才有機會放量。
NVIDIA GB Rack方案(包括GB200、GB300等)因導入技術層次更復雜、高成本等特性,主要客戶將為大型云服務提供商(CSP),以及Tier-2數(shù)據(jù)中心、國家主權云和學術研究單位等HPC/AI應用項目。在NVIDIA大力推動下,預期GB200 NVL72機柜將于2025年成為主要的采用方案,占比可望接近80%。
TrendForce集邦咨詢表示,為提升AI/HPC Server系統(tǒng)整體運算效能,NVIDIA開發(fā)NVLink以提供GPU芯片之間的高速互連技術,如GB200采用第五代NVLink,總頻寬大幅優(yōu)于目前市場主流PCIe 5.0。此外,2024年主導市場的HGX AI Server每柜TDP動輒達60 KW至80 KW,而GB200 NVL72每柜則達到140 KW,TDP再度提升一倍,為此業(yè)者嘗試擴大采用液冷散熱解決方案。
由于GB200 Rack系統(tǒng)采用更高設計規(guī)格,市場頻傳可能因部分零部件未達要求,有延遲出貨風險。根據(jù)TrendForce集邦咨詢調(diào)查,目前Blackwell GPU芯片出貨情形大致如原先預期,2024年第四季僅少量出貨,2025年第一季后逐季放量。在AI Server系統(tǒng)方面,因尚待供應鏈各環(huán)節(jié)持續(xù)調(diào)整,至今年底的出貨量恐低于業(yè)者預期,據(jù)此,2025年GB200整機柜的出貨高峰將略有延后。
傳統(tǒng)氣冷散熱解決方案已無法應對GB200 NVL72的TDP值,液冷技術成為其必需。隨著GB200 Rack方案于2024年底開始小量出貨,相關業(yè)者也加大液冷散熱零部件研發(fā)能量,如冷卻分配系統(tǒng)(CDU)供應商正透過擴大機柜尺寸和采用更高效的冷卻板(Cold Plate)提高散熱效能。TrendForce集邦咨詢表示,目前Sidecar CDU的散熱能力主要集中于60 KW至80 KW,未來可望達成雙倍甚至逾三倍的散熱表現(xiàn)。至于更高效的液對液(L2L)型in-row CDU方案,散熱能力已能超過1.3MW,未來也將繼續(xù)提升,以應對算力增長需求。