作者:豐寧
內(nèi)存技術(shù)作為計(jì)算機(jī)系統(tǒng)的核心組成部分,其性能的提升對(duì)于整體計(jì)算能力的提升至關(guān)重要。在這個(gè)背景下,高帶寬內(nèi)存(HBM)以其卓越的性能表現(xiàn),正逐漸在內(nèi)存技術(shù)領(lǐng)域嶄露頭角,成為推動(dòng)計(jì)算領(lǐng)域進(jìn)入全新時(shí)代的關(guān)鍵力量。
相較于傳統(tǒng)的動(dòng)態(tài)隨機(jī)存取內(nèi)存(DRAM),HBM的性能優(yōu)勢(shì)顯而易見(jiàn)。
遠(yuǎn)遠(yuǎn)超越DDR
DDR 是一種常見(jiàn)的計(jì)算機(jī)內(nèi)存類(lèi)型,最早是為了提高內(nèi)存?zhèn)鬏斔俾识O(shè)計(jì)的。它采用了雙倍數(shù)據(jù)傳輸技術(shù),即在每個(gè)時(shí)鐘周期內(nèi)可以傳輸兩次數(shù)據(jù),從而提高了數(shù)據(jù)傳輸速率。
目前最常見(jiàn)的DDR版本是 DDR4、DDR5,但在過(guò)去還有 DDR3、DDR2、DDR等版本。每一代DDR版本都有不同的數(shù)據(jù)傳輸速率和性能。
DDR內(nèi)存通常用于計(jì)算機(jī)的系統(tǒng)內(nèi)存,用于存儲(chǔ)操作系統(tǒng)和正在運(yùn)行的應(yīng)用程序等數(shù)據(jù)。
HBM是一種高帶寬內(nèi)存技術(shù),專(zhuān)注于提供更高的內(nèi)存帶寬,尤其適用于高性能計(jì)算和圖形處理領(lǐng)域。HBM的一個(gè)顯著特點(diǎn)是,它使用了堆疊技術(shù),將多個(gè)DRAM芯片垂直堆疊在一起,從而大大增加了數(shù)據(jù)通路,提高了內(nèi)存的帶寬。
因此HBM 具有可擴(kuò)展更大容量的特性。不僅HBM 的單層 DRAM 芯片容量可擴(kuò)展,HBM 還可以通過(guò) 4 層、8 層以至 12 層堆疊的 DRAM 芯片,此外HBM可以通過(guò) SiP 集成多個(gè) HBM 疊層 DRAM 芯片等方法,實(shí)現(xiàn)更大的內(nèi)存容量。
HBM內(nèi)存通常用于高性能顯卡、GPU加速器以及需要大量數(shù)據(jù)傳輸?shù)母咝阅苡?jì)算應(yīng)用中。
從功耗角度來(lái)看,由于采用了 TSV 和微凸塊技術(shù),DRAM 裸片與處理器間實(shí)現(xiàn)了較短的信號(hào)傳輸路徑以及較低的單引腳 I/O 速度和 I/O 電壓,使 HBM 具備更好的內(nèi)存功耗能效特性。以 DDR3 存儲(chǔ)器歸一化單引腳 I/O 帶寬功耗比為基準(zhǔn),HBM2 的 I/O 功耗比明顯低于 DDR3、DDR4 和 GDDR5 存儲(chǔ)器,相對(duì)于 GDDR5 存儲(chǔ)器,HBM2 的單引腳 I/O 帶寬功耗比數(shù)值降低 42%。
在系統(tǒng)集成方面,HBM 將原本在 PCB 板上的 DDR 內(nèi)存顆粒和 CPU 芯片全部集成到 SiP 里,因此 HBM 在節(jié)省產(chǎn)品空間方面也更具優(yōu)勢(shì)。相對(duì)于 GDDR5 存儲(chǔ)器,HBM2 節(jié)省了 94% 的芯片面積。
三大原廠的研發(fā)歷程
目前的HBM市場(chǎng)主要以SK海力士、三星和美光三家公司為主。
2014 年,SK海力士與 AMD 聯(lián)合開(kāi)發(fā)了全球首款硅通孔HBM,至今已經(jīng)迭代升級(jí)了4代HBM產(chǎn)品,性能和容量持續(xù)提升。2020年SK海力士宣布成功研發(fā)新一代HBM2E;2021年開(kāi)發(fā)出全球第一款HBM3;2022年HBM3芯片供貨英偉達(dá)。2023年8月,SK海力士推出HBM3E,11月英偉達(dá)宣布H200將搭載HBM3E。
可以說(shuō)從HBM1、HBM2E、HBM3、HBM3E,SK海力士持續(xù)領(lǐng)先。2022年SK海力士占據(jù)HBM市場(chǎng)約50%的份額,三星占比40%,美光占比10%。
在很長(zhǎng)一段時(shí)間內(nèi),SK海力士都是英偉達(dá)HBM的獨(dú)家供應(yīng)商。2023年SK海力士基本壟斷了HBM3供應(yīng),今年其HBM3與HBM3E的訂單也已售罄。
三星是在2016年,開(kāi)始宣布量產(chǎn)4GB/8GB HBM2 DRAM;2018年,宣布量產(chǎn)第二代8GB HBM2;2020年,推出16GB HBM2E產(chǎn)品;2021年,三星開(kāi)發(fā)出具有AI處理能力的HBM-PIM;雖然三星的路線圖顯示2022年HBM3技術(shù)已經(jīng)量產(chǎn),但實(shí)際上三星的HBM3在2023年底才正式完成驗(yàn)證,這意味著在大量生產(chǎn)之前,市場(chǎng)還是由SK 海力士壟斷。
再看美光,2020年,美光宣布將開(kāi)始提供HBM2內(nèi)存/顯存;2021年,HBM2E產(chǎn)品上市。為了改善自己在HBM市場(chǎng)中的被動(dòng)地位,美光選擇了直接跳過(guò)第四代HBM即HBM3,直接升級(jí)到了第五代,即HBM3E。隨后在2023年9月,美光宣布推出HBM3 Gen2(即HBM3E),后續(xù)表示計(jì)劃于 2024 年初開(kāi)始大批量發(fā)貨 HBM3 Gen2 內(nèi)存,同時(shí)透露英偉達(dá)是主要客戶之一。
HBM2e過(guò)渡到HBM3e
HBM的概念的起飛與AIGC的火爆有直接關(guān)系。
AI大模型的興起催生了海量算力需求,而數(shù)據(jù)處理量和傳輸速率大幅提升使得AI服務(wù)器對(duì)芯片內(nèi)存容量和傳輸帶寬提出更高要求。HBM具備高帶寬、高容量、低延時(shí)和低功耗優(yōu)勢(shì),目前已逐步成為AI服務(wù)器中GPU的搭載標(biāo)配。
目前,HBM產(chǎn)品以HBM(第一代)、HBM2(第二代)、HBM2E(第三代)、HBM3(第四代)、HBM3E(第五代)的順序開(kāi)發(fā),最新的HBM3E是HBM3的擴(kuò)展版本。
HBM每一次更新迭代都會(huì)伴隨著處理速度的提高。引腳(Pin)數(shù)據(jù)傳輸速率為1Gbps的第一代HBM,發(fā)展到其第五代產(chǎn)品HBM3E,速率提高到了8Gbps,即每秒可以處理1.225TB的數(shù)據(jù)。也就是說(shuō),下載一部長(zhǎng)達(dá)163分鐘的全高清(Full-HD)電影(1TB)只需不到1秒鐘的時(shí)間。
當(dāng)然,存儲(chǔ)器的容量也在不斷加大。HBM2E的最大容量為16GB,目前,三星正在利用EUV光刻機(jī)來(lái)制造24GB容量的HBM3芯片,此外8層、12層堆疊可在HBM3E上實(shí)現(xiàn)36GB(業(yè)界最大)的容量,比HBM3高出50%。
此前SK海力士、美光均已宣布推出HBM3E芯片,皆可實(shí)現(xiàn)超過(guò)1TB/s的帶寬。
根據(jù)TrendForce集邦咨詢調(diào)查顯示,2023年HBM市場(chǎng)主流為HBM2e,包含NVIDIA A100/A800、AMD MI200以及多數(shù)CSPs自研加速芯片皆以此規(guī)格設(shè)計(jì)。同時(shí),為順應(yīng)AI加速器芯片需求演進(jìn),各原廠計(jì)劃于2024年推出新產(chǎn)品HBM3e,預(yù)期HBM3與HBM3e將成為明年市場(chǎng)主流。
HBM3e市場(chǎng)徹底被引爆
SK海力士無(wú)疑是這波內(nèi)存熱潮中的最大受益者,截至2023年12月31日,SK海力士在2023財(cái)年和第四季度的營(yíng)收取得了顯著增長(zhǎng)。特別是其主力產(chǎn)品DDR5 DRAM和HBM3,在這一年的收入較去年上漲了4倍以上。
英偉達(dá)和AMD的下一代人工智能GPU預(yù)計(jì)將主要搭載HBM3內(nèi)存。例如,H100是第一款支持PCIe 5.0標(biāo)準(zhǔn)的GPU,也是第一款采用HBM3的GPU,最多支持六顆HBM3,帶寬為3TB/s,是A100采用HBM2E的1.5倍,默認(rèn)顯存容量為80GB。
2023年11月英偉達(dá)發(fā)布了新一代AI GPU芯片H200,以及搭載這款GPU的AI服務(wù)器平臺(tái)HGX H200等產(chǎn)品。這款GPU是H100的升級(jí)款,依舊采用Hopper架構(gòu)、臺(tái)積電4nm制程工藝,根據(jù)英偉達(dá)官網(wǎng),H200的GPU芯片沒(méi)有升級(jí),核心數(shù)、頻率沒(méi)有變化,主要的升級(jí)便是首次搭載HBM3e顯存,并且容量從80GB提升至141GB。
得益于新升級(jí)的HBM3e芯片,H200的顯存帶寬可達(dá)4.8TB/s,比H100的3.35TB/s提升了43%。不過(guò)這遠(yuǎn)沒(méi)有達(dá)到HBM3e的上限,海外分析人士稱(chēng)英偉達(dá)有意降低HBM3e的速度,以追求穩(wěn)定。如果與傳統(tǒng)x86服務(wù)器相比,H200的內(nèi)存性能最高可達(dá)110倍。
由于美光、SK海力士等公司的HBM3e芯片需等到2024年才會(huì)發(fā)貨,因此英偉達(dá)表示H200產(chǎn)品預(yù)計(jì)將在2024年第二季度正式開(kāi)售。
AMD 的 MI300 也搭配 HBM3,其中,MI300A 容量與前一代相同為 128GB,更高端 MI300X 則達(dá) 192GB,提升了 50%。AMD稱(chēng),MI300X提供的HBM密度最高是英偉達(dá)AI芯片H100的2.4倍,其HBM帶寬最高是H100的1.6倍。這意味著,AMD的芯片可以運(yùn)行比英偉達(dá)芯片更大的模型。
與此同時(shí),在2023年隨著AI GPU 以及與AI相關(guān)的各類(lèi)需求激增,HBM價(jià)格也持續(xù)上漲。市場(chǎng)研究機(jī)構(gòu)Yolo Group 報(bào)告顯示,2023 年期間HBM 內(nèi)存供需鏈發(fā)生了重大變化,生產(chǎn)水平和采用率同時(shí)大幅提高,使得 HBM 成為比人工智能熱潮之前更有價(jià)值的資源,2023年 HBM 芯片的平均售價(jià)是傳統(tǒng) DRAM 內(nèi)存芯片的五倍。
在HBM盛行的當(dāng)下,沒(méi)有一家存儲(chǔ)廠商能夠忍住不分一杯羹。
三大原廠為之“瘋狂”
技術(shù)升級(jí)
SK海力士在SEMICON Korea 2024上發(fā)布了一項(xiàng)重要公告,公布了其雄心勃勃的高帶寬存儲(chǔ)器路線圖。該公司副總裁Kim Chun-hwan透露,計(jì)劃在2024上半年開(kāi)始量產(chǎn)先進(jìn)的HBM3E,并強(qiáng)調(diào)向客戶交付8層堆疊樣品。
HBM3E是SK海力士產(chǎn)品線的最新產(chǎn)品,可滿足日益增長(zhǎng)的數(shù)據(jù)帶寬需求,在6堆棧配置中,每堆??商峁?.2 TB/s和驚人的7.2 TB/s通信帶寬。Kim Chun-hwan將這種進(jìn)步的緊迫性歸因于生成式人工智能的迅速崛起,預(yù)計(jì)將見(jiàn)證驚人的35%的復(fù)合年增長(zhǎng)率(CAGR)。然而,他警告說(shuō),在不斷升級(jí)的客戶期望的推動(dòng)下,半導(dǎo)體行業(yè)正在面臨“激烈的生存競(jìng)爭(zhēng)”。
隨著制程工藝節(jié)點(diǎn)的縮小并接近其極限,半導(dǎo)體行業(yè)越來(lái)越關(guān)注下一代存儲(chǔ)器架構(gòu)和工藝,以釋放更高的性能。SK海力士已經(jīng)啟動(dòng)了HBM4的開(kāi)發(fā),計(jì)劃于2025年提供樣品,并于次年量產(chǎn)。
根據(jù)美光的信息,與前幾代HBM相比,HBM4將采用更廣泛的2048位接口。導(dǎo)致每個(gè)堆棧的理論峰值內(nèi)存帶寬超過(guò)1.5 TB/s。為了實(shí)現(xiàn)這些非凡的帶寬,在保持合理功耗的同時(shí),HBM4的目標(biāo)是大約6GT/s的數(shù)據(jù)傳輸速率。這種更寬的接口和更快的速度將使HBM4能夠突破內(nèi)存帶寬的界限,滿足日益增長(zhǎng)的高性能計(jì)算和AI工作負(fù)載需求。
三星是半導(dǎo)體行業(yè)的主要參與者,該公司也有HBM4的發(fā)布時(shí)間表,計(jì)劃于2025年提供樣品,并于2026年量產(chǎn)。三星高管Jaejune Kim透露,該公司的HBM產(chǎn)量的一半以上已經(jīng)由專(zhuān)業(yè)產(chǎn)品組成。定制HBM解決方案的趨勢(shì)預(yù)計(jì)將加劇。通過(guò)邏輯集成,量身定制的選項(xiàng)對(duì)于滿足個(gè)性化客戶需求至關(guān)重要,從而鞏固了市場(chǎng)地位。
隨著HBM3E的發(fā)布和HBM4的準(zhǔn)備,SK海力士和三星正在為未來(lái)的挑戰(zhàn)做準(zhǔn)備,旨在保持其在HBM技術(shù)前沿的地位。不僅如此,全球前三大存儲(chǔ)芯片制造商正將更多產(chǎn)能轉(zhuǎn)移至生產(chǎn)HBM,但由于調(diào)整產(chǎn)能需要時(shí)間,很難迅速增加HBM產(chǎn)量,預(yù)計(jì)未來(lái)兩年HBM供應(yīng)仍將緊張。
擴(kuò)產(chǎn)情況
再看三大原廠的擴(kuò)產(chǎn)情況。據(jù)悉,SK海力士將擴(kuò)大其高帶寬內(nèi)存生產(chǎn)設(shè)施投資,以應(yīng)對(duì)高性能AI產(chǎn)品需求的增加。
去年6月有媒體報(bào)道稱(chēng),SK海力士正在準(zhǔn)備投資后段工藝設(shè)備,將擴(kuò)建封裝HBM3的利川工廠,預(yù)計(jì)到今年年末,該廠后段工藝設(shè)備規(guī)模將增加近一倍。
此外,SK海力士還將在美國(guó)印第安納州建造一座最先進(jìn)的制造工廠,據(jù)兩位接受英國(guó)《金融時(shí)報(bào)》采訪的消息人士透露,SK海力士將在這家工廠生產(chǎn) HBM 堆棧,這些堆棧將用于臺(tái)積電生產(chǎn)的 Nvidia GPU,SK 集團(tuán)董事長(zhǎng)表示,該工廠預(yù)計(jì)耗資 220 億美元。三星電子和 SK 海力士之間的競(jìng)爭(zhēng)正在升溫。
三星電子從去年第四季度開(kāi)始擴(kuò)大第四代HBM即HBM3的供應(yīng),目前正進(jìn)入一個(gè)過(guò)渡期。負(fù)責(zé)三星美國(guó)半導(dǎo)體業(yè)務(wù)的執(zhí)行副總裁 Han Jin-man 在今年1月表示,公司對(duì)包括 HBM 系列在內(nèi)的大容量存儲(chǔ)芯片寄予厚望,希望它能引領(lǐng)快速增長(zhǎng)的人工智能芯片領(lǐng)域。他在CES 2024的媒體見(jiàn)面會(huì)上對(duì)記者說(shuō),“我們今年的 HBM 芯片產(chǎn)量將比去年提高 2.5 倍,明年還將繼續(xù)提高 2 倍?!?/p>
三星官方還透露,公司計(jì)劃在今年第四季度之前,將 HBM 的最高產(chǎn)量提高到每月 15 萬(wàn)至 17 萬(wàn)件,以此來(lái)爭(zhēng)奪2024年的HBM市場(chǎng)。此前三星電子斥資105億韓元收購(gòu)了三星顯示位于韓國(guó)天安市的工廠和設(shè)備,以擴(kuò)大HBM產(chǎn)能,同時(shí)還計(jì)劃投資7000億至1萬(wàn)億韓元新建封裝線。
為了縮小差距,美光對(duì)其下一代產(chǎn)品 HBM3E 下了很大的賭注,美光首席執(zhí)行官 Sanjay Mehrotra 表示:“我們正處于為英偉達(dá)下一代 AI 加速器提供 HBM3E 的驗(yàn)證的最后階段。”其計(jì)劃于 2024 年初開(kāi)始大批量發(fā)貨 HBM3E 內(nèi)存,同時(shí)強(qiáng)調(diào)其新產(chǎn)品受到了整個(gè)行業(yè)的極大興趣。據(jù)悉,美光科技位于中國(guó)臺(tái)灣地區(qū)的臺(tái)中四廠已于2023年11月初正式啟用。美光表示,臺(tái)中四廠將整合先進(jìn)探測(cè)與封裝測(cè)試功能,量產(chǎn)HBM3E及其他產(chǎn)品,從而滿足人工智能、數(shù)據(jù)中心、邊緣計(jì)算及云端等各類(lèi)應(yīng)用日益增長(zhǎng)的需求。該公司計(jì)劃于2024年初開(kāi)始大量出貨HBM3E。
值得注意的是高階HBM的競(jìng)爭(zhēng)才剛剛開(kāi)始,雖然目前HBM產(chǎn)品占整體存儲(chǔ)的出貨量仍然非常小,長(zhǎng)期來(lái)看,隨著消費(fèi)電子產(chǎn)品向AI化發(fā)展,對(duì)于高算力、高存儲(chǔ)、低能耗將是主要訴求方向,鑒于此預(yù)計(jì)HBM也將成為未來(lái)存儲(chǔ)廠商的技術(shù)發(fā)展方向。