在芯片叢林競爭中,新的技術(shù)架構(gòu)往往意味著能改變游戲規(guī)則。
曾幾何時(shí),數(shù)據(jù)如同洶涌的潮水,以指數(shù)級的速度在我們的數(shù)字世界里泛濫。從巨型數(shù)據(jù)中心到小小的個(gè)人電腦,都被卷入了這場數(shù)據(jù)洪流之中....此時(shí),數(shù)據(jù)的心臟“芯片”,演繹著一輪又一輪技術(shù)之戰(zhàn)。本文的主角CXL高速互聯(lián)技術(shù),正是從這片“混亂”的數(shù)據(jù)海洋中,開辟出一條嶄新的航道,使得不同類型的芯片可以實(shí)現(xiàn)更加緊密地協(xié)同工作,從而成為推動計(jì)算領(lǐng)域變革的關(guān)鍵力量。
從傳輸協(xié)議到資源共享,CXL究竟何物?
當(dāng)前大數(shù)據(jù)、人工智能(AI)、云計(jì)算等領(lǐng)域快速發(fā)展,傳統(tǒng)的芯片架構(gòu)和連接方式,在海量數(shù)據(jù)的沖擊下,漸漸有些力不從心。就好比一條狹窄的河道,要通過日益增多的船只,堵塞和低效成為了常態(tài)。特別是在數(shù)據(jù)中心、高性能計(jì)算(HPC)應(yīng)用場景中,存儲和計(jì)算之間的協(xié)作瓶頸愈發(fā)明顯,大大限制了整個(gè)系統(tǒng)的性能。
此背景下,CXL技術(shù)應(yīng)運(yùn)而生,通過高速接口,打破了存儲和計(jì)算之間的隔閡,使其更高效地共享資源。CXL被認(rèn)為是構(gòu)建芯片之間的“超級高速公路”,允許不同的芯片組件,包括CPU、GPU、FPGA以及內(nèi)存等,能夠以一種高速、低延遲且高效的方式相互通信和共享數(shù)據(jù)。
從本質(zhì)上講,CXL(Compute Express Link)是一種新型的高速互聯(lián)技術(shù),即下一代接口,可有效連接高性能計(jì)算系統(tǒng)中的CPU/GPU、存儲器等,支持大容量、超高速計(jì)算。對計(jì)算機(jī)系統(tǒng)而言,PCle和CXL技術(shù)都是重要的連接技術(shù)。從二者區(qū)別來看,CXL比PCIe具有更高的帶寬、更低的延遲,以及內(nèi)存擴(kuò)展、緩存一致性和設(shè)備直接內(nèi)存訪問等更多的功能。其實(shí)從另一個(gè)角度來說,PCIe技術(shù)是CXL技術(shù)的底層基礎(chǔ),CXL則可視為PCIe技術(shù)的再提高版本,延伸了更多變革性的功能。
1、CXL加速進(jìn)化,3.2版本已來臨
從范式演變路徑來看,目前,CXL已經(jīng)發(fā)表了1.0/1.1、2.0、3.0/3.1/3.2多個(gè)不同的版本。2019年CXL1.0版本正式發(fā)布,到2022年CXL規(guī)范更新至3.0版本,隨后2023年CXL3.1發(fā)布,到如今CXL3.2發(fā)布,CXL正在不斷進(jìn)步和成熟。
圖片來源:全球半導(dǎo)體觀察根據(jù)公開信息制圖
其中,CXL1.0版本于2019年3月推出,是CXL系列的開山之作,基于PCIe5.0技術(shù)構(gòu)建,并引入了緩存一致性協(xié)議(CXL.cache),使得主機(jī)CPU能夠高效地訪問加速器設(shè)備上的共享內(nèi)存資源;
CXL2.0在2020年11月發(fā)布,基于PCIe5.0技術(shù),內(nèi)存的池化(Pooling)功能較好地實(shí)現(xiàn)了以內(nèi)存為中心的構(gòu)想;
CXL3.0于2022年8月推出,在物理層基于PCIe6.0實(shí)現(xiàn)帶寬提升和信號傳輸方式改變,邏輯層增強(qiáng)了連接拓?fù)?、?nèi)存共享與訪問、數(shù)據(jù)包大小等,同時(shí)擴(kuò)展了功能,包括消除設(shè)備連接限制、增強(qiáng)設(shè)備通信、加入錯(cuò)誤糾正機(jī)制和提升fabric功能等;
CXL3.1于2023年11月發(fā)布,具備開啟更多對等通信通道的能力,實(shí)現(xiàn)了對內(nèi)存和存儲的獨(dú)立分離,形成獨(dú)立的模塊,據(jù)悉它將支持DDR6內(nèi)存;
CXL3.2規(guī)范于2024年12月公布,該版本優(yōu)化了CXL存儲設(shè)備的監(jiān)控和管理,增強(qiáng)了CXL存儲設(shè)備在操作系統(tǒng)和應(yīng)用程序方面的功能,并通過可信安全協(xié)議TSP擴(kuò)展了安全性。
2、三套“組合拳”,CXL融合三種子協(xié)議
目前,CXL包括三個(gè)不同的協(xié)議層次,分別是CXL.io、CXL.cache、CXL.memory,每種協(xié)議在CXL的架構(gòu)中都有特定的功能和應(yīng)用場景。這三種協(xié)議的結(jié)合,使CXL成為支持異構(gòu)計(jì)算、大規(guī)模數(shù)據(jù)處理和高效計(jì)算資源共享的重要技術(shù),尤其是在數(shù)據(jù)中心、AI加速和高性能計(jì)算領(lǐng)域具有廣泛的應(yīng)用前景。
·CXL.io:指CXL的基礎(chǔ)協(xié)議,用于連接計(jì)算、存儲和加速器(如GPU、FPGA)等不同的硬件資源。類似于PCIe的角色,可提供一個(gè)穩(wěn)定的通信通道,使得CXL設(shè)備可以順利“對話”。
·CXL.cache:稱為緩存一致性協(xié)議,主要用于數(shù)據(jù)緩存,使得不同計(jì)算單元之間可以共享緩存信息,從而減少內(nèi)存和存儲的訪問次數(shù),進(jìn)一步降低延遲。
·CXL.memory:稱為內(nèi)存共享協(xié)議,屬于CXL最核心的協(xié)議之一,允許不同的計(jì)算單元共享內(nèi)存資源,適用于需要大規(guī)模內(nèi)存共享和資源池化的場景,如云計(jì)算、數(shù)據(jù)中心、大數(shù)據(jù)分析等。具體可以理解為,傳統(tǒng)的計(jì)算架構(gòu)中,每個(gè)處理單元只能訪問自己專有的內(nèi)存,而CXL突破了這種限制,支持GPU、FPGA、DPU等直接訪問主機(jī)內(nèi)存,甚至將內(nèi)存資源進(jìn)行池化,實(shí)現(xiàn)高效的內(nèi)存共享和靈活的內(nèi)存分配。該功能提高了系統(tǒng)的可靠性,即使發(fā)生內(nèi)存故障,CPU仍可以通過外部設(shè)備繼續(xù)運(yùn)行。
CXL啟航,存儲大廠角逐新藍(lán)海
整個(gè)CXL生態(tài)正處于加速發(fā)展的階段,技術(shù)標(biāo)準(zhǔn)不斷演進(jìn),從CXL1.0逐步發(fā)展到CXL3.2,功能和性能持續(xù)提升。在應(yīng)用方面,范圍也在持續(xù)擴(kuò)大,從高性能計(jì)算、數(shù)據(jù)中心,逐步拓展到人工智能加速、云計(jì)算、邊緣計(jì)算等新興領(lǐng)域。如今,各種各樣的CXL產(chǎn)品已經(jīng)落地應(yīng)用。
隨著CXL技術(shù)逐步進(jìn)入主流市場,多家大廠紛紛布盤落子,目前CXL技術(shù)聯(lián)盟已匯聚了超過200多家成員,涵蓋了眾多領(lǐng)域的知名企業(yè)。
其中,CPU領(lǐng)域如英特爾、AMD等積極參與其中,從技術(shù)研發(fā)到產(chǎn)品應(yīng)用全面推動CXL的發(fā)展;服務(wù)器領(lǐng)域如戴爾EMC、HPE、華為、浪潮信息等也陸續(xù)加入,為CXL技術(shù)在服務(wù)器領(lǐng)域的應(yīng)用提供了強(qiáng)大的硬件支持和解決方案;存儲器領(lǐng)域如三星、SK海力士、美光科技、鎧俠等更是在CXL技術(shù)的推動下,不斷創(chuàng)新和推出新的存儲產(chǎn)品。
值得一提是,三星、SK海力士、美光科技、鎧俠這幾家存儲大廠已儼然成為了CXL的資深玩家。
圖表來源:全球半導(dǎo)體觀察根據(jù)公開信息整理
三星
三星于2021年5月開發(fā)出全球首款基于CXL的DRAM技術(shù);2022年推出業(yè)界首款高容量512GB CXL DRAM;2023年5月開發(fā)出支持CXL2.0的128GB CXL DRAM;2024年3月,三星在Memcon 2024發(fā)布了CXL內(nèi)存模塊-盒式(CMM-B),支持高達(dá)2TB容量與60GB/s帶寬,適用于AI和大數(shù)據(jù)分析等大內(nèi)存需求應(yīng)用。此外,三星與博通旗下的VMware推出了基于FPGA的分層內(nèi)存解決方案CMM-HTM,結(jié)合DRAM與NAND介質(zhì),優(yōu)化內(nèi)存管理,提升性能并降低成本。
2024年6月,三星宣布成功打造業(yè)界首個(gè)獲得紅帽認(rèn)證的CXL基礎(chǔ)設(shè)施。這意味著從CXL相關(guān)產(chǎn)品到軟件,構(gòu)成服務(wù)器的各種元素現(xiàn)在都可以在位于韓國華城的三星存儲器研發(fā)中心(SMRC)直接進(jìn)行驗(yàn)證。
另據(jù)《ZDNet Korea》7月報(bào)道,三星電子存儲部門新業(yè)務(wù)規(guī)劃團(tuán)隊(duì)董事總經(jīng)理Choi Jang-seok表示,即將推出的內(nèi)存模塊被指定為CMM-D2.0,將符合CXL2.0協(xié)議。這些模塊采用1ynm工藝DRAM顆粒,代表20-10nm級別的第二代DRAM技術(shù),該技術(shù)能夠生產(chǎn)提供更高容量同時(shí)保持性能效率的內(nèi)存模塊。
除了CMM-D模塊,三星還在開發(fā)一系列CXL存儲產(chǎn)品。其中包括集成多個(gè)CMM-D模塊的CMM-B內(nèi)存盒模塊,以及將DRAM內(nèi)存與NAND閃存顆粒相結(jié)合的CMM-H混合存儲模塊。
ChoiJang-seok此前強(qiáng)調(diào),隨著CXL3.1技術(shù)的采用,CXL內(nèi)存資源可以在多個(gè)主機(jī)之間共享,預(yù)計(jì)CXL市場將在今年下半年蓬勃發(fā)展,在2028年左右實(shí)現(xiàn)顯著增長。
SK海力士
2022年,SK海力士開發(fā)了首款結(jié)合計(jì)算功能與CXL存儲器的CMS(Computational Memory Solution),該方案是其與SK Telecom合作開發(fā)的成果,集成了計(jì)算功能,是首個(gè)將計(jì)算功能集成到CXL內(nèi)存中的產(chǎn)品。
2024年初,SK海力士還展示了多款CXL產(chǎn)品,包括CMM-DDR5內(nèi)存模塊和Niagara 2.0,通過HMSDK提升系統(tǒng)性能。2024年9月,SK海力士的HMSDK軟件成功集成至Linux操作系統(tǒng),優(yōu)化CXL存儲器運(yùn)行,帶寬擴(kuò)展30%以上。2024年11月,SK海力士與ASICLAND簽署311億韓元的CXL存儲器控制器設(shè)計(jì)合約,預(yù)計(jì)將在臺積電5納米制程上量產(chǎn)CXL 3.0/3.1芯片。
此外,SK海力士表示,據(jù)半導(dǎo)體行業(yè)預(yù)測,隨著下半年首批采用“CXL2.0”規(guī)格的服務(wù)器CPU問世,CXL將正式進(jìn)入商業(yè)化階段。為此,公司正在對96GB(千兆字節(jié))及128GB容量的CXL2.0存儲器進(jìn)行客戶驗(yàn)證,并計(jì)劃在年底實(shí)現(xiàn)量產(chǎn)。
美光
2023年,美光發(fā)布了CZ120 CXL內(nèi)存擴(kuò)展模塊,支持CXL 2.0 Type3標(biāo)準(zhǔn),具有128GB和256GB兩個(gè)容量選項(xiàng),帶寬高達(dá)36GB/s。2024年,美光的CZ122模塊通過與英特爾至強(qiáng)6平臺的測試,顯著提升了HPC和AI工作負(fù)載的內(nèi)存帶寬。
2024年5月,美光科技申請一項(xiàng)名為“在計(jì)算快速鏈路通信中使用張量存儲器存取的方法”的專利,旨在提高存儲器存取效率。業(yè)界稱,該專利中提到的張量存取電路能夠根據(jù)與存儲器的訪問操作相關(guān)的CXL命令進(jìn)行相應(yīng)的存儲器映射,這意味著美光的這項(xiàng)專利技術(shù)可以與CXL技術(shù)深度結(jié)合。
鎧俠
2023年8月,鎧俠在Flash Memory Summit 2023上展示了其基于3D NAND和XL-Flash CXL解決方案,并透露計(jì)劃推出兩款CXL產(chǎn)品lineup。其中,CXL+XL-Flash-based設(shè)備面向內(nèi)存數(shù)據(jù)庫和AI推理等以性能和可靠性為核心的應(yīng)用;CXL+BICS 3D NAND-powered設(shè)備則適用于大數(shù)據(jù)和AI訓(xùn)練等對容量要求較高的應(yīng)用。
2024年11月,鎧俠宣布其CXL接口存儲器研發(fā)項(xiàng)目獲得日本政府支持,計(jì)劃投入360億日元,加速CXL存儲器的商業(yè)化進(jìn)程,預(yù)計(jì)2030-2034年實(shí)現(xiàn)市場化。
與DRAM相比,CXL存儲器更省電,而與NAND Flash相比,其擁有更快的讀取速度。具體而言,DRAM在電力中斷時(shí)數(shù)據(jù)就會消失,而CXL存儲器不僅能保留斷電時(shí)的數(shù)據(jù),還能大幅降低AI驅(qū)動下的能耗。
結(jié)語
CXL技術(shù)在數(shù)據(jù)洪峰的沖擊下破局而生,憑借精妙的技術(shù)原理搭建起芯片間的高效通路,成為了芯片行業(yè)協(xié)同發(fā)展的關(guān)鍵紐帶。CXL聯(lián)盟中的巨頭們的戰(zhàn)略布局,各顯神通,存儲廠商的積極參與也讓其生態(tài)日益繁榮,共同編織出一張緊密相連、高效協(xié)作的芯片產(chǎn)業(yè)新網(wǎng)絡(luò)。
正如美光科技認(rèn)為的那樣,“CXL技術(shù)是解決現(xiàn)代計(jì)算架構(gòu)中“內(nèi)存墻”問題的關(guān)鍵,未來將對DRAM位增長率產(chǎn)生影響?!痹谶@場技術(shù)變革的浪潮中,CXL技術(shù)從2019年的CXL1.0,到2023年的CXL3.1,再到2024年的CXL3.2,未來將以不可阻擋之勢重塑行業(yè)格局。