ChatGPT引發(fā)全球開啟 AI大模型軍備賽,受此影響,AI算力市場增勢顯著,數(shù)據(jù)中心擴(kuò)容和升級在即。其中,光模塊作為數(shù)據(jù)中心設(shè)備互聯(lián)的關(guān)鍵載體,需求量隨之增長,與此同時(shí),降低功耗、成本,并提升能效仍然是核心訴求。
AI驅(qū)動(dòng)下,數(shù)據(jù)中心光模塊量價(jià)齊升
光模塊作為光纖通信的核心組成部分,主要用于實(shí)現(xiàn)光信號傳輸過程中光電轉(zhuǎn)換和電光轉(zhuǎn)換功能。據(jù)數(shù)據(jù)中心內(nèi)部流量、帶寬等推算,近年來,光模塊速率約每三年左右提高一倍。當(dāng)前,200G、400光模塊在數(shù)據(jù)中心大規(guī)模部署,并且,800G光模塊也正在成為全新需求,用在全球領(lǐng)先的超大規(guī)模數(shù)據(jù)中心、人工智能算力中心等;800G的下一代產(chǎn)品1.6T光模塊,也有望在2025年后推出。
對于通用服務(wù)器和AI服務(wù)器來說,所用光模塊有什么區(qū)別?業(yè)內(nèi)進(jìn)行過相關(guān)測算:一臺傳統(tǒng)服務(wù)器約需要配置 4-6 個(gè)光模塊,一臺AI服務(wù)器則需要8-10 個(gè)光模塊。而且,算力需求越大,越需要更高速率的光模塊,比如800G。假設(shè)投入100億搭建一個(gè)傳統(tǒng)數(shù)據(jù)中心,光模塊約需要5-6 億;同樣投入100億搭建AI智算中心,光模塊可能接近10億。這意味著AI驅(qū)動(dòng)下,數(shù)據(jù)中心光模塊將呈現(xiàn)出量價(jià)齊升的態(tài)勢。
光模塊必備的DSP,被巨頭裹挾
光模塊用的電芯片包括激光驅(qū)動(dòng)、TIA、CDR和DSP等。LightCounting預(yù)測,從2022年到2027年,光模塊電芯片市場的CAGR增長率將為18%,市場總額從當(dāng)前的24億美元增長到53億美元,主要用于以太網(wǎng)和DWDM用光器件。
在光模塊中,DSP芯片主要用于處理調(diào)節(jié)衰減光信號,是高速光模塊中最核心的電芯片。當(dāng)光傳輸速率達(dá)到50Gb/s以上,光纖偏振模色散影響加劇,嚴(yán)重影響鏈路有效傳播距離與信號質(zhì)量,因此業(yè)界最常用的方法是通過DSP對抗與補(bǔ)償,來降低失真造成的系統(tǒng)誤碼率。業(yè)界一度認(rèn)為在200G以上光模塊中,DSP基本屬于必備器件。
不過,DSP雖然具有很強(qiáng)的信號恢復(fù)能力,但不足之處就是成本和功耗較高、且延遲較大。成本方面,DSP幾乎成為光模塊BOM成本占比最高的電信號處理單元。有分析顯示:約在10年前,DSP剛用于光模塊時(shí),工藝節(jié)點(diǎn)是65nm,設(shè)計(jì)成本2400萬美元;到2020年7nm產(chǎn)品推出時(shí),設(shè)計(jì)成本已高達(dá)2.5億美元左右;預(yù)計(jì)5nm節(jié)點(diǎn)時(shí),芯片設(shè)計(jì)成本將達(dá)到4.5億美元。
高額投入下,市場份額較小的廠商逐漸退出競爭。光模塊DSP市場頭部效應(yīng)越來越明顯,國際上有inphi(已被Marvell收購)、Broadcom,國內(nèi)有華為海思,幾乎沒有其他國內(nèi)玩家參與,基本成為寡頭壟斷的市場。
功耗方面,DSP由于引入了DAC/ADC與算法,功耗高于傳統(tǒng)基于模擬技術(shù)的CDR芯片。16nm DSP解決方案的400G OSFP/QSFP-DD的設(shè)計(jì)功耗在12W左右,而DSP降低功耗的方法比較有限,主要依靠流片工藝的提升,如果從16nm升級到7nm,約能實(shí)現(xiàn)65%的功耗降低。
不論對于光模塊本身,還是交換機(jī)前面板的熱設(shè)計(jì),DSP的功耗問題越來越成為一大挑戰(zhàn),隨著光模塊速率的提升,數(shù)據(jù)中心迫切需要引入更先進(jìn)工藝節(jié)點(diǎn)的DSP,但這帶來了成本和功耗的權(quán)衡問題。
“去DSP”趨勢顯著
AI高算力背景催生低功耗、低延時(shí)光模塊需求,LPO(Linear-drive Pluggable Optics) 線性直驅(qū)與 CPO(Co-packaged Optics)光電共封裝方案,是業(yè)界目前主要探討的兩種技術(shù)路線,這兩種方案都不再依賴DSP。
LPO線性直驅(qū)方案
LPO 被認(rèn)為深度契合了AI短距互聯(lián)、低功耗、低延時(shí)的需求,且技術(shù)更新迭代相對較小,有望成為800G 時(shí)代的重要補(bǔ)充方案。據(jù)業(yè)內(nèi)公開資料,相比傳統(tǒng)方案,LPO去掉DSP芯片后,整體光模塊成本至少下降15%。
也有業(yè)內(nèi)人士認(rèn)為,LPO的最大優(yōu)勢不是降成本,而是降功耗。在現(xiàn)有光模塊架構(gòu)中,它能夠?qū)崿F(xiàn)50%左右的降功耗效果,對相關(guān)廠商吸引力很大。以400G光模塊為例,所用7nm DSP功耗約為4W,占模塊整體功耗的50%。LPO通過將DSP功能集成到交換芯片中, 只留下driver和TIA,并分別集成CTLE和Equalization功能,用于對高速信號進(jìn)行一定程度的補(bǔ)償。相較DSP方案,LPO可大幅減少系統(tǒng)功耗和時(shí)延,保證傳輸性能的同時(shí)降低成本,并保持可插拔特性便于后續(xù)維護(hù)。
LPO代表廠商主要有Macom、Semtech、美信(已被ADI收購),博通也在跟進(jìn)這一方向。前三家廠商在電芯片領(lǐng)域有一定優(yōu)勢,都在大力推動(dòng)LPO線性直驅(qū)驅(qū)動(dòng)和TIA芯片。MACOM最新推出的800G線性驅(qū)動(dòng)方案,相較于傳統(tǒng)方案,可使系統(tǒng)功耗降低70%、整體延遲減少75%。
CPO光電共封裝方案
CPO方案將光學(xué)器件(如激光器、調(diào)制器、光接收器等)封裝在芯片級別,直接與芯片內(nèi)的電路相集成,借助光互連以提高通信系統(tǒng)的性能和功率效率。共封裝光學(xué)器件的一項(xiàng)關(guān)鍵創(chuàng)新是將光學(xué)器件移動(dòng)到離交換芯片裸片足夠近的位置,以便移除額外的DSP。
借助CPO方案,網(wǎng)絡(luò)交換機(jī)系統(tǒng)的光接口從交換機(jī)外殼前端的可插拔模塊轉(zhuǎn)變?yōu)榕c交換機(jī)芯片組裝在同一封裝中的光模塊。
基于這種封裝模式,光學(xué)元件直接嵌入到芯片中,內(nèi)部電路距離更近,減小了電信號的延遲和失真,提高了通信系統(tǒng)性能,減少了芯片與光模塊之間的連接器數(shù)量,減小了光模塊尺寸,提高光學(xué)和電子之間的互聯(lián)可靠性。并且,CPO可以減少能量轉(zhuǎn)換的步驟,從而降低功耗,與傳統(tǒng)光模塊相比,CPO在相同數(shù)據(jù)傳輸速率下可以減少約50%的功耗。
在光電共封裝領(lǐng)域,英特爾是資深的玩家之一。此外,還有博通、Marvell、思科等。
綜上,CPO主要技術(shù)路徑為硅光集成加外置光源,依然存在可靠性較低、維護(hù)較難的問題,成為主流應(yīng)用還有諸多因素要克服;LPO作為一項(xiàng)新技術(shù),根據(jù)預(yù)測可望在2024年底首次實(shí)現(xiàn)部署;在未來一段時(shí)間內(nèi),傳統(tǒng)的可插拔光模塊仍將是首選,7nm向5nm DSP的演進(jìn)在加快,以滿足越來越嚴(yán)苛的功耗需求。
寫在最后
大模型、大數(shù)據(jù)、大算力日益成為AIGC應(yīng)用的核心,其中,算力作為重要的基礎(chǔ)設(shè)施,正在面臨全面升級的需求。除了核心GPU處理器,通信因素也會(huì)成為短板,只要一條鏈路出現(xiàn)網(wǎng)絡(luò)阻塞,就會(huì)產(chǎn)生數(shù)據(jù)延遲。因此,AI服務(wù)器對于底層數(shù)據(jù)傳輸速率、延時(shí)要求等非??量蹋M(jìn)而對高速率的光模塊產(chǎn)生大量需求。
DSP作為光模塊核心器件,如今,正在面臨新技術(shù)路徑的沖擊和挑戰(zhàn)。特別是今年以來,光模塊“去DSP”趨勢顯著。這是光模塊領(lǐng)域的重要信號,或許會(huì)改寫未來的競爭格局,并有望引領(lǐng)光模塊、光芯片走向新的技術(shù)路徑。