加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 01.AI的下一個百萬倍加速,需要光互連等先進(jìn)技術(shù)
    • 02.突破數(shù)據(jù)移動瓶頸,用光互連加快AI系統(tǒng)通信速度
    • 03.瞄準(zhǔn)AI數(shù)據(jù)中心挑戰(zhàn)的硅光子學(xué)競爭者們
    • 04.結(jié)語:重新思考AI系統(tǒng)架構(gòu)
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

英偉達(dá)AMD英特爾聯(lián)手,投出一家AI芯片獨(dú)角獸

12/13 11:35
1382
閱讀需 10 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者?|??ZeR0

編輯?|??漠影

利用光學(xué)I/O推動AI革命。

什么樣的初創(chuàng)公司,能同時拿到英偉達(dá)、AMD英特爾三大芯片巨頭的投資?答案是Ayar Labs。芯東西12月12日報道,硅谷光互連芯片設(shè)計公司Ayar Labs昨日宣布完成英偉達(dá)AMD、英特爾、格芯等參投的1.55億美元融資。與臺積電有戰(zhàn)略合作關(guān)系的VentureTech Alliance、美國機(jī)器制造巨頭3M也參與了此輪融資。

目前其累計融資達(dá)3.7億美元,估值已超過10億美元,成為新晉芯片獨(dú)角獸。Ayar Labs聯(lián)合創(chuàng)始人兼CEO馬克·韋德(Mark Wade)說:“領(lǐng)先的GPU提供商AMD和英偉達(dá)以及半導(dǎo)體代工廠格芯、英特爾代工、臺積電,再加上Advent、Light Street和我們其他投資者的支持,凸顯了我們的光學(xué)I/O技術(shù)重新定義AI基礎(chǔ)設(shè)施未來的潛力。”獲得如此多芯片巨頭的青睞,Ayar Labs憑什么?

01.AI的下一個百萬倍加速,需要光互連等先進(jìn)技術(shù)

Ayar Labs成立于2015年,總部位于加州圣何塞,專門為大規(guī)模AI工作負(fù)載提供光互連解決方案。其瞄準(zhǔn)的賽道,如今正是下一代AI基礎(chǔ)設(shè)施建設(shè)的關(guān)鍵技術(shù)之一。高盛近日發(fā)布的一份報告預(yù)測,未來十年,AI基礎(chǔ)設(shè)施支出預(yù)計將超過1萬億美元。這凸顯了對消除傳統(tǒng)銅互連、可插拔光學(xué)器件造成的瓶頸的解決方案的迫切需求。當(dāng)前大多數(shù)數(shù)據(jù)中心的運(yùn)營依賴于傳統(tǒng)的電互連,銅線是數(shù)據(jù)中心短距離信息傳輸?shù)臉?biāo)準(zhǔn)。AI服務(wù)器系統(tǒng)在持續(xù)傳輸數(shù)據(jù)過程中會消耗大量電力,打破現(xiàn)有AI基礎(chǔ)設(shè)施瓶頸的有效解法之一,便是采用光互連技術(shù)來加速通信

采用傳統(tǒng)互連時,隨著AI模型復(fù)雜性增加,系統(tǒng)效率會降低。據(jù)Ayar Labs官網(wǎng)分享,一顆GPU的運(yùn)行效率為80%,64顆GPU的運(yùn)行效率可能是50%,256顆GPU的運(yùn)行效率可能只有30%了。光學(xué)I/O則能夠針對提高AI基礎(chǔ)設(shè)施的性能和能效。英偉達(dá)數(shù)據(jù)中心產(chǎn)品首席平臺架構(gòu)師羅伯·奧伯(Rob Ober)認(rèn)為,過去十年,英偉達(dá)加速計算已經(jīng)為AI帶來百萬倍的加速,而下一個百萬倍的加速將需要光學(xué)I/O等全新技術(shù),來支持未來AI/ML工作負(fù)載和系統(tǒng)架構(gòu)的帶寬、功率和規(guī)模要求。OpenAI計算主管克里斯托弗·伯納(Christopher Berner)也強(qiáng)調(diào)道,橫向擴(kuò)展期間的互連帶寬對于防止加速器在等待網(wǎng)絡(luò)傳輸或梯度時停轉(zhuǎn)至關(guān)重要。

02.突破數(shù)據(jù)移動瓶頸,用光互連加快AI系統(tǒng)通信速度

此前光一直被用于數(shù)據(jù)傳輸,只不過主要用于電信網(wǎng)絡(luò)的長距離通信中。Ayar Labs則將這項技術(shù)塞進(jìn)了芯片封裝里。

該公司開發(fā)了業(yè)界首款針對大規(guī)模AI工作負(fù)載優(yōu)化的封裝內(nèi)光學(xué)I/O解決方案。相比采用可插拔光學(xué)器件+電氣SerDes的傳統(tǒng)互連,Ayar Labs的方案可實現(xiàn)5~10倍的更高帶寬、4~8倍的能效,并將延遲降低至1/10。其方案結(jié)合了兩項行業(yè)首創(chuàng)技術(shù)——TeraPHY光學(xué)I/O ChipletSuperNova多波長光源。TeraPHY可集成到客戶的SoC封裝中,利用其SuperNova遠(yuǎn)程光技術(shù)實現(xiàn)更快的芯片間通信,從而幫助客戶最大限度地提高AI基礎(chǔ)設(shè)施的計算效率和性能,還能提高“AI應(yīng)用的盈利能力指標(biāo)”。

TeraPHY光學(xué)I/O Chiplet是一款體積小、功耗低、吞吐量高的銅背板和可插拔光學(xué)通信替代方案,其模塊化多端口設(shè)計科承載8個光通道(相當(dāng)于x8 PCIe Gen5鏈路)。

它將硅光子學(xué)與標(biāo)準(zhǔn)CMOS制造工藝結(jié)合,使專用集成電路(ASIC)能跨越從毫米到千米的距離進(jìn)行通信,相當(dāng)于形成一個巨型GPU。每個端口有256Gbps,每個Chiplet有2Tbps。

萬億參數(shù)AI模型和高性能計算(HPC)設(shè)計需要不斷增加的帶寬。Ayar Labs光學(xué)I/O提供4Tbps的總雙向帶寬,為生成式AI架構(gòu)開辟了新的可能性。高性能計算(HPC)和AI的分布式計算系統(tǒng)無法容忍傳統(tǒng)電氣I/O前向糾錯帶來的數(shù)十納秒額外延遲。而Ayar Labs光學(xué)I/O的延遲為每Chiplet + TOF 5納秒,無需前向糾錯。為了使電氣I/O和可插拔光學(xué)器件能夠穿越系統(tǒng)、機(jī)架和數(shù)據(jù)中心,112 Gbps長距離電氣I/O會消耗6-10pJ/b的能量。Ayar Labs光學(xué)I/O消耗的能量則不到5pJ/b(10W)。

SuperNova是首款符合CW-WDM MSA標(biāo)準(zhǔn)的多波長、多端口光源,最多支持將16種波長的光傳輸至16根光纖。

CWDM4多波長可插拔光學(xué)器件相比,其波長增加了64倍。該光源可驅(qū)動256個光學(xué)載波,實現(xiàn)16Tbps的雙向帶寬。

Ayar Labs基于開放標(biāo)準(zhǔn)(UCIe、CXL、CW-WDM MSA),使其能順利大規(guī)模集成到AI系統(tǒng)中。這些芯片由格芯生產(chǎn)。Ayar Labs還與英特爾合作,將其技術(shù)集成到英特爾的制造產(chǎn)品中。該公司也在與臺積電洽談。HPE、英特爾、洛克希德·馬丁、英偉達(dá)都是Ayar Labs的技術(shù)合作伙伴。其供應(yīng)鏈合作伙伴包括格芯、MACOM、Sivers Semiconductors等。

03.瞄準(zhǔn)AI數(shù)據(jù)中心挑戰(zhàn)的硅光子學(xué)競爭者們

幾個月前,Ayar Labs開始向部分客戶出貨了約15000臺設(shè)備。馬克·韋德希望到2026年中期,其芯片能實現(xiàn)大批量生產(chǎn);到2028年及以后,每年出貨量可達(dá)到1億臺以上。Advent Global Opportunities和Light Street Capital是Ayar Labs最新融資的領(lǐng)投方。Advent Global Opportunities合伙人喬丹·卡茨(Jordan Katz)將加入Ayar Labs董事會。他相信光互連技術(shù)將徹底改變AI基礎(chǔ)設(shè)施的未來,而他認(rèn)為Ayar Labs是引領(lǐng)這場革命的最佳初創(chuàng)公司。其他投資方中,英偉達(dá)正在基板層實現(xiàn)光學(xué)互連,英特爾也在今年早些時候展示了芯片間光通信。不過,Ayar Labs并非光互連領(lǐng)域的獨(dú)孤求敗。今年9月,瑞士光互連創(chuàng)企Lightium AG完成700萬美元種子輪融資,投資方包括谷歌等;10月,美國光子計算及網(wǎng)絡(luò)創(chuàng)企Lightmatter完成4億美元D輪融資,總?cè)谫Y額達(dá)到8.5億美元,估值超過44億美元;同樣在10月,另一家美國光子技術(shù)創(chuàng)企Xscape Photonics完成4400萬美元A輪融資,由思科、英偉達(dá)等參投。在國內(nèi),上海曦智科技是全球首家以光計算和光互連為核心的AI芯片公司,已經(jīng)構(gòu)建光子計算和光子網(wǎng)絡(luò)兩大產(chǎn)品線,其Photowave系列是業(yè)界首款兼容PCIe 5.0和CXL 2.0協(xié)議的光互連硬件產(chǎn)品,數(shù)據(jù)傳輸延遲可以達(dá)到20納秒(+TOF*)以內(nèi),其中有源光纜延遲可低至1納秒以下。曦智科技的首個CPO共封裝光學(xué)項目也正在落地中。

04.結(jié)語:重新思考AI系統(tǒng)架構(gòu)

大模型推動計算資源需求激增,需要數(shù)百乃至數(shù)千個互連的GPU和其他加速器,這意味著數(shù)據(jù)要以閃電般的速度在芯片與存儲設(shè)備之間流轉(zhuǎn)。硬件利用率低、功耗飆升、成本增加等重壓之下,傳統(tǒng)互連方案越來越難以承擔(dān)多模態(tài)AI系統(tǒng)所需的成本和吞吐量。從云計算大廠到智算基建商,都在探索新的數(shù)據(jù)中心架構(gòu)設(shè)計,升級硬件和軟件基礎(chǔ)設(shè)施。芯片巨頭們已經(jīng)盯上了光互連技術(shù),以期利用光學(xué)特性突破固有瓶頸,提高AI基礎(chǔ)設(shè)施的性能和計算效率,同時降低成本和功耗。隨著更多資本涌向這一賽道,光互連商業(yè)化落地進(jìn)程正在提速中。

相關(guān)推薦

電子產(chǎn)業(yè)圖譜