2022年11月底,ChatGPT的橫空出世,讓生成式人工智能技術(shù)迅速席卷全球。目前,ChatGPT已經(jīng)更新迭代至第四代,最新一代的ChatGPT在規(guī)模、知識廣度、交互能力和自我修正能力等方面較之其發(fā)布之初有了很大提升。此外,由于ChatGPT的風(fēng)靡,也讓許多科技公司競相推出相關(guān)競品。
這些大語言模型都有一個共同點,那就是都需要龐大的數(shù)據(jù)進行訓(xùn)練和推理。據(jù)公開資料顯示,2022年11月發(fā)布的ChatGPT是基于GPT 3.5架構(gòu)進行訓(xùn)練的,而ChatGPT 3包含的參數(shù)就已經(jīng)達1750億個,最新一代的ChatGPT 4的參數(shù)更是已經(jīng)增加至1.6萬億個,呈指數(shù)級增長趨勢。
據(jù)相關(guān)數(shù)據(jù)顯示,過去四年,大模型參數(shù)量以年均400%的復(fù)合增長率增長,AI算力需求的增長也超過15倍。如此龐大的數(shù)據(jù)量,以CPU為中心的傳統(tǒng)計算基礎(chǔ)設(shè)施已經(jīng)無法滿足需求,需要有新一代的人工智能基礎(chǔ)設(shè)施來支撐這些大模型的訓(xùn)練和推理,以及生成式AI應(yīng)用的規(guī)模化落地。
IDC研究副總裁Peter Rutten表示:“IDC的研究表明,專用基礎(chǔ)設(shè)施的構(gòu)建不足或缺乏,往往是AI項目失敗的主要原因?!?/p>
人工智能支柱——數(shù)據(jù)中心需求激增
隨著人工智能,尤其是生成式人工智能熱潮的持續(xù)升溫,帶來了巨大的算力需求,而數(shù)據(jù)中心作為人工智能技術(shù)發(fā)展的主要基礎(chǔ)設(shè)施之一,它可以為人工智能提供硬件基礎(chǔ)和海量的數(shù)據(jù)資源,同時也為人工智能提供強大的計算能力。但以往的數(shù)據(jù)中心主要是為社會提供數(shù)字化轉(zhuǎn)型所需的通用算力,這樣的數(shù)據(jù)中心顯然不能滿足人工智能等技術(shù)帶來的算力激增的需求,它們需要具有更高帶寬、更低延時的數(shù)據(jù)中心,顯然,我們需要建設(shè)更多、更先進的數(shù)據(jù)中心。
我國的新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023年)明確到2023年底,全國數(shù)據(jù)中心機架規(guī)模年均增速保持在20%左右,平均利用率力爭提升到60%以上,總算力超過200EFLOPS,高性能算力占比達到10%。
2023年1月,麥肯錫公司預(yù)測,到2030年,數(shù)據(jù)中心行業(yè)每年將增長10%,超大規(guī)模數(shù)據(jù)中心市場預(yù)計每年增長20%,全球新設(shè)施建設(shè)支出將達到490億美元。
而另一分析機構(gòu)Gartner則預(yù)測,2025年服務(wù)器、數(shù)據(jù)中心和存儲的市場規(guī)模將達到1,120億美元,2020至2025年期間的CAGR為8.0%。
目前全球領(lǐng)先科技巨頭,包括谷歌、亞馬遜、Meta以及微軟等公司都紛紛投入數(shù)據(jù)中心的建設(shè)與升級競賽中。據(jù)富國銀行投資研究所數(shù)據(jù)顯示,上述這些科技巨頭在2023年用于數(shù)據(jù)中心新建和升級的總資本支出高達約1400億美元。未來,數(shù)據(jù)中心的需求還將持續(xù)增長,它將不僅僅是存儲和處理數(shù)據(jù)的場所,更將成為支撐人工智能創(chuàng)新的重要基石。
可靠連接是構(gòu)建數(shù)據(jù)中心關(guān)鍵
數(shù)據(jù)中心的重要性已經(jīng)不言而喻。如果將數(shù)據(jù)中心比喻為人的‘大腦’,而大腦的很多指令則需要通過大量的神經(jīng)元之間的連接下達,而快速的‘連接’才能實現(xiàn)這些指令的快速甚至實時實施。因此,如果說數(shù)據(jù)中心是人工智能的發(fā)展基石,那連接則是數(shù)據(jù)中心的骨干。
五十多年來,以太網(wǎng)協(xié)議一直是互聯(lián)網(wǎng)數(shù)據(jù)連接的骨干網(wǎng)絡(luò)。目前,數(shù)據(jù)中心的網(wǎng)絡(luò)連接多采用以太網(wǎng)連接,據(jù)IDC報告顯示,當(dāng)前主流數(shù)據(jù)中心網(wǎng)絡(luò)連接采用以太網(wǎng)的占比超過95%。
AI場景下,海量的參數(shù)分布于各個服務(wù)器之間,尤其是那些大模型,如上所述,它們有數(shù)萬億個參數(shù),它們的參數(shù)數(shù)量每隔幾個月就會翻一番,大多數(shù)數(shù)據(jù)都保存在內(nèi)存中,需要同時進行處理,因此系統(tǒng)需要通過低延遲網(wǎng)絡(luò)連接許多處理器。為了處理這樣的工作負(fù)載,整個集群將充當(dāng)單個計算設(shè)備,多個集群一起處理數(shù)TB的數(shù)據(jù)。
這樣的場景需要大量的算力和快速的連接來支撐,算力和網(wǎng)絡(luò)連接能力之間是協(xié)同互動的,它們需要同步提升效率才能更好滿足這些場景的需求。毫無疑問,以太網(wǎng)為這些大型系統(tǒng)提供了理想的連接協(xié)議,同時,這些大型系統(tǒng)的發(fā)展也催生了以太網(wǎng)傳輸速率的快速提升。
目前的以太網(wǎng)協(xié)議速度多為400G和800G為主。從下圖中可以看出,2019年,400G以太網(wǎng)的部署剛剛起步,但普及率不是很快,后在2023年,由于ChatGPT等技術(shù)的涌現(xiàn),立刻推動了400G甚至800G以太網(wǎng)的快速迭代和部署。據(jù)Dell’Oro的數(shù)據(jù)預(yù)測,2024年,400G和800G以太網(wǎng)的部署將提速,未來2-3年,800G以太網(wǎng)的占比將超一半。
而即使是將現(xiàn)有的數(shù)據(jù)中心連接迅速迭代至400G和800G,隨著未來如生成式人工智能等數(shù)據(jù)密集型應(yīng)用場景的不斷增加,它們也將無法滿足不斷增長的帶寬需求,需要迭代至具有更高速率的網(wǎng)絡(luò)技術(shù),1.6T以太網(wǎng)被認(rèn)為將很快成為行業(yè)標(biāo)準(zhǔn)。
未來的連接標(biāo)準(zhǔn)——1.6T以太網(wǎng)
作為下一代以太網(wǎng)技術(shù),1.6T以太網(wǎng)能夠提供比當(dāng)前以太網(wǎng)協(xié)議更高的數(shù)據(jù)傳輸速度。相較于800G以太網(wǎng),1.6T以太網(wǎng)通過采用更高效的傳輸技術(shù)和更先進的數(shù)據(jù)處理算法,實現(xiàn)了2倍的太比特的傳輸速度。
在傳輸方面,1.6T以太網(wǎng)可能采用更高速的物理層傳輸技術(shù),如PAM4(四相振幅調(diào)制),以提高每個時間周期內(nèi)可傳輸?shù)臄?shù)據(jù)量。同時,它還可能采用更為先進的編碼和解碼算法,以確保數(shù)據(jù)在傳輸過程中的準(zhǔn)確性和可靠性。
在數(shù)據(jù)處理方面,1.6T以太網(wǎng)可能采用高度并行化的處理架構(gòu),以處理大規(guī)模數(shù)據(jù)流,可以很好滿足人工智能時代數(shù)據(jù)量暴增的需求。
雖然,負(fù)責(zé)以太網(wǎng)標(biāo)準(zhǔn)制定的IEEE預(yù)計將于2026年才完成1.6TbE標(biāo)準(zhǔn)的最新版本,但2024年,他們將通過802.3dj工作組完成一組基線功能。如上圖Dell’Oro的預(yù)測,1.6T以太網(wǎng)的部署也將始于2024年。
業(yè)界首款完整1.6T以太網(wǎng)IP解決方案滿足高帶寬需求
近日,新思科技推出了業(yè)界首款完整1.6T以太網(wǎng)解決方案,它大幅提升了數(shù)據(jù)密集型AI工作負(fù)載的帶寬和吞吐量。
新思科技的綜合IP解決方案,包括新型1.6T MAC和PCS以太網(wǎng)控制器、224G以太網(wǎng)PHY IP和驗證IP,可加快AI和HPC網(wǎng)絡(luò)芯片的上市時間。與現(xiàn)有SoC方案相比,該款完整的1.6T以太網(wǎng)IP解決方案可將互連功耗降低多達50%,從而優(yōu)化超大規(guī)模數(shù)據(jù)中心的能效。新的多通道、多速率新思科技1.6T以太網(wǎng)MAC和PCS控制器通過實施獲得專利的Reed-Solomon前向糾錯架構(gòu),將面積減少了50%,延遲減少了40%,同時有助于確高達至1.6T以太網(wǎng)速率的可靠數(shù)據(jù)。經(jīng)過硅驗證的224G以太網(wǎng)PHY IP還可以提供強大的鏈路性能、出色的信號完整性和跨通道長度的無縫生態(tài)系統(tǒng)互操作性。
該款1.6T以太網(wǎng)驗證IP,還采用了原生SystemVerilog和通用驗證方法實施,可縮短首次測試時間。它還提供業(yè)界首款1.6T驗證IP(VIP),支持早期RTL驗證、SoC啟動和系統(tǒng)級驗證,為設(shè)計人員提供快速實現(xiàn)設(shè)計驗證收斂的途徑。
新思科技完整1.6T以太網(wǎng)解決方案特點總結(jié)如下:
與現(xiàn)有已實施方案相比,1.6T以太網(wǎng)IP解決方案可將互連損耗最多可降低50%;
與現(xiàn)有多速率800G IP解決方案相比,新型多通道/多速率以太網(wǎng)控制器可支持1.6T,延遲最多減少40%,面積最多減少50%;
可定制的、經(jīng)過硅驗證的224G以太網(wǎng)PHY IP,可支持芯片到芯片、芯片到模塊和銅纜連接,從而對功耗和性能進行了權(quán)衡優(yōu)化;
新思科技面向1.6T以太網(wǎng)的驗證IP,通過一整套協(xié)議、方法和生產(chǎn)力提升等優(yōu)勢加速了驗證收斂速度。
正因為新思科技款1.6T以太網(wǎng)解決方案具有的上述諸多優(yōu)勢,目前它也已經(jīng)被多家客戶采用,助力他們快速、便捷地開發(fā)面向人工智能和高性能計算等應(yīng)用的產(chǎn)品。
結(jié)語
邁入人工智能時代,數(shù)據(jù)和連接將是最為關(guān)鍵的兩個因素,它們之間相輔相承,不斷增長的數(shù)據(jù)量需要更寬的帶寬和更快的傳輸速率進行傳輸,為此也推動著網(wǎng)絡(luò)技術(shù)的快速迭代。雖然,目前1.6T以太網(wǎng)的標(biāo)準(zhǔn)還沒有最終出爐,但不可否認(rèn)的是,它將是未來的主流連接技術(shù)。而新思科技推出的完整1.6T以太網(wǎng)IP解決方案,可以提供高速數(shù)據(jù)連接,未雨綢繆,為未來做好準(zhǔn)備,讓人工智能時代連接無憂。