在第一波云端AI算力的暴漲中,GPU是當(dāng)仁不讓的王者,此外,還有各種針對(duì)深度學(xué)習(xí)等工作負(fù)載打造的專(zhuān)用AI芯片也迎來(lái)大發(fā)展。
不過(guò),通信和計(jì)算就好比數(shù)據(jù)中心的兩個(gè)臂膀,如果一直提升算力,但是通信基礎(chǔ)設(shè)施跟不上,整體系統(tǒng)性能還是受限,無(wú)法發(fā)揮出真正的潛能。這也是為什么,業(yè)界越來(lái)越多在談?wù)撍憔W(wǎng)一體化、算網(wǎng)融合等等。
從數(shù)據(jù)中心長(zhǎng)期的迭代方向來(lái)看,光網(wǎng)絡(luò)的鋪設(shè)、通信的密度、底層算力的生態(tài)設(shè)施建設(shè)等,都在逐漸升級(jí)的過(guò)程中。帶寬不斷提升,將有更大的數(shù)據(jù)量涌入,數(shù)據(jù)的處理將會(huì)越來(lái)越復(fù)雜,包括網(wǎng)絡(luò)協(xié)議處理、存儲(chǔ)壓縮、數(shù)據(jù)加密等,這些本不是CPU和GPU擅長(zhǎng)的領(lǐng)域,該由誰(shuí)來(lái)處理?DPU的提出背景就是應(yīng)對(duì)這些數(shù)據(jù)量和復(fù)雜性的指數(shù)級(jí)增長(zhǎng),作為專(zhuān)注于解決算力基礎(chǔ)設(shè)施層各種數(shù)據(jù)流量負(fù)載的芯片,它被寄予了數(shù)據(jù)中心三大支柱芯片之一的定位。
國(guó)際上,英偉達(dá)、英特爾、AMD、微軟等廠(chǎng)商都已經(jīng)在積極布局DPU,國(guó)內(nèi)這個(gè)賽道的熱度也在不斷上升,產(chǎn)品成熟度越來(lái)越好。
脫胎于中科院計(jì)算所計(jì)算機(jī)體系結(jié)構(gòu)國(guó)家重點(diǎn)實(shí)驗(yàn)室的中科馭數(shù),是國(guó)內(nèi)較早進(jìn)行DPU芯片研發(fā)的企業(yè)。日前,中科馭數(shù)發(fā)布了最新一代DPU芯片K2 Pro、軟件開(kāi)發(fā)平臺(tái)HADOS、以及一系列針對(duì)數(shù)據(jù)中心基礎(chǔ)設(shè)施層業(yè)務(wù)痛點(diǎn)打造的DPU卡,意在重新定義DPU,解鎖更廣泛目標(biāo)場(chǎng)景。
為什么重新定義DPU?
在復(fù)雜大型芯片每代產(chǎn)品普遍3~5年的研發(fā)周期中,中科馭數(shù)用6年時(shí)間,完成了三代芯片的迭代,平均每代芯片迭代僅為不到2年的時(shí)間。
中科馭數(shù)CEO鄢貴海表示,DPU是當(dāng)下算力基礎(chǔ)設(shè)施的核心創(chuàng)新之一,就好比數(shù)據(jù)網(wǎng)絡(luò)的高鐵時(shí)代,已經(jīng)不僅僅是連通城市的問(wèn)題,而是徹底重構(gòu)了地理位置的邏輯距離。作為一家創(chuàng)新性企業(yè),中科馭數(shù)必須用一年走過(guò)別人三年的路,才有可能在市場(chǎng)競(jìng)爭(zhēng)中贏得生存空間。
如何重新定義DPU,鄢貴海提出了兩個(gè)主要維度:第一,DPU的定義需要層次化,不應(yīng)只局限于芯片開(kāi)發(fā),而是需要在芯片、軟件和平臺(tái)上同時(shí)發(fā)展;第二,不應(yīng)該用“DPU幫助卸載CPU工作負(fù)載”的狹義視角去看它,而應(yīng)該是更廣。他強(qiáng)調(diào),DPU能夠處理GPU和CPU都無(wú)法有效處理的任務(wù),如安全業(yè)務(wù)和分布式安全機(jī)制??紤]到分布式和大規(guī)模集群系統(tǒng)的需求,DPU也被視為實(shí)現(xiàn)算網(wǎng)融合的關(guān)鍵組件。
中科馭數(shù)的目標(biāo)是為算力基礎(chǔ)設(shè)施提供DPU產(chǎn)品,解決算力資源的彈性擴(kuò)展、高效互連、加速計(jì)算、統(tǒng)一運(yùn)維等關(guān)鍵問(wèn)題,打通數(shù)據(jù)中心算力的——“堰塞湖”?;诖?,中科馭數(shù)從三個(gè)維度重新定義了DPU價(jià)值:第一,架構(gòu)決勝,用先進(jìn)的芯片架構(gòu)重新定義DPU芯片架構(gòu);第二,軟件護(hù)城,用最高兼容性來(lái)重新定義DPU的軟件系統(tǒng);第三,平臺(tái)上門(mén),用最低的成本讓客戶(hù)接入DPU規(guī)?;渴鹋c業(yè)務(wù)驗(yàn)證。鄢貴海強(qiáng)調(diào),中科馭數(shù)做芯片,最終是為了服務(wù)云,以上三方面將構(gòu)成算力基礎(chǔ)設(shè)施領(lǐng)域的“芯云計(jì)劃”。
第三代DPU芯片K2-Pro發(fā)布
發(fā)布會(huì)上,中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布,是目前國(guó)內(nèi)首顆量產(chǎn)全功能DPU算力芯片,專(zhuān)為未來(lái)數(shù)據(jù)中心和云原生環(huán)境定制優(yōu)化。
中科馭數(shù)高級(jí)副總裁、CTO盧文巖表示,DPU的量產(chǎn)落地是檢驗(yàn)其技術(shù)創(chuàng)新的“驗(yàn)金石”,整個(gè)研發(fā)團(tuán)隊(duì)的重心也一直是量產(chǎn)和實(shí)用。面臨底層架構(gòu)的復(fù)雜挑戰(zhàn),中科馭數(shù)從基礎(chǔ)理論出發(fā),用創(chuàng)新的體系結(jié)構(gòu)理論指導(dǎo)復(fù)雜的芯片架構(gòu)設(shè)計(jì),主要基于自研KPU架構(gòu)以及國(guó)內(nèi)首個(gè)DPU指令集——KISA。
作為中科馭數(shù)上一代DPU芯片K2的量產(chǎn)版本,K2-Pro在功能、性能、穩(wěn)定性、靈活性、系統(tǒng)管理、能效性六大維度實(shí)現(xiàn)了對(duì)K2的升級(jí)。在數(shù)據(jù)處理方面,K2-Pro包處理速率翻倍至80Mpps,在網(wǎng)絡(luò)密集型應(yīng)用中能提供更高的吞吐量和更低的延遲;強(qiáng)化復(fù)雜業(yè)務(wù)支持,集成網(wǎng)絡(luò)卸載、流表卸載、存儲(chǔ)卸載及RDMA網(wǎng)絡(luò)卸載等多類(lèi)型硬件卸載引擎,實(shí)現(xiàn)用輕量控制面支撐復(fù)雜業(yè)務(wù),復(fù)雜服務(wù)網(wǎng)格性能從400微秒降至30微秒以?xún)?nèi),實(shí)現(xiàn)量級(jí)躍升;通過(guò)PPP、NP內(nèi)核及P4可編程架構(gòu),實(shí)現(xiàn)業(yè)務(wù)與同構(gòu)算力、異構(gòu)算力靈活擴(kuò)展,用戶(hù)可以根據(jù)實(shí)際需求動(dòng)態(tài)調(diào)整和優(yōu)化系統(tǒng)配置,相當(dāng)于讓算力得到自由延展;提供全面的片上與板級(jí)管理系統(tǒng),加強(qiáng)資源管理與穩(wěn)定性;并在DPU復(fù)雜場(chǎng)景下能耗降低30%,實(shí)現(xiàn)低功耗運(yùn)行。
基于K2-Pro的架構(gòu)優(yōu)勢(shì)和在功能方面的設(shè)計(jì)考量,中科馭數(shù)推出了三大系列的6款DPU卡產(chǎn)品:分別是面向超低時(shí)延網(wǎng)絡(luò)的“思威”SWIFT系列產(chǎn)品——SWIFT-2200N、SWIFT-NDPP,面向高吞吐無(wú)損網(wǎng)絡(luò)的“福來(lái)”FlexFlow系列——FLEXFLOW-2200T、FLEXFLOW-2100R,以及面向軟件定義網(wǎng)絡(luò)的“功夫”Conflux系列——CONFLUX-2200P、CONFLUX-2200E。目前,這六款產(chǎn)品已經(jīng)上架中科馭數(shù)京東官方旗艦店,開(kāi)啟預(yù)售。
HADOS 3.0 軟件已突破萬(wàn)卡級(jí)別落地部署
如果說(shuō)“性能”的關(guān)鍵是芯片,那么“好用和易用”的核心就是軟件。作為銜接硬件和上層應(yīng)用的橋梁,DPU基礎(chǔ)軟件是決定硬件是否好用的基礎(chǔ)。在本次發(fā)布會(huì)上,中科馭數(shù)正式宣布自研軟件開(kāi)發(fā)平臺(tái)HADOS已全新升級(jí)到3.0版本,是中科馭數(shù)在DPU基礎(chǔ)軟件生態(tài)建設(shè)上的重大突破。
據(jù)介紹,HADOS 3.0專(zhuān)為DPU優(yōu)化設(shè)計(jì),核心代碼量已經(jīng)超過(guò) 126 萬(wàn)行,累計(jì)總代碼量近千萬(wàn)行,擁有驅(qū)動(dòng)、計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全等不同層次的API 數(shù)量高達(dá)2765個(gè),并且擁有豐富的、開(kāi)箱即用的模塊和功能。目前,HADOS已突破萬(wàn)卡級(jí)別的落地部署,適配了8 款CPU平臺(tái)以及10大主流操作系統(tǒng)。在行業(yè)應(yīng)用上,已有金融、電信、能源、科研、云數(shù)據(jù)中心等多個(gè)行業(yè)在內(nèi)的數(shù)十家用戶(hù)部署使用HADOS平臺(tái),如HADOS的超低時(shí)延協(xié)議棧結(jié)合中科馭數(shù)的DPU,已經(jīng)在國(guó)內(nèi)的證券交易等時(shí)延敏感場(chǎng)景批量落地使用。
中科馭數(shù)高級(jí)副總裁張宇表示,HADOS 3.0是一個(gè)里程碑式的版本,不僅是功能和代碼的迭代,更是對(duì)DPU應(yīng)用場(chǎng)景深度理解后的全面革新,體現(xiàn)了全面擁抱“敏捷開(kāi)發(fā)”的理念和方法,以及對(duì)高效、靈活、安全、易用的極致追求,助力解決 DPU 廣泛落地高性能云數(shù)據(jù)中心。
首次呈現(xiàn)中科馭數(shù)DPU全方位云計(jì)算實(shí)踐
云是算力供給的一種最普遍的形式,無(wú)論是通用計(jì)算、還是智算,因此,支撐云基礎(chǔ)設(shè)施,也是DPU的核心價(jià)值體現(xiàn)。中科馭數(shù)聯(lián)合行業(yè)內(nèi)眾多合作伙伴共同打造的以數(shù)據(jù)網(wǎng)絡(luò)為核心的高性能云底座方案——馭云,也在本次發(fā)布會(huì)上正式亮相。
中科馭數(shù)應(yīng)用研發(fā)部總經(jīng)理陳巖介紹,馭云解決方案采用“IaaS on DPU”技術(shù)路線(xiàn),依托于DPU的卸載能力,將云計(jì)算體系中的基礎(chǔ)設(shè)施層面完全下沉,為集群提供網(wǎng)絡(luò)轉(zhuǎn)發(fā)、存儲(chǔ)服務(wù)、安全防護(hù)、管理調(diào)度等能力,完成了整個(gè)云計(jì)算環(huán)境的構(gòu)建與運(yùn)轉(zhuǎn),將服務(wù)器側(cè)的CPU與GPU算力全部預(yù)留給業(yè)務(wù)系統(tǒng)應(yīng)用,為云計(jì)算提供高性能、高吞吐、高安全的算力底座。
目前,中科馭數(shù)在信創(chuàng)園搭建的馭云開(kāi)放平臺(tái),集成了超400臺(tái)高性能服務(wù)器,采用創(chuàng)新的3U一體架構(gòu),深度融合CPU、GPU與DPU技術(shù)。中科馭數(shù)產(chǎn)品運(yùn)營(yíng)部副總經(jīng)理曹輝介紹,馭云開(kāi)發(fā)平臺(tái)不僅為中科馭數(shù)自身的研發(fā)與數(shù)字化體系提供強(qiáng)大的算力支撐,還廣泛向客戶(hù)及生態(tài)伙伴敞開(kāi)大門(mén),提供DPU軟件開(kāi)發(fā)平臺(tái)、科研教學(xué)及驗(yàn)證服務(wù)、P4網(wǎng)絡(luò)編程平臺(tái)、聯(lián)合方案孵化服務(wù)、基于DPU的高性能異構(gòu)基礎(chǔ)設(shè)施資源服務(wù)以及DPU云市場(chǎng)六大服務(wù),旨在構(gòu)筑一個(gè)開(kāi)放、先進(jìn)的云算力設(shè)計(jì)與驗(yàn)證平臺(tái),加速高性能計(jì)算應(yīng)用的落地與推廣。
國(guó)產(chǎn)DPU走向何方?
從英偉達(dá)最新的產(chǎn)品路線(xiàn)圖來(lái)看,并未將DPU芯片單獨(dú)列出,而是將它包含在網(wǎng)絡(luò)平臺(tái)產(chǎn)品中進(jìn)行了布局。雖然不能說(shuō)弱化了DPU的定位,但對(duì)比前些年,英偉達(dá)剛剛收購(gòu)以色列網(wǎng)絡(luò)芯片商Mellanox時(shí),親手賦予了DPU“數(shù)據(jù)中心與CPU、GPU同為三大支柱”的光環(huán),如今,DPU在英偉達(dá)的全棧產(chǎn)品布局中確實(shí)越來(lái)越在退居“幕后”。這對(duì)國(guó)內(nèi)獨(dú)立的第三方DPU企業(yè)有什么啟發(fā)?
對(duì)此,鄢貴海首先認(rèn)為,英偉達(dá)目前基本是以完整的高算力節(jié)點(diǎn)作為產(chǎn)品形態(tài),注重以集群方式做布局,產(chǎn)品的演進(jìn)方向與該公司的全局思考密不可分。
他認(rèn)為,英偉達(dá)的技術(shù)進(jìn)步確實(shí)給國(guó)內(nèi)芯片企業(yè)提供了發(fā)展方向,尤其是在算力、精度配置和網(wǎng)絡(luò)速度方面。在這一背景下,國(guó)內(nèi)DPU企業(yè)應(yīng)該更加專(zhuān)注于核心競(jìng)爭(zhēng)力,逐步提升技術(shù)水平和產(chǎn)業(yè)成熟度。同時(shí),鄢貴海也指出國(guó)內(nèi)芯片產(chǎn)業(yè)在工藝、設(shè)計(jì)和產(chǎn)業(yè)成熟度上與國(guó)際巨頭存在差距,還需要時(shí)間和專(zhuān)注來(lái)彌補(bǔ),企業(yè)發(fā)展和行業(yè)競(jìng)爭(zhēng)是一個(gè)長(zhǎng)期且復(fù)雜的過(guò)程,需要耐心和持續(xù)的努力。
預(yù)計(jì)今年,K2-Pro將突破10K出貨量級(jí)。鄢貴海強(qiáng)調(diào),這僅僅是開(kāi)始,因?yàn)槟繕?biāo)替代場(chǎng)景太多了,他并不擔(dān)心未來(lái)的市場(chǎng)容量,核心是要把DPU和現(xiàn)有業(yè)務(wù)集成好,能夠把流量無(wú)縫導(dǎo)入DPU設(shè)備中,迅速讓客戶(hù)能夠因?yàn)榍袚Q而獲益,市場(chǎng)自然會(huì)越做越全。
“如果非常要給一個(gè)數(shù)字,我覺(jué)得我們的DPU三年內(nèi)應(yīng)該可以突破百萬(wàn)量級(jí),在整個(gè)網(wǎng)絡(luò)市場(chǎng)占有率能夠達(dá)到30%”,鄢貴海信心滿(mǎn)滿(mǎn)地表示。