2020年,英偉達以69億美元收購以色列網(wǎng)絡芯片公司Mellanox,并于同年推出其首款DPU產(chǎn)品,定位于CPU和GPU之后的“第三大算力支柱”——至此引燃DPU市場。兩年來,DPU在國內(nèi)外的熱度迅速躥升,國際巨頭在迅速布局:Intel推出IPU基礎設施處理器,今年又傳來AMD以19億美元收購DPU芯片廠商Pensando;國內(nèi)市場也是如此,玩家紛紛布局、資本分外青睞。
“一年完成三輪大體量融資”的背后
國內(nèi)DPU公司中,中科馭數(shù)布局較早,創(chuàng)始團隊在計算機體系結(jié)構領域有近二十年技術積累,在產(chǎn)品量產(chǎn)、商業(yè)落地、生態(tài)構建、以及相應的標準推動等方面較為先行。
日前,中科馭數(shù)宣布完成數(shù)億元B輪融資,并同時公布第二代DPU芯片K2預計將在10月回片。據(jù)了解,該輪融資達到了超以往輪次融資規(guī)模的數(shù)億元,由金融街資本領投,建設銀行旗下建信股權跟投,老股東靈均投資、光環(huán)資本、泉宗資本連續(xù)三輪追投。
這也是過去一年內(nèi),中科馭數(shù)完成的第三輪大體量融資。融資和產(chǎn)品節(jié)奏都穩(wěn)健的中科馭數(shù),關鍵優(yōu)勢是什么?
追溯起來的話,該公司創(chuàng)始人兼CEO鄢貴海博士、聯(lián)合創(chuàng)始人兼CTO盧文巖博士,均來自國內(nèi)的科研院所。他們提出了軟件定義加速器技術(Software Defined Accelerator),自主研發(fā)了KPU(Kernel Processing Unit)芯片架構,并于2019年設計出業(yè)界首顆數(shù)據(jù)庫與時序數(shù)據(jù)處理融合加速芯片,已經(jīng)成功流片。中科馭數(shù)的DPU芯片,正是基于自研的KPU芯片架構,具有網(wǎng)絡協(xié)議處理、數(shù)據(jù)庫和大數(shù)據(jù)處理加速、存儲運算、安全加密運算等核心功能。
在技術路線方面,中科馭數(shù)2018年提出了“軟件定義加速器”,采用自主研發(fā)的敏捷異構KPU芯片架構。相較于傳統(tǒng)的ASIC或SoC DPU芯片架構,KPU有較高的靈活性,可以通過即時的軟件配置來定義芯片內(nèi)部數(shù)據(jù)運算邏輯,在保障充沛算力的同時,以最低功耗支撐更多運算負載類型。在解決專用處理器設計碎片化問題的同時,異構眾核的技術架構具有軟件定義可配置、設計周期短、性能更優(yōu)、計算高效的優(yōu)勢,據(jù)稱目前已經(jīng)研發(fā)積累了百余類功能核。
專用DPU =定制化=不通用?
從被提出以來,DPU一直伴隨著“專用”這個字眼。鄢貴海分享,他被不止一次地問過:既然DPU是一顆專用芯片,是不是意味著應用比較有限?通常需要通過定制化才能實現(xiàn)?它是不是非標準產(chǎn)品?是不是不夠通用,不能跟現(xiàn)有的生態(tài)環(huán)境很好地兼容?
對于這些問題,鄢貴海認為有一定的片面性,甚至是認知誤區(qū)。他指出,本質(zhì)上,“專用化、定制化、標準化”是三個完全不相關的概念?!皩S没睆娬{(diào)的是應用場景;“定制化”是實現(xiàn)一項技術的路徑選擇;“標準化”的背后則是工程化,其實是為了降低邊際成本。至于要不要定制化?可能很多時候取決于兩個因素:一是通用產(chǎn)品具不具備實現(xiàn)系統(tǒng)功能所需的支撐;二是成本問題,如果定制化可以讓成本更低、性能更高,其實是沒有理由非得用已有的標準組件去實現(xiàn)的。
基于他的解讀,不難理解DPU所說的“專用性”主要是針對應用場景而言,并不能簡單等同于定制化產(chǎn)品。那么,究竟該如何理解這個所謂“第三顆算力芯片”的功能定位和產(chǎn)品屬性?
英偉達給出過一個定義,可以說比較準確地描述了DPU的功能,也相對容易理解——“DPU是用來把數(shù)據(jù)在正確的時間放到正確的位置”。
該如何理解? 鄢貴海認為,正確的時間指的是延遲必須要滿足要求,帶寬要能達到數(shù)據(jù)量,自身的數(shù)據(jù)帶寬要做到匹配;正確的位置指的是要把所有的遠程資源都能本地化,所有的跨節(jié)點訪問都要做的跟訪問本地資源是一樣的。
“其實,DPU是什么不重要,重要的是DPU能做什么”,鄢貴海在幫助厘清DPU概念的同時指出,“從我們開始做DPU,就在試圖回答DPU是什么,而每一年我們對DPU的認識都在加深?!?/p>
DPU=智能網(wǎng)卡?
數(shù)據(jù)中心服務器之間的網(wǎng)絡互聯(lián)有一套底層軟件系統(tǒng),這套軟件需要能完成網(wǎng)絡互聯(lián)協(xié)議,除此之外,還需要能跑一套數(shù)據(jù)中心必備的網(wǎng)絡安全系統(tǒng)。傳統(tǒng)上,這些處理跑在CPU上,而隨著智能網(wǎng)卡(SmartNIC)的逐漸普及,它正在網(wǎng)絡安全和網(wǎng)絡協(xié)議處理方面幫助CPU卸載任務。這與DPU的功能有著極高的重合,因此業(yè)界也有人認為DPU就是智能網(wǎng)卡,或者說是增強的智能網(wǎng)卡。
那么,DPU與智能網(wǎng)卡的區(qū)別究竟是什么?是“新瓶裝老酒”嗎?盧文巖博士指出,可以說DPU是智能網(wǎng)卡中的核心芯片,或者說智能網(wǎng)卡是DPU的一個應用場景,而事實上,DPU不僅僅是這一個場景,還可以用到更多地方。
至于相較于智能網(wǎng)卡的優(yōu)勢是什么?盧文巖表示,主要體現(xiàn)在資源和性能方面?,F(xiàn)在市面上基于FPGA的智能網(wǎng)卡,基本都卡在了20G和25G帶寬之下,很難突破達到兩個100G的帶寬。這主要因為幾方面限制:首先是FPGA性能上不去,頻率很難超過300兆;其次是資源有限。因此,從性能和延時都沒法和DPU芯片比拼。而中科馭數(shù)的K2芯片,已經(jīng)實現(xiàn)了200G帶寬和1.2微秒延時。
他補充,今天不管是云、數(shù)據(jù)中心,還是混合云、私有云等,大部分傾向于DPU+CPU的方向。這是因為如果想讓數(shù)據(jù)中心的帶寬更好、延遲更低,就要搭建高速網(wǎng),而這會加劇成本壓力。如果用新的DPU方案,能夠把基礎打好,應用靈活性更強。特別是對一些底層基礎能力很強的集成商,通過部署DPU,他們甚至可以重構基礎設施底層的軟件,例如控制鏈、轉(zhuǎn)發(fā)鏈等都可以在DPU場景下重新做分布,這對優(yōu)化未來整體系統(tǒng)性能至關重要。
超低延時是一大核心需求
關于DPU未來的應用方向,中科馭數(shù)高級副總裁張宇表示,從數(shù)據(jù)中心到云原生,再到算力網(wǎng)絡、元宇宙、自動駕駛等,都將是DPU蓬勃發(fā)展的領域。
“在沒有DPU的時候,一些工作都是CPU在承擔。但是有了DPU之后,超低時延和超大帶寬,這其中不管哪一個場景都要做到極致,因為這才是DPU芯片的核心”,張宇認為。
過去幾年,中科馭數(shù)一直在深耕超低時延場景,一個典型應用就是金融科技。而這一市場幾乎被AMD和英偉達所占領,AMD占到90%以上的市場份額,剩下的幾乎被英偉達占據(jù),思科也僅分到了很小的“蛋糕”。作為國內(nèi)甚至是唯一在這個市場“沖浪”的玩家,中科馭數(shù)的底氣是什么?又收獲了什么?
張宇表示,這首先離不開扎實的技術基礎,中科馭數(shù)自研的軟硬件一體化加速平臺,具備超低時延、高吞吐、低抖動、高穩(wěn)定、高安全等優(yōu)勢。在超低時延領域,馭數(shù)產(chǎn)品商業(yè)環(huán)境實測均值僅為1.12微秒,創(chuàng)下全球超低時延最快紀錄,因此能夠在金融極速交易、金融風控、極低時延數(shù)據(jù)庫異構加速等應用中落地。
其次是自研的軟件開發(fā)平臺HADOS,助力產(chǎn)品實現(xiàn)了靈活度高、穩(wěn)定性強、兼容性好,能夠全面適配國內(nèi)外多種操作系統(tǒng),大幅降低應用軟件開發(fā)難度。
他透露,基于已有技術儲備和生態(tài)布局,中科馭數(shù)有望推出云原生服務網(wǎng)格全面加速方案,對比當前的解決方案,時延性能可以提升5-10倍,為實時性要求極高的數(shù)據(jù)中心、工業(yè)控制、車路協(xié)同等應用場景提供技術支撐。
攻克三大挑戰(zhàn)的路上
為了幫助行業(yè)認識DPU并推動它的標準化發(fā)展,中科馭數(shù)做了兩件事:2021年發(fā)布了行業(yè)首部DPU技術白皮書,2022年推出行業(yè)首部DPU評測技術白皮書。
DPU能否標準化?鄢貴海表示,DPU肯定是個好東西,標準化也能做成,但是有挑戰(zhàn)。從算力發(fā)展的三要素來看:首先性能必須高。第二,生產(chǎn)率如何,這背后其實是工程問題,就是能不能把系統(tǒng)做得更好用,兼容性做到最廣。第三就是成本,也就是能不能很好地規(guī)?;?,做到供應鏈可控、每個環(huán)節(jié)的成本都相對較低,以及售后體系更優(yōu)化。
作為初創(chuàng)公司,鄢貴海認為一定是從上述第一個要素開始的,不論核心架構,還是核心軟件的積累,首先要解決第一個問題。
他坦言,中科馭數(shù)目前主要在解決第二個問題,因為現(xiàn)階段不論是軟件的頻繁迭代,還是做國產(chǎn)品牌的廣泛適配,都要解決DPU好用、易用的問題,從而在各個應用場景中用起來。
而接下來要解決的就是成本問題——DPU目前還沒有大規(guī)模上量,不過,從它的應用空間來看,最后的規(guī)模用量不會低于服務器的量,這也意味著還有很大的空間通過規(guī)模效應來降低成本。
“這也是中科馭數(shù)從現(xiàn)階段基本形成商業(yè)閉環(huán),到變成一個在整個產(chǎn)業(yè)中有重要位置的公司,要突破的最后一道屏障”, 鄢貴海指出。
據(jù)了解,目前中科馭數(shù)在商業(yè)化拓展方面,圍繞“垂直深耕,水平擴展”的策略,產(chǎn)品和方案已實現(xiàn)了一定的規(guī)?;逃茫瑑H2022上半年訂單已經(jīng)達到了2021全年的兩倍。
對于明年的預測,鄢貴海認為,看起來市場只會加速發(fā)展,目前終端用戶對DPU的應用認知已經(jīng)達到了一定水準,市場需求確實存在,前期的市場教育奏效了,客戶也愿意真金白銀去投入。未來,他們在最終做產(chǎn)品決策時,最重要的選擇依據(jù)肯定還是整體的性價比,即性能是不是夠好,價格是不是足夠有優(yōu)勢。
這對于中科馭數(shù)這樣的第三方DPU廠商來說,就要把產(chǎn)品結(jié)構做得更完善、方案整合得更好、軟件更穩(wěn)定易用、設備更完善,而這些最后都會成為產(chǎn)品的核心競爭力?!翱雌饋砗芏嘈枨笫撬槠模阏虾靡院缶蜁兂赡愕暮诵母偁幜?。相反,看起來相對短平快的路徑,最后就會可能變成自己的天花板”, 鄢貴海表示。
寫在最后
對于DPU的應用量級,業(yè)內(nèi)有一些公開預測,認為用于數(shù)據(jù)中心的DPU量級將達到和數(shù)據(jù)中心服務器等量的級別。一臺服務器可能會有一顆或者多顆DPU,好比每臺服務器必須配網(wǎng)卡一樣。以服務器每年新增大約1500萬臺來看,每顆DPU如果以萬元計算,將是千億量級的市場規(guī)模。
行業(yè)在不斷定義DPU,DPU也在重新定義行業(yè)。突破商業(yè)化的最后一道屏障,DPU將迎來真正廣闊無垠的藍海。