隨著人工智能從云端向邊緣擴(kuò)展,邊緣計(jì)算被視為下一個(gè)AI戰(zhàn)場(chǎng)。海量的應(yīng)用場(chǎng)景、龐大的計(jì)算需求,不僅吸引了英特爾、英偉達(dá)這些巨頭加速完善云邊端一體化的布局,更吸引了眾多AI芯片公司紛紛入局。
云端AI已經(jīng)造就了英偉達(dá)的巨大成功,如果邊緣AI是一次嶄新的機(jī)會(huì),哪些公司有機(jī)會(huì)成為贏家?
最適合的芯片路線?
業(yè)界對(duì)于通用、專用的計(jì)算路線討論已久,與這個(gè)話題伴生的其實(shí)是多樣、碎片的應(yīng)用場(chǎng)景。場(chǎng)景是碎片的,產(chǎn)品是碎片的,那么芯片呢?也只能是碎片的、專用的,不能是通用的嗎?通用計(jì)算老大哥CPU、GPU的地位會(huì)旁落嗎?未來通用計(jì)算和專用計(jì)算的關(guān)系如何發(fā)展?
時(shí)擎科技總裁于欣告訴<與非網(wǎng)>,針對(duì)不同應(yīng)用的架構(gòu)設(shè)計(jì),是一定需要的。領(lǐng)域?qū)S眉軜?gòu)(DSA)處理器和芯片,本質(zhì)上就是要解決通用性和專用性平衡和取舍的問題。
“這里有兩個(gè)大前提,一是端側(cè)的應(yīng)用比較碎片化,第二是對(duì)功耗和成本往往有比較高的要求。在這兩個(gè)前提下,如何既能保證相對(duì)于某個(gè)場(chǎng)景足夠的競(jìng)爭(zhēng)力,以滿足成本和功耗的要求,同時(shí)又能兼顧足夠的市場(chǎng)空間——這是每一家公司都要面臨的挑戰(zhàn),也是對(duì)產(chǎn)品定義能力的考驗(yàn)”,他強(qiáng)調(diào)。
通用計(jì)算芯片固然能夠覆蓋邊緣計(jì)算程序所需要的所有運(yùn)算操作,但在芯片架構(gòu)伸縮性、性能方面,確實(shí)無法及時(shí)適應(yīng)邊緣側(cè)需求的快速增長(zhǎng)。通用計(jì)算和專用計(jì)算芯片已經(jīng)呈現(xiàn)出融合發(fā)展的趨勢(shì)。并且,計(jì)算特性決定了邊緣芯片和云端芯片的不同,架構(gòu)設(shè)計(jì)需要進(jìn)行優(yōu)化定制。
靈汐科技副總經(jīng)理華寶洪表示,二者要相輔相成,最好能融為一體。在專用計(jì)算芯片中會(huì)包括通用計(jì)算的核,比如Arm或RISC-V等IP內(nèi)核。新型計(jì)算架構(gòu)芯片比如類腦計(jì)算芯片中,除了包括神經(jīng)擬態(tài)計(jì)算核、神經(jīng)網(wǎng)絡(luò)計(jì)算核,一般還有通用的Arm核。同時(shí),通用計(jì)算芯片比如最新的Arm芯片,也會(huì)內(nèi)置部分針對(duì)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)加速的IP核。異構(gòu)融合芯片架構(gòu)是發(fā)展的必然。
伴隨這一趨勢(shì),意味著需要把負(fù)責(zé)加速的專用計(jì)算單元移入通用編程模型中,且創(chuàng)建通用處理器的壓力始終存在。Imagination計(jì)算業(yè)務(wù)產(chǎn)品管理總監(jiān)Rob Fisher表示,這主要是從通用處理器編程的易用性角度來考慮的。當(dāng)任務(wù)的規(guī)?;蛩栊阅苓h(yuǎn)遠(yuǎn)超出通用解決方案所能容納的范圍時(shí),這種模式將受到限制。
他指出,GPU就是一個(gè)很好的示例。在實(shí)際應(yīng)用中,將圖形處理工作負(fù)載卸載到GPU上的優(yōu)勢(shì)很明顯,從而推動(dòng)了高效圖形處理器的獨(dú)立開發(fā)。矢量處理器正越來越多地與CPU架構(gòu)緊密結(jié)合,從而允許對(duì)計(jì)算任務(wù)進(jìn)行指令級(jí)加速。
雪湖科技副總裁趙小吾表示,針對(duì)不同場(chǎng)景下功能和性能的不同要求,邊緣的需求更復(fù)雜,很難用一個(gè)通用的架構(gòu)或者平臺(tái)來滿足大多數(shù)的需求,所以會(huì)針對(duì)不同應(yīng)用場(chǎng)景進(jìn)行專門的架構(gòu)設(shè)計(jì)。性能要求不高,算法變化快的部分可以使用通用計(jì)算芯片,比如CPU;性能要求高,算法相對(duì)固化的部分可以使用專用計(jì)算芯片,比如ASIC;對(duì)性能和算法靈活性都有一定要求的部分可以使用FPGA可編程芯片。
他以智慧交通領(lǐng)域的邊緣計(jì)算為例談到,由于基本都是室外場(chǎng)景,環(huán)境復(fù)雜且惡劣,既要滿足AI大算力和低延時(shí),又要滿足可靠性和穩(wěn)定運(yùn)行,因此目前大部分邊緣計(jì)算機(jī)都無法滿足需求。而采用了室外基站同等級(jí)的芯片為這種場(chǎng)景定制了專用的大算力計(jì)算機(jī),才滿足了這些特殊場(chǎng)景的需求。
Chiplet正當(dāng)紅
隨著高性能計(jì)算和機(jī)器學(xué)習(xí)的興起,異構(gòu)處理器必須處理的工作負(fù)載急劇增加,在整個(gè)半導(dǎo)體行業(yè)建立開放的生態(tài)合作至關(guān)重要。
不久前,英特爾、AMD、Arm、高通、臺(tái)積電等已經(jīng)聯(lián)合成立了Chiplet標(biāo)準(zhǔn)聯(lián)盟,推出了通用Chiplet的高速互聯(lián)標(biāo)準(zhǔn)UCIe。在UCIe的框架下,互聯(lián)接口標(biāo)準(zhǔn)得到統(tǒng)一,各類不同工藝、不同功能的Chiplet芯片,有望通過2D、2.5D、3D等各種封裝方式整合在一起,多種形態(tài)的處理引擎將共同組成超大規(guī)模的復(fù)雜芯片系統(tǒng)。
英偉達(dá)在上個(gè)月的GTC22上,一方面宣布了對(duì)UCIe規(guī)范的支持,另一方面,宣布為半定制芯片開放其NVLink-C2C互連技術(shù),這是一種支持內(nèi)存一致性的芯片到芯片、裸片到裸片的互連技術(shù)。這一路線已經(jīng)明確展現(xiàn)了英偉達(dá)的異構(gòu)決心,按照這一規(guī)劃,理論上甚至可以將英偉達(dá)的芯片與競(jìng)爭(zhēng)對(duì)手的芯片放入同一個(gè)封裝中。
黃仁勛告訴<與非網(wǎng)>,他第一喜歡PCIe,第二喜歡UCIe,并且預(yù)測(cè)五年內(nèi)UCIe的好處會(huì)逐漸顯現(xiàn)。至于英偉達(dá)自身的NVlink互連技術(shù),他強(qiáng)調(diào)優(yōu)勢(shì)在于直連能力。UCIe不能直接接入芯片,仍然是一個(gè)外設(shè)接口;而NVlink的優(yōu)勢(shì)在于可以直接連接,幾乎就像直接連接到大腦一樣。一定程度上,這可能會(huì)導(dǎo)致它的組裝比較復(fù)雜,合作伙伴和客戶必須非常了解NVlink。不過,一旦他們能做好這一點(diǎn),就可以充分利用芯片內(nèi)部的所有資源,就像這些資源都在同一個(gè)芯片上一樣。
這一解答既表明了英偉達(dá)并不打算自我排除在在UCIe聯(lián)盟之外,同時(shí)也展現(xiàn)出了對(duì)自身NVLink互連技術(shù)的絕對(duì)信心,推測(cè)該技術(shù)也將成為英偉達(dá)構(gòu)建異構(gòu)生態(tài)的關(guān)鍵。
新一代“英特爾”、“英偉達(dá)”能否在邊緣市場(chǎng)誕生?
邊緣計(jì)算市場(chǎng)的巨大潛力,自然也吸引著云端芯片巨頭的競(jìng)逐,他們正通過異構(gòu)計(jì)算、先進(jìn)制程、先進(jìn)封裝等方式進(jìn)行全面布局,加之高筑的生態(tài)壁壘,國(guó)內(nèi)AI芯片廠商是否有機(jī)會(huì)與之一搏?
“能造得了摩天大樓的,不一定擅長(zhǎng)雕梁畫柱。當(dāng)然相對(duì)于云端目前高度壟斷和集中的格局來說,邊緣側(cè)還沒有確定的格局,大家都有機(jī)會(huì),而具有更強(qiáng)技術(shù)能力和落地能力的廠家,會(huì)有更大的機(jī)會(huì)在競(jìng)爭(zhēng)中脫穎而出”,時(shí)擎科技于欣表示,“云邊端在某些場(chǎng)景融合協(xié)同是有道理的,但本身從芯片設(shè)計(jì)的角度來說,還是會(huì)有很大的區(qū)別?!?/p>
靈汐科技華寶洪則認(rèn)為,異構(gòu)計(jì)算、先進(jìn)制程、先進(jìn)封裝等均是手段,不能從根本上解決高能效比、小樣本學(xué)習(xí)、在線學(xué)習(xí)等問題。在行業(yè)導(dǎo)向和市場(chǎng)需求的雙重驅(qū)動(dòng)下,馮·諾依曼架構(gòu)和非馮·諾依曼架構(gòu)的異構(gòu)融合,將成為驅(qū)動(dòng)邊緣計(jì)算技術(shù)創(chuàng)新與未來行業(yè)高質(zhì)量發(fā)展的核心引擎。
一方面,馮·諾依曼架構(gòu)的芯片依然在走“暴力計(jì)算”的美學(xué)方向,會(huì)考慮用最先進(jìn)制程、最先進(jìn)封裝來提升算力;另一方面,非馮·諾依曼架構(gòu)優(yōu)先通過架構(gòu)創(chuàng)新來滿足在生物神經(jīng)網(wǎng)絡(luò)、類腦方向和新型混合神經(jīng)網(wǎng)絡(luò)等領(lǐng)域的規(guī)?;褂?。以類腦計(jì)算為代表的新型計(jì)算架構(gòu)將與傳統(tǒng)計(jì)算架構(gòu)深度融合,引領(lǐng)新一輪的技術(shù)變革。
雪湖科技趙小吾表示,業(yè)界頭部廠商都開始用小芯片拼湊大芯片的方式來完成產(chǎn)品布局,以滿足不同場(chǎng)景的算力需求。例如蘋果和英偉達(dá),都開始采用這種“拼積木”的方式,這是非常明確的趨勢(shì)。
國(guó)內(nèi)這兩年市場(chǎng)很熱發(fā)展很快,但形成規(guī)模和有競(jìng)爭(zhēng)力的廠商并不多?!靶酒€是一個(gè)需要積累的產(chǎn)業(yè),且產(chǎn)業(yè)鏈比較長(zhǎng)”, 趙小吾表示,“目前國(guó)內(nèi)小而多的形態(tài)不利于去和上下游爭(zhēng)奪話語權(quán),預(yù)計(jì)未來1-2 年里應(yīng)該會(huì)迎來一波AI芯片廠商淘汰潮?!?/p>
愛芯元智創(chuàng)始人、董事長(zhǎng)兼CEO仇肖莘也表達(dá)了類似觀點(diǎn),她談到,現(xiàn)在對(duì)國(guó)產(chǎn)芯片產(chǎn)業(yè)是千載難逢的機(jī)會(huì),由于市場(chǎng)需求和國(guó)家支持,涌現(xiàn)了許多創(chuàng)業(yè)型公司。而從大環(huán)境出發(fā),我國(guó)的芯片行業(yè)還屬于初期階段,正呈現(xiàn)出一種百花齊放的態(tài)勢(shì),但隨著產(chǎn)業(yè)的不斷發(fā)展壯大,隨之而來的行業(yè)整合也將是必經(jīng)過程。
她強(qiáng)調(diào),這符合芯片行業(yè)在過去幾十年發(fā)展的規(guī)律,經(jīng)過這樣的整合,業(yè)內(nèi)一定會(huì)出現(xiàn)頭部企業(yè),這對(duì)于國(guó)家整體產(chǎn)業(yè)發(fā)展是非常重要的。只有這樣,中國(guó)企業(yè)和國(guó)際大廠才有同臺(tái)競(jìng)技的機(jī)會(huì)。
靈汐科技華寶洪表示,邊緣AI芯片市場(chǎng)仍處于開放狀態(tài),沒有絕對(duì)的霸主。新興的、多樣化的應(yīng)用場(chǎng)景為國(guó)產(chǎn)AI芯片帶來了巨大的市場(chǎng)機(jī)會(huì),特別是在自動(dòng)駕駛、智能安防、智能物聯(lián)網(wǎng)和可穿戴設(shè)備等越來越碎片化的市場(chǎng),國(guó)產(chǎn)AI芯片廠商和國(guó)際巨頭芯片廠商是站在同一起跑線上的,甚至在某些領(lǐng)域更有優(yōu)勢(shì)。
寫在最后
就像計(jì)算架構(gòu)領(lǐng)域一位著名的科學(xué)家所說,現(xiàn)在正是芯片體系架構(gòu)百花齊放的黃金時(shí)代,這一時(shí)代前所未有。盡管CPU、GPU會(huì)持續(xù)創(chuàng)新,且在某些計(jì)算任務(wù)上是不可或缺的,但是AI加速計(jì)算、數(shù)據(jù)爆炸等趨勢(shì)催生的新市場(chǎng),一定是巨大且多樣的,這就給了AI芯片公司帶來了新的機(jī)會(huì)。
從CPU來看,x86架構(gòu)統(tǒng)治PC和服務(wù)器已有松動(dòng)跡象,Arm一路從手機(jī)端和IoT逐漸向上,攻入PC和服務(wù)器領(lǐng)域。RISC-V也從物聯(lián)網(wǎng)設(shè)備起步,向更大量的設(shè)備進(jìn)行布局。馮·諾依曼架構(gòu)和非馮·諾依曼架構(gòu)的異構(gòu)融合,正在通往規(guī)?;牡缆飞稀?/p>
每一次技術(shù)浪潮,都會(huì)產(chǎn)生新的領(lǐng)導(dǎo)型公司。邊緣AI會(huì)嗎?