國(guó)產(chǎn)智駕和座艙芯片與外資差距主要在CPU,當(dāng)然這與市場(chǎng)定位也有關(guān)系。實(shí)際上,CPU消耗的成本遠(yuǎn)高于AI部分,Mobileye的CPU也很弱。不過(guò),要打破外資壟斷高端,這個(gè)短板必須補(bǔ)齊。
智駕和座艙芯片廠商芯片對(duì)比
數(shù)據(jù)來(lái)源:公開(kāi)資料整理
國(guó)產(chǎn)芯片與外資芯片差距一目了然,主要就在CPU領(lǐng)域。國(guó)產(chǎn)芯片陣營(yíng)CPU最高的是主要做手機(jī)芯片的展訊,其A7870平臺(tái)配置了車規(guī)級(jí)6nm制程處理器,8核設(shè)計(jì),包括1個(gè)2.7GHz的A76大核、3個(gè)2.3GHz的A76中核以及4個(gè)2.0GHz的A55小核。GPU采用NATT 4核@850Mhz,擁有217 GFLOPS浮點(diǎn)算力;NPU算力達(dá)到8 TOPS。
紫光展銳的A7870和瑞芯微的RK3588以及芯擎科技的龍鷹一號(hào),與高通的SA8155P相比,CPU架構(gòu)基本差不多,但高通的CPU核心頻率稍高,因此CPU算力達(dá)105K DMIPS。
ARM CPU架構(gòu)
來(lái)源: ARM
A55是Arm大小核架構(gòu)中的小核,主要配合A76大核使用,一般運(yùn)行頻率在1.8GHz,是國(guó)內(nèi)最常用的架構(gòu)。地平線、黑芝麻和芯馳都是用A55,或許這三家都在下一代產(chǎn)品計(jì)劃用A72,之所以用A55應(yīng)該還是出于成本的考慮。而紫光展銳主要是針對(duì)手機(jī)芯片,其手機(jī)芯片早就用了A76;瑞芯微產(chǎn)品線比較廣,成立也超過(guò)20年;芯擎背后有吉利和ARM撐腰,A76架構(gòu)獲得的成本可能會(huì)低一點(diǎn)。
德州儀器的TDA4之所以能橫掃行泊一體市場(chǎng),主要競(jìng)爭(zhēng)力來(lái)自三方面:
1 | 方便兩片級(jí)聯(lián),CPU算力達(dá)50K。雙TDA4VM大行其道,百度和大疆均有采用并都已實(shí)現(xiàn)量產(chǎn),其中百度主要客戶是長(zhǎng)城,大疆的主要客戶則為上汽通用五菱。 |
2 | 內(nèi)含高性能MCU,省下一片MCU的成本。在汽車芯片供應(yīng)緊張的2021年,MCU特別緊缺,價(jià)格波動(dòng)很大,整車廠很難適應(yīng)MCU價(jià)格的大起大落,因此渴望智駕芯片與MCU融為一體,降低供應(yīng)鏈的管理難度。雖然TDA4內(nèi)部的MCU還遠(yuǎn)不能與單獨(dú)的MCU如TC397比,但針對(duì)要求不高的場(chǎng)合,TDA4內(nèi)部的MCU足夠。 |
3 | 近似硬線加速的OpenVX,可以跨多個(gè)軟件平臺(tái),大大減少了研發(fā)過(guò)程,雖靈活性不足,但除了算法變化頻繁的新興造車外,大部分傳統(tǒng)車企的需求還是可以滿足。 |
行泊一體的興起讓一眾原本致力于L4的初創(chuàng)公司找到了救命稻草,百度、大疆、紐勱科技、MAXIEYE、禾多科技、易航智能、福瑞泰克、知行科技、小馬智行、輕舟智航、AutoBrain、元戎啟行,基本都是以TDA4為主的方案,當(dāng)然它們同時(shí)也有其他方案;而傳統(tǒng)Tier-1跟進(jìn)稍慢,但競(jìng)爭(zhēng)力更強(qiáng),經(jīng)緯恒潤(rùn)和德賽西威也有TDA4方案,進(jìn)展很快。
智能駕駛方面對(duì)CPU的要求也越來(lái)越高,高性能CPU的成本和門檻都遠(yuǎn)高于高性能NPU。想要1000TOPS以上AI算力易如反掌,但要超過(guò)300K的CPU算力,全球只有英偉達(dá)、英特爾、AMD、蘋(píng)果、三星、聯(lián)發(fā)科、亞馬遜這七家能做到。
新思科技的ARC NPX6 NPU IP讓3500TOPS唾手可得(見(jiàn)下圖)。
圖片來(lái)源:新思科技
英偉達(dá)最新的Thor毫無(wú)疑問(wèn)會(huì)采用其最新的Grace CPU,只不過(guò)不會(huì)是驚人的72核,估計(jì)是12核或16核。
圖片來(lái)源:英偉達(dá)
英偉達(dá)的GPU-CPU Superchip可以看做是Thor的放大版。
Grace Hopper超級(jí)芯片的內(nèi)部框架圖
圖片來(lái)源:英偉達(dá)
Hopper實(shí)際就是英偉達(dá)的H100 GPU。
Grace CPU內(nèi)核是ARM的Neoverse V2,代號(hào)Demeter,ARM在2022年9月正式對(duì)外發(fā)布,不過(guò)英偉達(dá)至少在2021年中期就應(yīng)該拿到了該內(nèi)核架構(gòu)的授權(quán),2022年中期就基本完成Grace CPU的開(kāi)發(fā),這也是英偉達(dá)第一個(gè)CPU。GPU和NPU(AI)都是協(xié)處理器,也就是devices,CPU才是host。某種意義上,GPU和NPU是與鼠標(biāo)、鍵盤一樣的外設(shè),一切全由CPU安排任務(wù)和處理數(shù)據(jù)。
Transformer時(shí)代,CPU作用得到進(jìn)一步強(qiáng)化,一是大量數(shù)據(jù)進(jìn)入Transformer前要做token嵌入,需要用到大量三角函數(shù)運(yùn)算,且是串行的,只有CPU最合適。二是Transformer每一層內(nèi)部并行計(jì)算,外部串行計(jì)算。需要大量的分支跳轉(zhuǎn)以及歸一化用到的矢量運(yùn)算。只有矩陣乘法的NPU很難處理,必須增加標(biāo)量和矢量運(yùn)算單元。
圖片來(lái)源:ARM
阿里達(dá)摩院引以自豪的芯片倚天710也是基于Arm Neoverse的,不過(guò)是性能更低的N系列中的N2架構(gòu),性能遠(yuǎn)不及V2架構(gòu)的英偉達(dá)Grace,單線程也不如更早期的亞馬遜 Graviton3。
圖片來(lái)源:ARM
Arm Neoverse V2主要為高性能矢量和機(jī)器學(xué)習(xí)而設(shè)計(jì)。
英偉達(dá)Grace CPU特性
圖片來(lái)源:英偉達(dá)
英偉達(dá)的144核心的Grace CPU采用Arm V9指令集,附帶SVE2(Scalable Vector Extension)指令集,就是支持靈活矢量長(zhǎng)度(128-2048,以128為步長(zhǎng))的指令,為了HPC和ML而設(shè)計(jì)。這個(gè)CPU的浮點(diǎn)算力極高,達(dá)到7.1TFLOPS,而英偉達(dá)H100(SMX5)也不過(guò)是34TFLOPS。
Grace內(nèi)部結(jié)構(gòu)
圖片來(lái)源:英偉達(dá)
英偉達(dá)的Grace CPU是兩個(gè)CPU用NVLink C2C并聯(lián)的,Thor肯定無(wú)需這么做,只需要單片。
高通也在自研CPU,不過(guò)不是基于Arm架構(gòu)的,而是高通收購(gòu)的Nuvia架構(gòu)。
高通基于Nuvia架構(gòu)的CPU
高通在2021年投資者大會(huì)上宣布下一代CPU將由收購(gòu)的Nuvia團(tuán)隊(duì)設(shè)計(jì),預(yù)計(jì)2023年有樣品可以供大客戶,目標(biāo)市場(chǎng)針對(duì)筆記本電腦市場(chǎng),并且將擴(kuò)展到移動(dòng)、汽車和數(shù)據(jù)中心領(lǐng)域。
Nuvia由三位蘋(píng)果前高管創(chuàng)立,他們分別是杰拉德·威廉姆斯(Gerard Williams III), 古拉蒂(Manu Gulati)和布魯諾(John Bruno)。這三位創(chuàng)始人都曾在蘋(píng)果工作過(guò),且在iPhone芯片部門擔(dān)任過(guò)高管職務(wù),擁有超過(guò)20年的半導(dǎo)體工程經(jīng)驗(yàn),迄今已獲得100多項(xiàng)專利。其中,威廉姆斯曾擔(dān)任蘋(píng)果CPU和A系列SoC首席設(shè)計(jì)師,九年期間幾乎負(fù)責(zé)了蘋(píng)果所有芯片的研發(fā),包括Cyclone、Typhoon、Twister、Hurricane、Monsoon和Vortex等架構(gòu)。他于2019年初離開(kāi)蘋(píng)果公司。除了蘋(píng)果,另外兩位創(chuàng)始人還在谷歌工作過(guò),其中古拉蒂曾在AMD和谷歌從事芯片研究,且在蘋(píng)果公司工作了八年,從事移動(dòng)端SoC的開(kāi)發(fā);而布魯諾曾在谷歌從事芯片研究工作,2012年加入蘋(píng)果公司,并在芯片平臺(tái)架構(gòu)小組工作了五年多。
2019年2月,三人在美國(guó)加州圣克拉拉郡聯(lián)合創(chuàng)立Nuvia。2019年11月15日,Nuvia宣布完成5300萬(wàn)美元的A輪融資,由著名的硅谷投資者Capricorn Investment Group和戴爾技術(shù)資本領(lǐng)投,Mayfield、WRVI Capital以及Nepenthe LLC參投。加上2020年9月官宣完成的2.4億美元的B輪融資,Nuvia兩輪總募集資金達(dá)到了2.93億美元。2021年1月高通以14億美元收購(gòu)了Nuvia。
目前第一款基于Nuvia設(shè)計(jì)的芯片已經(jīng)在測(cè)試中,2023年底就會(huì)正式推出,目前有三個(gè)型號(hào),分別是SC8380、SC8370、SC8350,分別是12、10、8核心,12核心即8個(gè)大核心,4個(gè)小核心。Nuvia設(shè)計(jì)的首款芯片主要用于筆記本電腦上,即8CX GEN4,這一點(diǎn)從型號(hào)就可以看出,8CX GEN3的頂配型號(hào)是SC8280。車載領(lǐng)域會(huì)略微靠后,約在2024年底會(huì)推出基于Nuvia設(shè)計(jì)的CPU的車載芯片。
受限于成本因素,國(guó)產(chǎn)芯片用Arm Neoverse或Cortex-x3不大可能,但是A55確實(shí)低了點(diǎn),Cortex-A72應(yīng)該是入門機(jī)型也能用的起的,能用A76更好。
免責(zé)說(shuō)明:本文觀點(diǎn)和數(shù)據(jù)僅供參考,和實(shí)際情況可能存在偏差。本文不構(gòu)成投資建議,文中所有觀點(diǎn)、數(shù)據(jù)僅代表筆者立場(chǎng),不具有任何指導(dǎo)、投資和決策意見(jiàn)。