2012年,深度學(xué)習(xí)“巨佬”GeoffreyHinton及其學(xué)生Alex,在ImageNet競(jìng)賽中,借助GPU來(lái)加速訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),奪得了競(jìng)賽的冠軍。
而本次競(jìng)賽的影響力,從學(xué)術(shù)界直接穿透到產(chǎn)業(yè)界,不僅推動(dòng)了第三次人工智能浪潮的到來(lái),更是幫助英偉達(dá)的GPU開(kāi)拓了新的增量市場(chǎng)。
其中,自動(dòng)駕駛應(yīng)用,作為AI領(lǐng)域的重要細(xì)分市場(chǎng),成為了英偉達(dá)發(fā)力的主要方向之一。
彼時(shí)正是Intel旗下Mobileye統(tǒng)治自動(dòng)駕駛芯片的時(shí)代。Mobileye以cv技術(shù)為基礎(chǔ),推出了算法+EyeQ系列芯片組成的系列解決方案,可以幫助車(chē)企實(shí)現(xiàn)從L0級(jí)的碰撞預(yù)警,到L1級(jí)的AEB緊急制動(dòng)、ACC自適應(yīng)巡航,再到L2級(jí)的ICC集成式巡航等各種功能。“算法+芯片”打包的商業(yè)模式,幫助Mobileye在早期的市場(chǎng)中賺了個(gè)盆滿(mǎn)缽滿(mǎn)。
此外,當(dāng)時(shí)的車(chē)企還將重要的技術(shù)力量集中在發(fā)動(dòng)機(jī)、變速箱等比較傳統(tǒng)的汽車(chē)“核心”領(lǐng)域,而將電子、智能化部分的研發(fā)交給德賽西威等Tier1廠商來(lái)做技術(shù)打包整合,直接封裝成模塊使用。Mobileye就是這種模式下的集大成者。Mobileye短期優(yōu)勢(shì)在于,在中國(guó)的車(chē)企還沒(méi)有能力去構(gòu)建自己的知識(shí)產(chǎn)權(quán)的情況下,它愿意用Mobileye?趕緊把車(chē)給造出來(lái),實(shí)現(xiàn)快速量產(chǎn);長(zhǎng)期來(lái)看,車(chē)企慢慢還是像自建自動(dòng)駕駛技術(shù)最終會(huì)是自研。
隨著技術(shù)的進(jìn)步,自動(dòng)駕駛在L2級(jí)別以后的發(fā)展逐漸需要更高的芯片算力,而車(chē)企開(kāi)始主要要求自己掌控智能駕駛輔助的“靈魂”算法,也需要更開(kāi)放的平臺(tái)來(lái)做算法的差異化。這時(shí)Mobileye開(kāi)始遭遇到了硬件性能和商業(yè)模式的雙重挑戰(zhàn),并最終被挑戰(zhàn)者英偉達(dá)拉下了行業(yè)頭把交椅。
?算力卷王誕生,英偉達(dá)的成功原因?
無(wú)論是通用Cruise、亞馬遜Zoox、AutoX、小馬智行這樣的Robotaxi公司,還是奔馳、捷豹路虎、沃爾沃這樣的全球知名車(chē)企,都已經(jīng)和英偉達(dá)建立了合作。
不久前,2022年英偉達(dá)GTC大會(huì)上,“黃教主”官宣了與比亞迪的合作關(guān)系。按照規(guī)劃,從2023年上半年起,比亞迪就將在部分車(chē)型上搭載英偉達(dá)的Orin芯片,以及相配套的的軟硬件系統(tǒng)。
無(wú)獨(dú)有偶,蔚來(lái)、小鵬、理想三家強(qiáng)勢(shì)新勢(shì)力今年的新款車(chē)型,都搭載了英偉達(dá)的自動(dòng)駕駛芯片。像高合、智己L7、集度等逐漸開(kāi)始顯露頭角的玩家,也選擇與英偉達(dá)達(dá)成合作。根據(jù)筆者在《缺少自動(dòng)駕駛的比亞迪還能火多久》中的介紹,比亞迪之所以采用高端芯片與英偉達(dá)合作,中低端采用地平線(xiàn)和自研的方式。其最重要的一點(diǎn)就是節(jié)省產(chǎn)品的研發(fā)和上市時(shí)間,實(shí)現(xiàn)產(chǎn)品的快速迭代。
英偉達(dá)在自動(dòng)駕駛領(lǐng)域的成功,其實(shí)簡(jiǎn)單來(lái)說(shuō)就兩點(diǎn):
1.完全開(kāi)放。其開(kāi)發(fā)的芯片不僅性能強(qiáng)大,更像是“公版顯卡”,不僅不限制車(chē)企自行開(kāi)發(fā)自動(dòng)駕駛軟件算法,還有很強(qiáng)的硬件兼容性。如果廠家不具備相應(yīng)的實(shí)力,或者就想貫徹“拿來(lái)主義”,英偉達(dá)也有自動(dòng)駕駛?cè)彝敖鉀Q方案。
2.無(wú)與倫比的強(qiáng)大算力。從2018年的Parker到現(xiàn)如今的Orin,已經(jīng)實(shí)現(xiàn)254倍的算力增長(zhǎng)。英偉達(dá)在2022GTC演講中發(fā)布了下一代SoC單芯片,也就是當(dāng)前大熱的Orin系統(tǒng)的接任者,NVIDIADRIVEThor。去年黃仁勛還說(shuō)會(huì)有一個(gè)1000TOPS的Atlan,結(jié)果今年就直接說(shuō)Atlan繼任者來(lái)了,是2000TOPS算力的Thor。也正因?yàn)門(mén)hor太強(qiáng)了,并且同樣將在2025年裝車(chē),所以英偉達(dá)就干脆取消了Atlan。
此外,自動(dòng)駕駛技術(shù)主要由高精地圖、感知模塊、決策模塊和執(zhí)行模塊組合而成,各家自動(dòng)駕駛供應(yīng)商、各大主機(jī)廠,主要內(nèi)卷的也就是這四大類(lèi)別技術(shù)。感知模塊可能是近幾年車(chē)企宣傳的重點(diǎn),多目攝像頭、車(chē)內(nèi)人員監(jiān)測(cè)、毫米波雷達(dá)、激光雷達(dá)、測(cè)距雷達(dá),各種新技術(shù)、新規(guī)格讓用戶(hù)看的云里霧里,可這些監(jiān)測(cè)模塊的數(shù)據(jù)匯總在一起的就是一堆圖形信息,而這恰好是英偉達(dá)最擅長(zhǎng)的領(lǐng)域。
2000TOPS是個(gè)啥概念?參照英偉達(dá)的A100,如果把FP8等同于INT8,那么就相當(dāng)于英偉達(dá)A100三倍的算力。A100的FP32單精度,那就是約為20TFLOPS。英特爾至強(qiáng)處理器icelake的Gold6348 CPU,對(duì)應(yīng)的單精度算力是4.6TFLOPS。這意味著Thor比Gold6348處理器的浮點(diǎn)運(yùn)算性能高出12倍。
除了GPU算力夠強(qiáng),Thor還是一顆SOC,集成了ARM的CPU。這顆CPU核心Grace是ARM即將發(fā)布的全新一代架構(gòu),ARMPoseidon AE(波塞冬)內(nèi)核,單線(xiàn)程性能業(yè)內(nèi)最強(qiáng)。說(shuō)到SOC,這里有一個(gè)參照物是高通的驍龍855芯片,也就是目前應(yīng)用最多的汽車(chē)座艙芯片的8155原型,是110GFLOPS,光是GFLOPS和TFLOPS單位就是一萬(wàn)倍的差距。
?Thor的誕生如何改變自動(dòng)駕駛行業(yè)?
這樣一來(lái)對(duì)于很多自動(dòng)駕駛算法公司,和自研的自動(dòng)駕駛芯片公司會(huì)產(chǎn)生什么影響呢?
眾所周知,AI的兩個(gè)重點(diǎn):算法+算力同樣重要。在算力不夠的情況下,算法就顯得非常重要。效率足夠高、輕量化的算法可以在有限的算力下完成更多的工作。然而當(dāng)算力足夠高,足夠奢侈的情況下,算法優(yōu)化的差別就顯得不那么大了,很多應(yīng)用直接上通用算法就行了。那么很多在算法上有積累的公司一下子處境尷尬起來(lái)。如果英偉達(dá)再自己下場(chǎng),將自動(dòng)駕駛的算法開(kāi)源,那么算法公司這個(gè)生態(tài)位就很難繼續(xù)存在下去了。而車(chē)企也必將更深的被綁定在英偉達(dá)這個(gè)平臺(tái)生態(tài)上。
目前的現(xiàn)狀大概是這樣。英偉達(dá)在自動(dòng)駕駛芯片領(lǐng)域處于壟斷地位,而高通在智能座艙領(lǐng)域也基本處于壟斷地位。所以大部分車(chē)企都會(huì)選擇在自動(dòng)駕駛域采用英偉達(dá)的Orin,而智能座艙用高通的8155。術(shù)業(yè)有專(zhuān)攻,這樣做其實(shí)也沒(méi)錯(cuò),畢竟兩個(gè)應(yīng)用還是有不小的差異,而同時(shí)也符合目前汽車(chē)的分布式域架構(gòu),不同域之間還是有一定的區(qū)隔。
不過(guò)英偉達(dá)的Thor出現(xiàn)以后,超高的算力讓一顆SOC就可以實(shí)現(xiàn)自動(dòng)駕駛和智能座艙的所有功能。通過(guò)多域計(jì)算,Thor系統(tǒng)可以為自動(dòng)駕駛和車(chē)載信息娛樂(lè)劃分任務(wù),可以根據(jù)實(shí)際的用戶(hù)需要,將2000TFLOPS算力分配到自動(dòng)駕駛,或者車(chē)載娛樂(lè)上。而同一顆SOC上,也可以同時(shí)運(yùn)行Linux、QNX和Android三種不同的操作系統(tǒng),可以分別代表自動(dòng)駕駛、功能安全和智能座艙三種應(yīng)用。
當(dāng)然,如果車(chē)企覺(jué)得這種單芯片的做法不保險(xiǎn),也可以通過(guò)NVLink-C2C芯片互連技術(shù)在連接兩顆芯片單獨(dú)運(yùn)行操作系統(tǒng)。試想一下兩顆Thor實(shí)現(xiàn)4000TFLOPS的算力,以后汽車(chē)就是移動(dòng)的服務(wù)器了。特斯拉設(shè)想的大型游戲已經(jīng)是小case了,將來(lái)可能會(huì)有更多專(zhuān)業(yè)級(jí)的計(jì)算會(huì)在車(chē)上實(shí)現(xiàn)。
從這一角度來(lái)看,智能座艙領(lǐng)域的王者高通或?qū)⒚媾R非常大的挑戰(zhàn)。特別是這次Thor采用的ARM波塞冬架構(gòu),用到手機(jī)上估計(jì)在2023年左右量產(chǎn),而Thor上車(chē)時(shí)間則是2024年底??梢哉f(shuō)車(chē)載芯片和手機(jī)芯片已經(jīng)沒(méi)有代差了。當(dāng)然,考慮到Thor是在2024年量產(chǎn),而高通8155則是前兩代產(chǎn)品,高通是有可能在2022年底或2023年初發(fā)布更為激進(jìn)的產(chǎn)品,并將ARM波塞冬架構(gòu)也導(dǎo)入座艙芯片。
實(shí)際上,當(dāng)英偉達(dá)Thor剛公布不久,高通就坐不住了。在日前舉行的高通汽車(chē)投資者大會(huì)上,高通汽車(chē)高級(jí)副總裁兼總經(jīng)理納庫(kù)爾·杜格爾正式宣布,推出“業(yè)內(nèi)首個(gè)集成式汽車(chē)超算SOC”,名字叫做SnapdragonRide Flex。據(jù)透露,SnapdragonRide Flex確切的說(shuō)是一個(gè)SoC產(chǎn)品家族,其包括Mid、High、Premium三個(gè)級(jí)別。RideFlex Premium SoC單顆芯片的AI算力在600TOPS以上。最高級(jí)的RideFlex Premium SoC再加上外掛的AI加速器(可能是NPU,MAC陣列)組合起來(lái),就可以實(shí)現(xiàn)2000TOPS的綜合AI算力。
大算力之外,SnapdragonRideFlex作為一個(gè)超算芯片家族,其最大的目標(biāo)是實(shí)現(xiàn)車(chē)內(nèi)的中央計(jì)算——即同時(shí)為智能駕駛、智能座艙、通信等能力提供計(jì)算支持,這也與英偉達(dá)Thor雷神芯片一致。預(yù)計(jì)最終上市時(shí)間可能會(huì)在2025年,稍晚于Thor。
自動(dòng)駕駛芯片主流供應(yīng)商(2021),來(lái)源:東北證券
曾幾何時(shí),超過(guò)100TOPS的算力已經(jīng)算是比較高端的芯片了。而在英偉達(dá)和高通的“PPT”大戰(zhàn)下,整個(gè)自動(dòng)駕駛芯片行業(yè)正在加速內(nèi)卷,算力門(mén)檻一再飆升。
在這么卷的情況下,也開(kāi)始有不少?gòu)S商出來(lái)給這場(chǎng)算力競(jìng)爭(zhēng)降降溫了。在行業(yè)玩家都紛紛追求高算力的2022年,Mobileye今年推出的旗艦產(chǎn)品EyeQUltra卻只有176TOPS。Mobileye的CEOAmmonShashua表示,“我們非常坦率地認(rèn)為T(mén)OPS是一個(gè)非常不充分的計(jì)算能力指標(biāo),集成在EyeQ芯片中的計(jì)算模型非常復(fù)雜,遠(yuǎn)不是單一指標(biāo)能夠量化的”。而Tesla的FSD芯片,也還保持在144TOPS的算力,但自動(dòng)駕駛的體驗(yàn)?zāi)壳笆菢I(yè)內(nèi)公認(rèn)的頭部位置。AmmonShashua同時(shí)也提出了對(duì)于功耗的擔(dān)憂(yōu),他認(rèn)為超高算力的芯片將會(huì)帶來(lái)過(guò)高功耗,從而減少新能源汽車(chē)的行駛時(shí)長(zhǎng)。畢竟,行駛中的汽車(chē)與服務(wù)器還是兩種不同的應(yīng)用場(chǎng)景。
國(guó)內(nèi)的自動(dòng)駕駛芯片代表廠商地平線(xiàn)也認(rèn)為,應(yīng)該更強(qiáng)調(diào)芯片的有效利用率而非只關(guān)注算力。他們將地平線(xiàn)征程5和Nvidia最新一代自動(dòng)駕駛芯片Orin在同一套數(shù)據(jù)集上進(jìn)行評(píng)測(cè)對(duì)比,發(fā)現(xiàn)征程5的FPS優(yōu)于NvidiaOrin的表現(xiàn)。地平線(xiàn)認(rèn)為,盡管競(jìng)品的AI芯片算力更高,但其算力的有效利用率上卻打了很大折扣,不同模型算法的有效利用率有很大差異。實(shí)際使用時(shí)就會(huì)有個(gè)很奇怪的現(xiàn)象,雖然芯片的TOPS很高,但實(shí)際模型跑在芯片上的效果并不好,這正是芯片有效利用率低的表現(xiàn)。
以特斯拉為例,它的自動(dòng)駕駛平臺(tái)是隨相關(guān)技術(shù)不斷發(fā)展而同步提高算力的,目前,特斯拉自動(dòng)駕駛平臺(tái)算力也不過(guò)100多TOPS。顯然,自動(dòng)駕駛必要的技術(shù)積累是車(chē)企邁不過(guò)的檻,積累上的差距不是單純堆算力就能彌補(bǔ)的,過(guò)度堆算力只會(huì)增加消費(fèi)者不必要的購(gòu)車(chē)成本。其實(shí),自動(dòng)駕駛技術(shù)的真正成熟還是需要包括基礎(chǔ)研究在內(nèi)的一系列相關(guān)技術(shù)取得突破。
不過(guò),盡管有種種擔(dān)憂(yōu),考慮到未來(lái)的“一顆芯片”控制整車(chē)將成為趨勢(shì),哪怕僅僅從單芯片的采購(gòu)成本和市場(chǎng)宣傳的角度來(lái)看,芯片算力內(nèi)卷已經(jīng)不可避免。而在這個(gè)算力大幅度提升的緊要關(guān)頭,中國(guó)芯片廠商正面臨1990年以來(lái)前所未有的制裁,中國(guó)自動(dòng)駕駛自主之路的速度或?qū)⑦M(jìn)一步放緩。
?新的制裁開(kāi)始了
美國(guó)時(shí)間10月7日,美國(guó)商務(wù)部工業(yè)安全局(BIS)宣布了對(duì)美國(guó)《出口管理?xiàng)l例》(EAR)的一系列修訂,并公布了針對(duì)中國(guó)企業(yè)的新的出口管制限制措施。這是BIS近年來(lái)最大幅度的限制性舉措,也是近期中美科技“脫鉤”的最大動(dòng)作。
我們重點(diǎn)關(guān)注與自動(dòng)駕駛行業(yè)相關(guān)的一條禁令:GPU出口管制的技術(shù)限制設(shè)定為英偉達(dá)A100的指標(biāo),(單精度19.5TFLOPS.雙精度97TFLOPS.I/O為600GB/SL超過(guò)標(biāo)準(zhǔn)需要申請(qǐng)?jiān)S可證。)A100是英偉達(dá)2020年9月發(fā)布的7納米GPU芯片,H100則是英偉達(dá)2022年3月發(fā)布并預(yù)計(jì)將在三季度上市的4納米GPU芯片。這兩款GPU產(chǎn)品,均是市場(chǎng)上可獲取的最高性能GPU產(chǎn)品之一。
8月份,美國(guó)政府向AMD、英偉達(dá)發(fā)出臨時(shí)禁售通知,說(shuō)明出口管制政策的修訂工作已經(jīng)基本完成,從英偉達(dá)的公告可以看出,商務(wù)部已經(jīng)制定了“芯片性能達(dá)到A100閾值”作為制裁的分界線(xiàn)。8月?31日,英偉達(dá)提交給美國(guó)證券交易委員會(huì)的報(bào)告中顯示,美國(guó)政府要求限制其向中國(guó)出口最新兩代旗艦GPU?計(jì)算芯片A100?和H100。此外,AMD的數(shù)據(jù)中心級(jí)?GPUMI100?與?MI200也被限制出口。隨后,英偉達(dá)宣布已經(jīng)獲得了美國(guó)政府授權(quán),可以在明年3?月之前繼續(xù)向美國(guó)客戶(hù)出口到中國(guó)的產(chǎn)品提供A100,明年?9月前繼續(xù)履行?A100和?H100的訂單。盡管如此,英偉達(dá)的股價(jià)還是應(yīng)聲而落,市值蒸發(fā)了288?億美元。
10月7日進(jìn)行的修訂,很明顯是對(duì)于8月AMD、英偉達(dá)GPU禁售令的詳細(xì)說(shuō)明。而除了此前提到過(guò)的數(shù)據(jù)中心、服務(wù)器、超算等應(yīng)用將遭受影響外,目前如火如荼的新能源汽車(chē)算力競(jìng)爭(zhēng)或許也將踩上剎車(chē)。特別在剛剛舉行的NvidiaAI Day上發(fā)布的算力超過(guò)2000TOPS的自動(dòng)駕駛芯片Thor,可能會(huì)受到限制,而英偉達(dá)的芯片目前幾乎已經(jīng)壟斷了中高端自動(dòng)駕駛市場(chǎng)。
?中國(guó)本土芯片商被鎖死了嗎?
2022中國(guó)電動(dòng)汽車(chē)百人會(huì)論壇上,全國(guó)政協(xié)經(jīng)濟(jì)委員會(huì)副主任、前工信部部長(zhǎng)苗圩,在談及芯片供應(yīng)問(wèn)題時(shí),言辭激烈?!捌?chē)廠商真正采取行動(dòng)的沒(méi)有,只會(huì)光叫喚?!边@句話(huà)說(shuō)得很重了。
不僅直言中國(guó)汽車(chē)行業(yè)缺芯少魂,更是對(duì)國(guó)內(nèi)車(chē)企把車(chē)規(guī)級(jí)芯片、操作系統(tǒng)等卡脖子技術(shù)扔給一級(jí)配套商(tier1廠商)的“不作為”,表達(dá)了不滿(mǎn)。國(guó)內(nèi)的汽車(chē)半導(dǎo)體供應(yīng)鏈,僅僅寄希望于Tier1,將砝碼全部壓在英偉達(dá)、高通這樣的國(guó)際巨頭(特別是美國(guó)企業(yè))身上,一旦出現(xiàn)了類(lèi)似于開(kāi)頭美國(guó)出口管制的情況,供應(yīng)鏈安全將遭受巨大挑戰(zhàn)。高通當(dāng)然是可替代英偉達(dá)的一個(gè)選項(xiàng),不過(guò)作為國(guó)外廠商,高通面臨著和英偉達(dá)一樣的風(fēng)險(xiǎn)。
今年來(lái),國(guó)內(nèi)開(kāi)始涌現(xiàn)出類(lèi)似于地平線(xiàn)、黑芝麻、寒武紀(jì)、華為、芯馳等本土廠商,紛紛發(fā)力自動(dòng)駕駛芯片。比如獲得理想汽車(chē)青睞的地平線(xiàn),2021新款理想ONE上已經(jīng)配置上了征程3芯片;智能駕駛、中央網(wǎng)關(guān)、智能座艙全方位布局的芯馳科技,產(chǎn)品已經(jīng)覆蓋國(guó)內(nèi)超70%的車(chē)廠。
其中地平線(xiàn)征程5基于臺(tái)積電16nm制程打造,AI算力可以達(dá)到128TOPS。華為的MDC810,算力400TOPS,已經(jīng)實(shí)現(xiàn)量產(chǎn)上車(chē)。MDC810并搭載沒(méi)有支持通用計(jì)算的GPU,而是用“特定域架構(gòu)”的AI芯片Ascend昇騰負(fù)責(zé)計(jì)算。黑芝麻的華山2號(hào)A1000量產(chǎn)已經(jīng)在路上,INT8精度下單顆芯片算力達(dá)58TOPS,將在江汽集團(tuán)思皓新車(chē)型上首發(fā)量產(chǎn),具體時(shí)間未定。今年下半年,芯馳將推出算力超過(guò)200TOPS的自動(dòng)駕駛專(zhuān)用芯片。而量產(chǎn)計(jì)劃,按照半導(dǎo)體行業(yè)普遍規(guī)律來(lái)看,不會(huì)早于2024年。
根據(jù)中信證券的最新的《自動(dòng)駕駛芯片行業(yè)研究報(bào)告(2022)》分析,上面這些可替代英偉達(dá)Orin的本土方案,從性能和量產(chǎn)節(jié)奏來(lái)看,優(yōu)缺點(diǎn)明顯。國(guó)內(nèi)自主替代的產(chǎn)品,已經(jīng)走到量產(chǎn)前夜,而且可以通過(guò)架構(gòu)、系統(tǒng)、軟件的優(yōu)化,達(dá)到和英偉達(dá)Orin相當(dāng)?shù)男Ч2贿^(guò)考慮到汽車(chē)芯片的設(shè)計(jì),不僅需要車(chē)規(guī)級(jí)的認(rèn)證,還需要半導(dǎo)體技術(shù)的積累,以及整個(gè)車(chē)芯產(chǎn)業(yè)鏈的互相支撐。哪怕芯片廠商設(shè)計(jì)生產(chǎn)出了產(chǎn)品,Tier1們不采用,供應(yīng)鏈被切斷,也很難被整車(chē)配置,進(jìn)行市場(chǎng)檢驗(yàn)、技術(shù)迭代。再加上國(guó)際環(huán)境的動(dòng)蕩、技術(shù)的封禁、疫情的反復(fù),以及原材料上漲等一系列不確定因素,本土自動(dòng)駕駛芯片的真正替代和趕超時(shí)間可能還要延后。
與此前不少媒體分析,相關(guān)制裁措施“利好國(guó)產(chǎn)GPU和AI芯片”的樂(lè)觀不同。筆者認(rèn)為,這次美國(guó)將邏輯芯片的管控范圍調(diào)整到16/14nm或更先進(jìn)的制程,而28nm及以上制程的擴(kuò)產(chǎn)也需要獲得許可。未來(lái)國(guó)內(nèi)的芯片設(shè)計(jì)公司或?qū)⒈绘i死在16/14nm之內(nèi),無(wú)法流片更高級(jí)別工藝的芯片。值得一提的是,除了手機(jī)之外,目前包括PC、拼版、車(chē)機(jī)、自動(dòng)駕駛算力平臺(tái)以及可穿戴領(lǐng)域的芯片,都在加速邁向先進(jìn)制程。特別是車(chē)機(jī)和自動(dòng)駕駛平臺(tái),邁向先進(jìn)制程的速度非??臁=酉聛?lái)的3-5年將是國(guó)產(chǎn)AI芯片廠商加速AI應(yīng)用落地和大規(guī)模部署的快速發(fā)展時(shí)期。如果國(guó)產(chǎn)芯片被鎖死在16/14nm之內(nèi),就如同《三體》中地球基礎(chǔ)科技被智子鎖定一樣,將在未來(lái)的關(guān)鍵競(jìng)爭(zhēng)節(jié)點(diǎn)上丟掉主動(dòng)權(quán)。先進(jìn)制程代工這道關(guān)不過(guò),未來(lái)所有的中國(guó)芯片企業(yè)都將是華為。
除了先進(jìn)制程之外,國(guó)產(chǎn)芯片廠商還面臨EDA和IP環(huán)節(jié)的差距。以GPU為例,作為高性能高復(fù)雜度的大芯片,想在短期內(nèi)快速推出相關(guān)產(chǎn)品,必然依賴(lài)外部IP。雖然目前各家國(guó)產(chǎn)GPU都在宣傳“獨(dú)立自主研發(fā)”,然而在核心基礎(chǔ)上的投入都不夠,大多采用licenseIP模式,同質(zhì)化非常嚴(yán)重。從理論上來(lái)說(shuō),自研IP越多,GPU的差異化更明顯,但相對(duì)而言資金、人員、時(shí)間上的成本投入也更高。一家從事GPGPU研發(fā)的企業(yè)代表告知,GPUIP自研需要36-48個(gè)月以及200個(gè)工程師,而采用外購(gòu)IP的方式,可以減少12-18個(gè)月開(kāi)發(fā)周期。
在PC和服務(wù)器GPU領(lǐng)域,核心的GPUIP廠商主要是Imagination、芯原、格蘭菲;在移動(dòng)GPU領(lǐng)域,主要有ArmMali、ImaginationPowerVR系列,芯原在前幾年收購(gòu)美國(guó)嵌入式GPU設(shè)計(jì)商圖芯之后亦有不少授權(quán)用戶(hù),以及高通的Adreno。高通Adreno從AMD買(mǎi)入,且不對(duì)外銷(xiāo)售。作為GPU的老牌巨頭,英偉達(dá)、AMD均有自己的強(qiáng)大GPUIP,英特爾也購(gòu)買(mǎi)了AMD的GPUIP要在獨(dú)立GPU市場(chǎng)卷土重來(lái)。
整體而言,國(guó)內(nèi)GPGPU企業(yè)與國(guó)際大廠技術(shù)差距約3年,渲染GPU與國(guó)際大廠差距約10年左右。要想彌補(bǔ)這一差距,不止要在生態(tài)層面發(fā)力,提升國(guó)內(nèi)核心IP能力顯然是必然要做的功課。
最后,筆者認(rèn)為,目前對(duì)于中國(guó)自動(dòng)駕駛產(chǎn)業(yè)來(lái)說(shuō),還有1年的緩沖期。一年以后可能要面臨沒(méi)有高端芯片可用的尷尬境地。好在自動(dòng)駕駛的商用落地估計(jì)還有3~5年時(shí)間。而這種情況下,一方面政府可能需要從保護(hù)自身產(chǎn)業(yè)的角度出發(fā)出臺(tái)相關(guān)產(chǎn)業(yè)政策,有意識(shí)的控制L2級(jí)別以上自動(dòng)駕駛的商用落地速度;另一方面,本土芯片廠商則要苦練內(nèi)功,加強(qiáng)基礎(chǔ)核心技術(shù)的研發(fā);而車(chē)企則應(yīng)該不要把所有雞蛋都放到自動(dòng)駕駛一個(gè)籃子里,應(yīng)該關(guān)注“三電”等新能源汽車(chē)的核心技術(shù),盡量做到擴(kuò)大自身優(yōu)勢(shì),補(bǔ)齊短板。