作者 | 萬(wàn)博
對(duì)于全球自動(dòng)駕駛賽道來(lái)說(shuō),即將過(guò)去的2022年,是極不平凡的一年。在這一年中,行業(yè)長(zhǎng)久以來(lái)在技術(shù)路線和量產(chǎn)落地上的爭(zhēng)論,終于迎來(lái)了答案。
一方面,自動(dòng)駕駛跨越式路線和漸進(jìn)式路線之爭(zhēng),勝出之道開(kāi)始顯露,此前堅(jiān)持L4級(jí)高階自動(dòng)駕駛路線的玩家,要么如同Argo AI一樣陷入裁員危機(jī)甚至山窮水盡關(guān)門大吉,要么紛紛降維開(kāi)發(fā)L2級(jí)量產(chǎn)智能駕駛方案以求早日造血。
另一方面,圍繞智能駕駛量產(chǎn)落地上,此前將高精地圖視作命門的玩家,在成本、政策等多種因素之下,紛紛開(kāi)始轉(zhuǎn)向“重感知”策略。
能看到的是,在不斷拉扯下,自動(dòng)駕駛公司的選擇開(kāi)始趨同,“漸進(jìn)式”、“重感知”的方案,正在成為自動(dòng)駕駛落地的最優(yōu)解。
同時(shí),自動(dòng)駕駛賽道也在今年迎來(lái)一個(gè)里程碑式的進(jìn)展:高階智能輔助駕駛,終于開(kāi)進(jìn)城市道路。率先叩門的,是特斯拉、毫末和小鵬。
與其他家相比,毫末智行在城市領(lǐng)航駕駛落地節(jié)奏上,顯得更有信心,宣布未來(lái)將落地百城、搭載數(shù)量超百萬(wàn)輛。
宣布這樣有信心的目標(biāo),毫末智行底氣從何而來(lái)?
城市NOH落地百城,搭載數(shù)量超百萬(wàn)輛
2022年被認(rèn)為是城市高階智能駕駛元年,國(guó)內(nèi)第一梯隊(duì)玩家集中發(fā)布城市領(lǐng)航駕駛功能。相比于依靠高精地圖在試點(diǎn)城市小規(guī)模示范性運(yùn)營(yíng)的玩家,毫末智行是唯一提出能快速實(shí)現(xiàn)多城市、大規(guī)模量產(chǎn)的選手。
在今年8月的成都車展上,毫末智行率先推出城市高階駕駛輔助功能NOH(Navigation on HPilot),首搭車型是長(zhǎng)城魏牌摩卡DHT-PHEV激光雷達(dá)版,預(yù)計(jì)將在今年第四季度上車交付。
具體功能來(lái)看,其城市NOH對(duì)開(kāi)放道路的典型行駛場(chǎng)景均有覆蓋,例如智能識(shí)別紅綠燈、主動(dòng)變道、無(wú)保護(hù)路口轉(zhuǎn)向、主動(dòng)躲閃靜/動(dòng)態(tài)障礙物等等。
NOH還在不斷進(jìn)化迭代中,毫末智行近期表示,其智慧交通處理功能即將發(fā)布。據(jù)悉,這項(xiàng)功能可根據(jù)轉(zhuǎn)向燈和剎車燈,提前預(yù)知前車意圖,做出更類似人類駕駛的操作。
城市NOH快速迭代背后,得益于毫末智行較高的研發(fā)效率和場(chǎng)景落地能力。
官方信息顯示,截至到目前,毫末智行乘用車輔助駕駛解決方案HPilot,自2020年發(fā)布以來(lái)已經(jīng)進(jìn)行6次OTA升級(jí),版本迭代到HPilot3.0,高階智能駕駛能力已經(jīng)可以覆蓋高速、泊車和城市開(kāi)放道路三大場(chǎng)景。
在量產(chǎn)落地方面,截至今年10月,HPilot已經(jīng)在10余款乘用車上實(shí)現(xiàn)量產(chǎn)搭載,預(yù)計(jì)到今年年底,這個(gè)數(shù)字將上升至34款車型,屆時(shí)在長(zhǎng)城旗下80%的車型中,都會(huì)搭載HPilot。值得一提的是,第一批300臺(tái)摩卡PHEV(Coffee 01)已在上海港整裝完畢,將在德國(guó)市場(chǎng)交付首批用戶。未來(lái),HPilot也將為海外用戶帶來(lái)智能駕駛體驗(yàn)。
毫末智行還披露,用戶輔助駕駛行駛里程已經(jīng)突破2000萬(wàn)公里,這一數(shù)字在國(guó)內(nèi)的自動(dòng)駕駛公司中可以說(shuō)是遙遙領(lǐng)先。
此外,毫末智行發(fā)布的國(guó)內(nèi)首個(gè)數(shù)據(jù)智能體系MANA,已經(jīng)基本完成了數(shù)據(jù)的閉環(huán)處理,截至今年9月,MANA的學(xué)習(xí)時(shí)常超過(guò)31萬(wàn)小時(shí),虛擬駕齡相當(dāng)于人類司機(jī)4萬(wàn)年。
在MANA的加持下,智能駕駛產(chǎn)品工程化開(kāi)發(fā)也成為可能。據(jù)了解,毫末智行目前可以做到30個(gè)智能駕駛項(xiàng)目的異步并行開(kāi)發(fā),一套系統(tǒng)在新車型上的復(fù)用開(kāi)發(fā),可以在4個(gè)月內(nèi)達(dá)到量產(chǎn)狀態(tài)。
毫末智行CEO顧維灝曾披露,NOH整個(gè)開(kāi)發(fā)周期為10個(gè)月,相關(guān)功能在發(fā)布之前,已經(jīng)在北京和保定兩地進(jìn)行上路測(cè)試。測(cè)試數(shù)據(jù)顯示,毫末智行城市NOH的路口通過(guò)率超過(guò)70%,變道成功率超過(guò)90%,交通流處理能力可以達(dá)到4級(jí)。
在高效、閉環(huán)的開(kāi)發(fā)模式下,毫末智行對(duì)NOH未來(lái)的量產(chǎn)落地節(jié)奏,給出了一個(gè)看似激進(jìn)的目標(biāo):
“未來(lái),毫末城市NOH導(dǎo)航輔助駕駛落地城市數(shù)量100+,搭載乘用車數(shù)量達(dá)到百萬(wàn)級(jí)”。
如果不出意外,按照這個(gè)節(jié)奏,毫末將有望成為國(guó)內(nèi)首個(gè)大規(guī)模落地城市NOH的自動(dòng)駕駛公司。
規(guī)模量產(chǎn)自動(dòng)駕駛,毫末底層技術(shù)如何?
毫末智行自動(dòng)駕駛軟件能力的迭代進(jìn)化,MANA數(shù)據(jù)智能體系是最核心的一環(huán),也是最底層的技術(shù)支撐。
在2021年底的AI DAY上,毫末正式推出MANA數(shù)據(jù)智能體系。MANA是圍繞感知智能、認(rèn)知智能、標(biāo)注、仿真、計(jì)算等五大能力打造數(shù)據(jù)智能體系,核心出發(fā)點(diǎn)就是推動(dòng)自動(dòng)駕駛底層技術(shù)快速迭代。
一年時(shí)間過(guò)去,MANA數(shù)據(jù)智能體系已經(jīng)完成底層架構(gòu)搭建,并基本實(shí)現(xiàn)數(shù)據(jù)的閉環(huán)處理,同時(shí)在圍繞城市開(kāi)放道路的典型場(chǎng)景挑戰(zhàn),MANA進(jìn)行了感知、數(shù)據(jù)使用效率等方面的升級(jí)。
具體來(lái)看,主要涉及以下六個(gè)方面:
其一,解決大規(guī)模預(yù)訓(xùn)練模型(Foundation Models)難點(diǎn)。顧維灝曾表示,在自動(dòng)駕駛領(lǐng)域應(yīng)用大模型,首先要解決的問(wèn)題是,如何能更高效地將數(shù)據(jù)規(guī)模轉(zhuǎn)化為模型效果。
這里涉及的一個(gè)關(guān)鍵技術(shù)節(jié)點(diǎn)是,數(shù)據(jù)標(biāo)注。
大模型意味著大量的參數(shù)和數(shù)據(jù),在這種情況下,數(shù)以10億計(jì)的數(shù)據(jù)標(biāo)注需要大量的時(shí)間和成本。在此之下,就需要一種能夠直接使用大量無(wú)標(biāo)注數(shù)據(jù)的方法來(lái)解決問(wèn)題。
毫末選擇的方法是,自監(jiān)督學(xué)習(xí),也就是采用大量的無(wú)標(biāo)注數(shù)據(jù)訓(xùn)練感知任務(wù)主干網(wǎng)絡(luò)(backbone),模型其他部分再用標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練。通過(guò)這種方式,可以將訓(xùn)練效果提升3倍以上,同時(shí)精度也有顯著提升。
其二,關(guān)于長(zhǎng)尾場(chǎng)景數(shù)據(jù)的處理和模型優(yōu)化。毫末表示,隨著數(shù)據(jù)量越來(lái)越大,場(chǎng)景的數(shù)據(jù)樣本也會(huì)越來(lái)越豐富,但長(zhǎng)尾場(chǎng)景數(shù)據(jù)占比卻依舊偏少,因?yàn)榇蟛糠珠L(zhǎng)尾場(chǎng)景的數(shù)據(jù)樣本都相對(duì)匱乏。
例如,在車輛識(shí)別中,乘用車樣本雖多,但異形車的數(shù)據(jù)卻比較少,類似的情況還有帶有特殊圖文的交通燈、不同樣式的汽車尾燈等。
這種現(xiàn)象造成的結(jié)果是,訓(xùn)練出來(lái)的模型針對(duì)一些長(zhǎng)尾場(chǎng)景的處理效果不好,同時(shí)在加入新數(shù)據(jù)的時(shí)候,還會(huì)導(dǎo)致已有的訓(xùn)練效果迅速衰退。
為了解決這一難題,毫末為MANA構(gòu)造了一個(gè)增量式學(xué)習(xí)訓(xùn)練平臺(tái),平時(shí)在對(duì)模型進(jìn)行訓(xùn)練時(shí),放棄優(yōu)化所有參數(shù),而是有選擇地對(duì)一些特定參數(shù)進(jìn)行定點(diǎn)優(yōu)化,同時(shí)動(dòng)態(tài)觀察模型的擬合能力,并適時(shí)擴(kuò)充模型的擬合能力。這樣就可以節(jié)省80%以上的算力,收斂時(shí)間提升6倍。
搭載毫末智行HPilot 2.0輔助駕駛系統(tǒng)的坦克500
其三,在去高精地圖的前提下,使用重感知技術(shù)解決空間理解問(wèn)題。
毫末采取的方式,與特斯拉的方法有相似之處,那就是讓系統(tǒng)自己“腦補(bǔ)”。
具體來(lái)說(shuō),就是使用時(shí)間序列預(yù)測(cè)的Transformer模型在BEV空間做虛擬實(shí)時(shí)建圖,通過(guò)這種方式使感知車道線的輸出更加準(zhǔn)確和穩(wěn)定,同時(shí)對(duì)障礙物進(jìn)行更準(zhǔn)確的判斷。
據(jù)毫末介紹,目前已經(jīng)可以解決部分道路模糊、復(fù)雜路口、環(huán)島等問(wèn)題。在這個(gè)過(guò)程中,系統(tǒng)只需要使用普通導(dǎo)航地圖里的拓?fù)湫畔⒕托小?/p>
其四,利用人類世界的交互接口對(duì)交通參與者行為進(jìn)行預(yù)測(cè)。
此前,毫末主要通過(guò)傳感器和算法對(duì)交通參與者的行為進(jìn)行預(yù)測(cè),以此來(lái)對(duì)車輛周圍的交通環(huán)境做出提前反應(yīng),但在復(fù)雜性更高的城市開(kāi)放道路,單純靠“猜”的方式已經(jīng)不夠用了。
解決這個(gè)問(wèn)題的方法是,識(shí)別更多的人類交通語(yǔ)言,比如剎車燈、轉(zhuǎn)向燈,這樣算法就能更清楚的判斷周圍車輛的下一步行動(dòng),進(jìn)而做出決策。
從毫末城市NOH的功能來(lái)看,這項(xiàng)能力升級(jí),最終會(huì)體現(xiàn)在NOH的智慧交通處理功能上。
其五,關(guān)于仿真訓(xùn)練。仿真數(shù)據(jù)的真實(shí)度對(duì)算法模型的訓(xùn)練至關(guān)重要,而在城市開(kāi)放道路場(chǎng)景下,復(fù)雜性往往更高,尤其是應(yīng)對(duì)路口場(chǎng)景,時(shí)效性和微量交通流變化的構(gòu)建存在問(wèn)題。
為此,毫末與阿里以及浙江德清縣進(jìn)行合作,利用路端設(shè)備將路口的全天候真實(shí)交通流記錄下來(lái),建立自動(dòng)駕駛場(chǎng)景庫(kù)。這種采集方式,相比車輛采集數(shù)據(jù)更加豐富和真實(shí)。
最后,則是解決自動(dòng)駕駛系統(tǒng)舒適度的問(wèn)題。簡(jiǎn)而言之,自動(dòng)駕駛系統(tǒng)的啟停轉(zhuǎn)向,如何能像老司機(jī)一樣絲滑從容。
關(guān)于這一點(diǎn),毫末借鑒了多模態(tài)大模型的方法來(lái)解決自動(dòng)駕駛的認(rèn)知問(wèn)題。通過(guò)對(duì)覆蓋全國(guó)的大量人類駕駛行為進(jìn)行深度理解,構(gòu)建taskpromt,訓(xùn)練一個(gè)基于時(shí)空注意力機(jī)制(Attention)的駕駛決策預(yù)訓(xùn)練大模型,使得自動(dòng)駕駛決策更像人類實(shí)際駕駛行為。
以上就是MANA在今年最核心的進(jìn)展,毫末的整個(gè)自動(dòng)駕駛方法論,到這里也清晰起來(lái),歸結(jié)起來(lái)兩大關(guān)鍵詞:大數(shù)據(jù)、大模型。
漸進(jìn)式+重感知 破題量產(chǎn)自動(dòng)駕駛
毫末智能駕駛的快速落地,不僅取決于自動(dòng)駕駛扎實(shí)的技術(shù)沉淀,也得益于關(guān)鍵趨勢(shì)的前瞻判斷和選擇。
今年的自動(dòng)駕駛賽道有兩個(gè)值得關(guān)注的趨勢(shì)。
其一,此前堅(jiān)持跨越式落地的自動(dòng)駕駛玩家,大部分已經(jīng)開(kāi)始降維做量產(chǎn)方案,并尋求與主機(jī)廠合作,以獲得資金和數(shù)據(jù)支持。
第二,“重感知”的技術(shù)路線,開(kāi)始被越來(lái)越多的業(yè)內(nèi)玩家認(rèn)可,尤其是一些將量產(chǎn)目標(biāo)放在城市開(kāi)放道路上的玩家,幾乎將“重感知”方案當(dāng)作共識(shí)。
大趨勢(shì)背后的原因,業(yè)內(nèi)也有比較一致的看法。
一方面,跨越式的自動(dòng)駕駛落地不及預(yù)期,以Waymo為例,其早在2017年就已經(jīng)在鳳凰城開(kāi)展Robotaxi服務(wù),時(shí)至今日,仍然沒(méi)有進(jìn)入真正的商業(yè)化落地階段。與之處境相似的還有通用旗下的Cruise,僅今年上半年的虧損就有9億美元(約合人民幣60億元)。
巨額的投入之下,商業(yè)閉環(huán)遲遲不見(jiàn)曙光,也讓跨越式自動(dòng)駕駛的落地前景備受質(zhì)疑。
另一方面,高精地圖采集的成本困境,始終是實(shí)現(xiàn)城市開(kāi)放道路高階智能駕駛的一道門檻。再加上高精地圖涉及數(shù)據(jù)安全方面的問(wèn)題,落地審批難度較大。
兩大因素共同作用之下,舍棄高精地圖,將重頭戲放在車端感知上,同時(shí)再以量產(chǎn)為目標(biāo),大量收集數(shù)據(jù),反哺自動(dòng)駕駛算法的快速迭代,成為當(dāng)下這個(gè)階段的必然。
毫末智行是國(guó)內(nèi)較早提出“重感知”策略的自動(dòng)駕駛公司,并對(duì)自動(dòng)駕駛的發(fā)展節(jié)奏有著清晰的判斷。
按照顧維灝判斷,經(jīng)歷以硬件驅(qū)動(dòng)的1.0時(shí)代、以軟件驅(qū)動(dòng)的2.0時(shí)代,自動(dòng)駕駛已經(jīng)進(jìn)入以數(shù)據(jù)驅(qū)動(dòng)的3.0時(shí)代,即數(shù)據(jù)可以自我訓(xùn)練,自動(dòng)駕駛玩家的重點(diǎn),轉(zhuǎn)移到高效獲取數(shù)據(jù),并把數(shù)據(jù)轉(zhuǎn)化為知識(shí)上。
進(jìn)入自動(dòng)駕駛3.0時(shí)代,特斯拉和毫末智行走在前面。兩家企業(yè)無(wú)論是漸進(jìn)式的落地模式,還是對(duì)高精地圖的態(tài)度、以及自動(dòng)駕駛核心技術(shù)棧的搭建,都做出了先于行業(yè)趨勢(shì)的判斷和選擇。
毫末在創(chuàng)立之初,就選擇了漸進(jìn)式自動(dòng)駕駛路線,并不斷積累量產(chǎn)數(shù)據(jù);在算法訓(xùn)練上,毫末也是國(guó)內(nèi)最早對(duì)transformer大數(shù)據(jù)模型展開(kāi)研究的企業(yè);再到自動(dòng)駕駛超算中心MANA的建設(shè),毫末同樣走在了行業(yè)前面。
在這樣的技術(shù)積累和戰(zhàn)略鋪排之下,毫末取得的成果是顯而易見(jiàn)的。單從高階智能駕駛落地來(lái)看,毫末已經(jīng)成為除特斯拉、小鵬、華為之外,全球第四個(gè)擁有城市領(lǐng)航駕駛能力的企業(yè)。
算一算,從團(tuán)隊(duì)初立到今天的行業(yè)地位,毫末僅用了3年時(shí)間,這樣的速度,不可謂不快。
但也要看到,就整個(gè)行業(yè)來(lái)說(shuō),城市高階智能駕駛落地,今年僅僅是個(gè)開(kāi)端,后續(xù)行業(yè)競(jìng)爭(zhēng)依然會(huì)非常激烈。
從全球量產(chǎn)自動(dòng)駕駛賽道來(lái)看,以特斯拉、毫末、華為等代表的行業(yè)第一梯隊(duì)玩家,已經(jīng)完成從軟件到硬件,從車端到云端,從數(shù)據(jù)處理到算法訓(xùn)練,從前瞻技術(shù)布局到規(guī)模量產(chǎn)落地的技術(shù)打通,真正地實(shí)現(xiàn)了自動(dòng)駕駛技術(shù)全棧自研,并形成“特毫華”的競(jìng)爭(zhēng)格局。
毫末對(duì)比其他玩家已經(jīng)有了先發(fā)優(yōu)勢(shì),下一步,能否率先在國(guó)內(nèi)大規(guī)模鋪開(kāi)城市領(lǐng)航駕駛,持續(xù)保持領(lǐng)先行業(yè)半個(gè)身位,值得期待。