賈浩楠 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
2022年車主翹首以盼、車企們都在爭奪的產(chǎn)品是什么?城市輔助駕駛,帶自主領(lǐng)航的那種。
為啥?
紅綠燈路口、環(huán)路、人車混行都能自主應(yīng)對,設(shè)置好導(dǎo)航,駕駛員就能完全解放,只扮演安全員的角色。
絕大部分車主最枯燥、最疲憊的駕駛體驗,解決了。
但城市道路上輔助駕駛的落地難度,絕對可以稱得上目前乘用車智能駕駛量產(chǎn)的“圣杯”。
異形目標、不同交通標識、模糊的車道線等等對感知能力挑戰(zhàn)巨大;違規(guī)通行目標、復(fù)雜路口的博弈…對AI的認知決策能力要求,與L2不可同日而語。
所以,量產(chǎn)上車城市輔助駕駛,是實力和潛力的最好證明。
不過萬萬沒想到,量產(chǎn)“第一”之名,花落老牌車企長城汽車,今年年中即將上市。
而去年年底,長城旗下的多款車型,已經(jīng)率先量產(chǎn)了高速領(lǐng)航輔助駕駛。
這樣的速度和成果,好像“不可思議”。
但背后的“秘籍”已經(jīng)不是秘密:毫末智行。
“非典型”自動駕駛創(chuàng)業(yè)公司、中國最快量產(chǎn)智能駕駛產(chǎn)品、乘用車物流車雙線并舉…
毫末智行這家公司成立不到3年,率先在國內(nèi)實現(xiàn)城市領(lǐng)航輔助功能量產(chǎn),速度和力度都讓業(yè)內(nèi)吃驚。
AI Day現(xiàn)場的火熱程度可見一斑。投資人、合作伙伴、AI技術(shù)大牛紛紛到場,主辦方甚至要臨時添加座椅。
大家好奇的,是這家自動駕駛公司到底有什么秘密?
中國首個量產(chǎn)城市輔助駕駛,什么水平?
城市道路上的領(lǐng)航輔助駕駛功能,去年開始不少主機廠或無人車公司都放出過Demo。
不過毫末智行即將量產(chǎn)的城市NOH功能,號稱首戰(zhàn)即有這么幾個“行業(yè)之先”。
中國率先量產(chǎn)的城市輔助駕駛。如果之前各家的量產(chǎn)上車時間表不變,下半年長城汽車交付的魏牌摩卡車型,將是中國用戶能買到的第一款有城市領(lǐng)航輔助的汽車。
率先在多種動力形式上實現(xiàn)城市輔助駕駛。魏牌摩卡,既有燃油車,也有插混車型。另外下半年上市的歐拉純電新車,也會搭載毫末智行城市NOH。
△ 毫末智行董事長張凱
當然,毫末城市NOH,本身也打破了自動駕駛創(chuàng)業(yè)公司的記錄。下半年量產(chǎn)上車,滿打滿算距離成立3周年。
對于這樣的量產(chǎn)進度,毫末智行董事長張凱給出了這樣的總結(jié):
截止這個月,已經(jīng)有6款車型搭載毫末智行智能駕駛系統(tǒng)的第六款車型。使毫末智行向既定目標——3年搭載100萬臺車,又邁進了一大步。
量產(chǎn)當然是實力體現(xiàn),但只是一部分。
真正的功夫,還要看應(yīng)對城市復(fù)雜路況是不是足夠“老司機”,乘坐體感夠不夠舒適,最重要的,安全嗎?
實車體驗最能說明問題。
體驗路線分布在北京順義城區(qū)核心,全長11.2公里,包括兩個環(huán)島、6個轉(zhuǎn)彎,以及十幾個紅綠燈。
具體路況嘛,既有通暢的城市主干道,也有人車混行、較為混亂的路口。
按照場景的簡單到復(fù)雜,我們把體驗下來的毫末城市NOH實際表現(xiàn)分成這6個要點。
紅綠燈識別
紅綠燈識別的難度在于不同地區(qū)交通標示標準不一,這需要后臺有一個盡可能完備的數(shù)據(jù)庫供系統(tǒng)學(xué)習。
去每一個路口采集數(shù)據(jù)樣本當然不現(xiàn)實,毫末采取的方法是通過圖像合成和遷移學(xué)習,加快技術(shù)的迭代。
這其中,主要技術(shù)難題是真實數(shù)據(jù)和合成數(shù)據(jù)的混合訓(xùn)練問題。
通過圖像合成技術(shù)可以擴大學(xué)習的樣本量,但是真實和合成數(shù)據(jù)在特征空間及概率分布不一致,導(dǎo)致使用有效率大打折扣。
△ 毫末智行CEO顧維灝
所以毫末使用了遷移學(xué)習中領(lǐng)域泛化的混合遷移訓(xùn)練方法,利用合成數(shù)據(jù)定向彌補真實場景中缺失的數(shù)據(jù)樣本及不斷調(diào)整訓(xùn)練策略,減小二者特征空間的概率分布差異。
有了足夠的數(shù)據(jù)訓(xùn)練,就可以對路面上不同形式的紅綠燈識別。
比如,在大路口場景中,紅綠燈離車輛距離很遠,在圖像數(shù)據(jù)上目標更小更難以識別:
所以這樣的場景從感知到?jīng)Q策,全方位的要求都很高。
避讓其他目標
除了能準確識別車道線,并根據(jù)導(dǎo)航選擇合適路徑,NOH還會動態(tài)避讓其他加塞的車輛和行人,保障安全:
對于加塞的車輛或行人,NOH會根據(jù)目標速度、路徑綜合判斷剎車、方向調(diào)整程度,不會猛然剎停,保證安全的前提下兼顧通行效率。
而且毫末NOH對于避讓行人的原則貫徹到位,即使通過無人的路口或斑馬線,也會提前減速。
無保護轉(zhuǎn)彎
無保護左右轉(zhuǎn),如今并不是一個難度極高的項目。不過毫末NOH表現(xiàn)的亮眼之處在于能處理多車道交互的復(fù)雜路口,包括正確識別交通燈和待轉(zhuǎn)區(qū)。
這樣的路口難度在于尺寸較大,首先是系統(tǒng)需要感知識別的范圍更廣,目標的數(shù)量和類型更多;相應(yīng)的,其他目標出現(xiàn)違規(guī)行為的可能性也更高。
車道線識別
同是領(lǐng)航輔助,城市場景下的車道線識別和高速難度完全不同。
城市內(nèi)車道線更加密集,種類更多,形式更為復(fù)雜,而且常常有污損情況。
面對這樣的挑戰(zhàn),毫末智行設(shè)計了BEV Transfomer。
攝像頭的數(shù)據(jù)傳回后,首先對2D 圖像用 Resnet + FPN 進行處理,之后進行BEV映射,這部分利用交叉注意力層(Cross Attention) 來動態(tài)確定某一幀圖像中的內(nèi)容在相機所屬 BEV 空間中的位置。
通過多個Cross Attention,最終組成一個完整的 BEV空間。
當視覺數(shù)據(jù)完成了在BEV的投射,就天然具備了和激光雷達點云圖的融合能力。
最后,系統(tǒng)還會綜合考慮BEV的歷史數(shù)據(jù),加入與時間有關(guān)的特征,進一步提升識別的準確率和連續(xù)性。
進出環(huán)島
環(huán)島對于自動駕駛系統(tǒng)來說一直是一個巨大的挑戰(zhàn)。其中既有較為復(fù)雜的規(guī)則,還要根據(jù)導(dǎo)航路線擇機干凈利落地切入切出。
對于感知系統(tǒng)來說,準確識別車道線,還包括能分清楚環(huán)路的邊界,之前特斯拉FSD測試時,常發(fā)生沖上中央路基的情況。
毫末NOH除了準確感知、識別環(huán)路,并根據(jù)導(dǎo)航選擇合適路線。而且面對環(huán)島中其他車輛短時間內(nèi)數(shù)次變道的行為,也能準確識別和合理避讓。
這一點的難度其實比平直路面大得多,因為連續(xù)大曲率的彎道,對于車輛的速度、轉(zhuǎn)向精度要求更高。
復(fù)雜場景挑戰(zhàn):路口碰上違規(guī)車,怎么辦?
城市場景難,其實不在復(fù)雜的車道線和交規(guī),而是難在隨時可能發(fā)生的不可預(yù)知的場景。
這些場景也是考驗一個城市領(lǐng)航輔助系統(tǒng)是不是老司機的試金石。
比如,我們的試乘車本來正常直行通過一個十字路口,結(jié)果垂直車道一輛左轉(zhuǎn)汽車先是闖紅燈搶行,使得NOH緊急停車避讓:
左轉(zhuǎn)綠燈亮了以后,這輛車卻停在超出待轉(zhuǎn)區(qū)的十字路口中央不動了…而此時我們直行的綠燈已經(jīng)轉(zhuǎn)紅。
我們有意沒有接管,想看看NOH到底會怎么辦。
緊急避讓保證安全后,NOH用幾秒時間確認搶行車停止不動,然后系統(tǒng)并沒有受到直行綠燈轉(zhuǎn)紅的影響而停在路中間,確認安全后盡快通過路口:
換成人類司機,這其實也是唯一合理且安全的處理方式。
這套方案,除了軟件算法全部由毫末智行自研,硬件方案中的自動駕駛計算平臺也是毫末自研,算力達到360T。
對比來看,今年大部分車廠翹首以盼等交付的英偉達Orin芯片,是256T算力。
此外,傳感器方面,量產(chǎn)NOH方案采用12個攝像頭、5個毫米波雷達、2個激光雷達以及12個超聲波雷達。
這就是中國首個量產(chǎn)城市輔助駕駛的真實情況,你感覺它夠“老司機”嗎?
自動駕駛“思想鋼印”?
毫末NOH的量產(chǎn)速度如此之快,甚至有業(yè)內(nèi)人士表示百思不得解。
毫末曾經(jīng)給自己的業(yè)務(wù)方法論,起了一個頗為神秘的名字:自動駕駛思想鋼印。
不了解《三體》也沒關(guān)系,毫末智行所謂的“思想鋼印”,其實就是自動駕駛公司都繞不過去的數(shù)據(jù)閉環(huán)能力。
一般來說,自動駕駛數(shù)據(jù)閉環(huán)萬變不離其宗,關(guān)鍵流程都是“數(shù)據(jù)收集處理-訓(xùn)練-部署-再收集”的循環(huán),以此迭代升級AI司機的能力。
涉及到數(shù)據(jù)層面,總共三個過程:收集、處理、反饋。
只不過在毫末這里,加上了兩個附加條件:低成本和高速度。
對應(yīng)到毫末智行數(shù)據(jù)智能體系中,分別是數(shù)據(jù)的自動化處理程度,和模型快速驗證。
AI Day上毫末智行CEO顧維灝介紹毫末最新的數(shù)據(jù)積累和應(yīng)用情況:毫末智行智能駕駛系統(tǒng)目前裝機量為數(shù)萬,截止今年四月用戶貢獻的實際路測里程超過700萬公里,而且這個數(shù)字還在以每天數(shù)萬公里的速度增加。
數(shù)據(jù)的收集問題,毫末已經(jīng)解決,但要讓AI明白數(shù)據(jù)含義,還需要認知過程,解決從客觀世界到駕駛動作的映射。
除了從實時數(shù)據(jù)上歸納影響駕駛行為的因素,系統(tǒng)還需要對照更大規(guī)模的數(shù)據(jù)樣本來學(xué)習規(guī)律。
所以,數(shù)據(jù)處理的核心聚焦到快速標注上。
為此毫末研發(fā)了一個高效標注系統(tǒng),應(yīng)用無監(jiān)督自動標注算法,這套系統(tǒng)從數(shù)據(jù)標注的底層入手,對大批量數(shù)據(jù)進行自動標注,再由人工校對后反饋給系統(tǒng),不斷提升準確性和效率,逐漸減少人力工作量。
目前,毫末已經(jīng)有超過70%的數(shù)據(jù)由系統(tǒng)自動標注處理。
數(shù)據(jù)處理的自動化能力建設(shè)有什么意義?
隨著未來兩年毫末智能駕駛系統(tǒng)裝機量達到百萬,人工標注數(shù)據(jù)的成本即使按0.5元一公里來算,也會迅速上升到數(shù)億甚至十億級別。
別說創(chuàng)業(yè)公司,國內(nèi)車企自主三強每年凈利也不過幾十億,這條路顯然是走不通的。
所以,建立數(shù)據(jù)閉環(huán)其實不難,真正能持續(xù)下去的是“低成本獲取數(shù)據(jù)”。
數(shù)據(jù)處理好之后,已經(jīng)可以喂給算法進行訓(xùn)練,那么訓(xùn)練好的模型,如何驗證效果?
尤其是在短時間對多個功能進行不同升級后,如果把所有版本依次拿到實車上跑一遍,然后再開發(fā)下一個版本…自動駕駛可能就永無實現(xiàn)之日了。
所以要把把驗證工作放在仿真系統(tǒng)中進行。
毫末智行將每一次路測都還原為仿真中的“元宇宙”,同一場景下不同光照、不同天氣,不同曝光條件都可在系統(tǒng)中調(diào)整,由此來模擬算法在不同工況下的表現(xiàn)。
這樣的流程,其實也可以理解成算法迭代的自動化,對應(yīng)著思想鋼印中的“高速度”。
毫末智行這一套數(shù)據(jù)智能體系,叫雪湖,也叫MANA。
癡迷《三體》的毫末工程師們以此命名,含義是像面壁者邏輯掉入雪湖后參悟黑暗森林法則一樣,從MANA開始,毫末也掌了握自動駕駛的核心能力。
在MANA系統(tǒng)的加持下,毫末智行的“AI司機”,已經(jīng)不間斷訓(xùn)練駕駛技巧長達20萬小時,虛擬駕齡已相當于人類司機2萬年的駕駛時長。
毫末智行的高速、城市NOH快速上線,業(yè)內(nèi)看起來好像“開掛”一般,但了解深層原因后并不匪夷所思。
本質(zhì)就是高度自動化的數(shù)據(jù)智能能力,保證了AI老司機能力快速迭代的基本條件,再加上長城汽車的大規(guī)模量產(chǎn)渠道。
所以,討論“毫末現(xiàn)象”的核心其實應(yīng)該是:毫末智行的經(jīng)驗和模式,可以被其他無人車初創(chuàng)公司復(fù)制嗎?
毫末智行,能被復(fù)制嗎?
自動駕駛創(chuàng)業(yè),毫末是最特殊的一個。
成果、技術(shù)給行業(yè)什么樣的啟示?至少能總結(jié)出三個方法論。首先是大船放小船。
你可以說毫末智行是長城汽車旗下,但它卻不屬于長城汽車上市集團。
長城入股但不直接管理,讓毫末智行以科技公司的效率和靈活性運營,不受大集團業(yè)務(wù)流程所累,激發(fā)創(chuàng)造力。
同時,長城汽車又保持了一個車圈老大哥的“大度”,允許毫末智行公開融資、IPO,團隊的積極性也有了充分保障。
第二是長城汽車給毫末智行提供規(guī)模量產(chǎn)的渠道,這種“kick start”也是毫末智行進度驚人的基礎(chǔ)。
更出乎意料的是,長城汽車沒有把毫末智行的產(chǎn)品指定成“專供”,反而鼓勵毫末團隊去市場擴展其他的主機廠客戶。
毫末智行董事長張凱在AI Day上介紹了毫末的開放合作原則:合作方可以選擇采用全棧技術(shù)解決方案,可以選擇在數(shù)據(jù)智能云端服務(wù)層面與我們合作,也可以選擇軟件或硬件層面,或者功能模塊層面的合作;甚至可以選擇和我們進行源代碼級別的定制。
從全棧解決方案到源代碼,這6個產(chǎn)品層面毫末智行都可以開放合作。
這也讓毫末未來的業(yè)務(wù)規(guī)模和技術(shù)迭代有了更大的空間。
最后一點,也是最重要的,是毫末智行本身的數(shù)據(jù)閉環(huán)能力。
海量數(shù)據(jù)涌進系統(tǒng),數(shù)據(jù)的存儲、傳輸,以及數(shù)據(jù)處理的人工、時間其實都是成本,毫末智行的數(shù)據(jù)智能體系,針對每個可能的成本產(chǎn)生環(huán)節(jié),都有專門的優(yōu)化機制。
很難相信這是不到3年時內(nèi)摸著石頭過河探索出來的,更像是一開始就規(guī)劃好的布局。
與車廠的緊密聯(lián)系、數(shù)據(jù)閉環(huán)能力、大規(guī)模上量的渠道…這些是毫末智行模式最基礎(chǔ)的3個方法論。
自動駕駛創(chuàng)業(yè)公司能不能復(fù)制?
當然可以。
與車廠建立緊密聯(lián)系不難,事實上幾乎所有老牌車企都迫切轉(zhuǎn)型,有團隊有技術(shù)的無人車公司不乏青睞。
所以量產(chǎn)渠道這個問題至少表面上看不難解決。
但深度綁定之后自身的前景和潛力會不會被限制?小船到最后會不會成大船的一塊“木板”?
畢竟像長城汽車這樣開放的車企不多,更多主機廠傾向于緊緊攥住自己的“靈魂”不撒手。
更關(guān)鍵的是,硬核實力夠不夠,能不能像毫末一樣建立起一套高度自動化的低成本數(shù)據(jù)智能技術(shù)體系?
這一點,可能唯有實現(xiàn)那一刻才算證明。
所以,毫末智行確實給自動駕駛創(chuàng)業(yè)提供了另一種可以踐行模式。
其他無人車創(chuàng)業(yè)公司可以照搬,只是要做到毫末智行的程度,實力、機遇缺一不可。