/?導(dǎo)讀?/
作為全球資本市場(chǎng)的風(fēng)口,自動(dòng)駕駛從來(lái)都不曾離開(kāi)舞臺(tái)的中央。
自動(dòng)駕駛主要包括感知、決策和執(zhí)行三個(gè)環(huán)節(jié)。其中,周邊態(tài)勢(shì)的感知,作為自動(dòng)駕駛控制系統(tǒng)的輸入,重要性不言而喻。更早以及更加精準(zhǔn)的信息輸入,將幫助自動(dòng)駕駛控制器盡快做出一個(gè)準(zhǔn)確的決策,調(diào)整車輛姿態(tài)來(lái)實(shí)現(xiàn)自動(dòng)駕駛功能。
但在汽車自動(dòng)駕駛領(lǐng)域,周邊態(tài)勢(shì)感知的技術(shù)路線選擇之爭(zhēng)從來(lái)就沒(méi)有停歇過(guò)。以特斯拉為最知名的代表是純視覺(jué)方案的堅(jiān)定擁護(hù)者,至于國(guó)內(nèi)很多企業(yè)則是視覺(jué)加雷達(dá)融合方案的擁躉。在線控底盤(pán)方案已經(jīng)非常成熟且自動(dòng)駕駛軟件平臺(tái)日趨完善的大背景下,對(duì)于周邊態(tài)勢(shì)的感知正在成為自動(dòng)駕駛領(lǐng)域中的一個(gè)受到越來(lái)越多關(guān)注的分支。
得到全球公認(rèn)的NuScenes數(shù)據(jù)集
NuScenes數(shù)據(jù)集是由現(xiàn)代汽車集團(tuán)和Aptiv資成立的一家無(wú)人駕駛公司Motional開(kāi)發(fā),該數(shù)據(jù)集在2019年3月開(kāi)源,填補(bǔ)了彼時(shí)自動(dòng)駕駛汽車行業(yè)尚無(wú)大規(guī)模多模態(tài)數(shù)據(jù)集的空白。目前,NuScenes是被全球各大自動(dòng)駕駛領(lǐng)域相關(guān)公司引用最多的數(shù)據(jù)集,其權(quán)威性得到各方的認(rèn)同。
基于NuScenes數(shù)據(jù)集的NuScenes挑戰(zhàn)賽,也已經(jīng)成為檢驗(yàn)感知算法在自動(dòng)駕駛相關(guān)任務(wù)性能的試金石。我們所熟知的全球范圍內(nèi)多家自動(dòng)駕駛領(lǐng)域的知名企業(yè)及知名高校在NuScenes挑戰(zhàn)賽中進(jìn)行了相關(guān)測(cè)試結(jié)果的提交,諸如卡內(nèi)基梅隆大學(xué)、加利福尼亞大學(xué)伯克利分校、MIT等。作為自動(dòng)駕駛AI感知算法的一個(gè)重要的比拼舞臺(tái),大家通過(guò)NuScenes挑戰(zhàn)賽這樣一個(gè)“試金石”平臺(tái),同場(chǎng)競(jìng)技,來(lái)了解自己所處的位置以及競(jìng)爭(zhēng)對(duì)手的狀態(tài),進(jìn)而達(dá)到共同促進(jìn)自動(dòng)駕駛感知技術(shù)發(fā)展的目標(biāo)。
3D目標(biāo)檢測(cè)任務(wù)是自動(dòng)駕駛感知性能的關(guān)鍵指標(biāo)
在NuScenes數(shù)據(jù)集中,相關(guān)評(píng)測(cè)任務(wù)包括了3D 目標(biāo)檢測(cè)、3D 目標(biāo)跟蹤、預(yù)測(cè)軌跡 、激光雷達(dá)分割、全景分割和跟蹤。其中, 3D目標(biāo)檢測(cè)任務(wù)是最為重要的一個(gè)評(píng)測(cè)指標(biāo)。
和普通的對(duì)于周邊物體感知不同,自動(dòng)駕駛所面臨的是一個(gè)包含時(shí)間軸在內(nèi)的4維坐標(biāo)空間。所以自動(dòng)駕駛感知系統(tǒng)不僅需要判斷周邊物體的遠(yuǎn)近和大小,同時(shí)也還需要判斷這些物體是靜止的還是運(yùn)動(dòng)的,以及他們的運(yùn)動(dòng)方向和速度。這對(duì)于自動(dòng)駕駛軟件算法進(jìn)行下一步路徑的預(yù)判至關(guān)重要。
NuScenes數(shù)據(jù)集的3D目標(biāo)檢測(cè)任務(wù),覆蓋了包括汽車、卡車、公交車、行人等10種我們?cè)谌粘3鲂兄袝?huì)遇到的絕大部分檢測(cè)對(duì)象。通過(guò)為它們標(biāo)出3D目標(biāo)框,并估計(jì)出相應(yīng)類別的屬性信息和當(dāng)前的速度信息等,NuScenes提出了一個(gè)綜合指標(biāo)NDS (NuScenes Detection Score, NDS)。這個(gè)指標(biāo)由平均精度(mAP)、平均平移誤差(ATE)、平均尺度誤差(ASE)、平均方向誤差(AOE)、平均速度誤差(AVE)和平均屬性誤差(AAE)綜合計(jì)算得到,成為衡量自動(dòng)駕駛對(duì)于周邊物體識(shí)別的一個(gè)比較客觀公正的評(píng)價(jià)指標(biāo)。
純視覺(jué)方案的優(yōu)勢(shì)在哪里?
在自動(dòng)駕駛系統(tǒng)中,感知系統(tǒng)的硬件是由一系列的傳感器組成,主要包括攝像頭、超聲波雷達(dá)、毫米波雷達(dá)和激光雷達(dá)等。它們作為自動(dòng)駕駛系統(tǒng)的“眼睛”,構(gòu)成了整個(gè)自動(dòng)駕駛系統(tǒng)的輸入,其中最核心的就是攝像頭和激光雷達(dá)。
當(dāng)前,在自動(dòng)駕駛領(lǐng)域,感知系統(tǒng)的技術(shù)路線選擇的爭(zhēng)議從來(lái)沒(méi)有平息過(guò)。作為全球知名的車企,特斯拉一直是純視覺(jué)方案堅(jiān)定的支持者。而國(guó)內(nèi)不少整車企業(yè),目前都采用了采用雷達(dá)加攝像頭的融合方案來(lái)實(shí)現(xiàn)3D目標(biāo)任務(wù)檢測(cè)。
兩種技術(shù)路線各有優(yōu)劣:
視覺(jué)+雷達(dá)方案的最大優(yōu)勢(shì)來(lái)源于激光雷達(dá)。激光雷達(dá)采集的點(diǎn)云信息與生俱來(lái)就存儲(chǔ)了三維空間信息,因此基于激光點(diǎn)云信息的3D目標(biāo)檢測(cè)任務(wù)實(shí)現(xiàn)出來(lái)相對(duì)就簡(jiǎn)單了許多。但是這套方案也有自己比較明顯的劣勢(shì):
1.較高的成本:激光雷達(dá)較高的成本,始終是阻礙其在車型上商業(yè)化部署的最大制約因素。最早的Velodyne的激光雷達(dá)高達(dá)8萬(wàn)美元一個(gè),讓其始終停留在測(cè)試車上。而如今雖然固態(tài)激光雷達(dá)成本大幅下降,但依然是整車不可忽視的一個(gè)零部件成本支出。
2.數(shù)據(jù)融合難度不小:攝像頭和雷達(dá)的數(shù)據(jù)結(jié)構(gòu)并不相同,將兩者采集的數(shù)據(jù)進(jìn)行融合,給到自動(dòng)駕駛控制器最為準(zhǔn)確的黃靜信號(hào)輸入,對(duì)數(shù)據(jù)融合算法也是不小的考驗(yàn)。
至于純視覺(jué)解決方案,其最大的優(yōu)勢(shì)在于較低的成本。特斯拉所使用的單目攝像頭單件成本不過(guò)25美元,全車搭載8個(gè)的話,費(fèi)用也只有200美元。對(duì)于需要大規(guī)模商業(yè)化部署的整車,成本從來(lái)就不是一個(gè)可以忽略的難題。過(guò)高的成本,必然會(huì)阻礙消費(fèi)者的購(gòu)買意愿,讓相關(guān)的技術(shù)方案只能停留在實(shí)驗(yàn)室階段。另外,純視覺(jué)解決方案依托技術(shù)可帶來(lái)比較客觀的迭代提升及較大的上升空間。隨著AI技術(shù)的提升,純視覺(jué)3D目標(biāo)檢測(cè)算法能夠得以優(yōu)化提升。
但視覺(jué)方案也有自己的不足,這個(gè)來(lái)源于攝像頭自身的缺陷:無(wú)論是對(duì)于靜態(tài)的物體還是對(duì)于識(shí)別紋理或者色彩信息較為豐富的物體時(shí),都會(huì)顯得力不從心。但攝像頭的天生缺陷也可以用來(lái)彌補(bǔ)。通過(guò)更為強(qiáng)大的AI算法以及更多的實(shí)際道路場(chǎng)景數(shù)據(jù)的積累,能夠幫助純視覺(jué)方案在辨識(shí)周邊道路情況時(shí)能夠更加游刃有余。所以當(dāng)AI算法達(dá)到一定的成熟度可以滿足自動(dòng)駕駛對(duì)于周邊環(huán)境態(tài)勢(shì)感知的要求之后,純視覺(jué)方案就可以被部署在高等級(jí)自動(dòng)駕駛系統(tǒng)上,來(lái)為整車企業(yè)提供一個(gè)可以同時(shí)兼顧商業(yè)化部署和周邊態(tài)勢(shì)感知要求的技術(shù)方案。
浪潮信息AI算法實(shí)現(xiàn)監(jiān)測(cè)精度大幅度提升
今年10月,在最新一期NuScenes所公布的競(jìng)賽測(cè)評(píng)榜單中,浪潮信息憑借DABNeT4D登頂自動(dòng)駕駛數(shù)據(jù)集NuScenes 純視覺(jué)3D目標(biāo)檢測(cè)任務(wù)榜單,引發(fā)了極大的關(guān)注。
在這次3D目標(biāo)檢測(cè)任務(wù)中,浪潮信息的DABNet4D算法的NDS檢測(cè)精度達(dá)到了0.624,相比于年初的NDS精度是0.474的BEV3D算法提升了15%。在同一時(shí)期,激光雷達(dá)的NDS精度從年初的0.685提升到0.728,提升約4個(gè)點(diǎn)。通過(guò)簡(jiǎn)單的數(shù)據(jù)比對(duì)就可以發(fā)現(xiàn),浪潮信息AI的純視覺(jué)檢測(cè)精度在數(shù)值上正在大幅迫近激光雷達(dá),而這背后都是AI算法的功勞。
浪潮信息此次所提交的算法DABNet4D是Depth-awared BEVNet 4D的縮寫(xiě),即深度感知的四維鳥(niǎo)瞰圖(bird’s eye view, BEV)神經(jīng)網(wǎng)絡(luò),其核心本質(zhì)就是鳥(niǎo)瞰圖。
傳統(tǒng)的純視覺(jué)方案,是依靠布置在車身的攝像頭來(lái)采集信息。然后通過(guò)對(duì)于每個(gè)攝像頭數(shù)據(jù)的融合,來(lái)實(shí)現(xiàn)對(duì)車輛周邊態(tài)勢(shì)的感知。但這種策略最大的一個(gè)弊端在于一旦遇到比較體積較大的卡車時(shí),會(huì)導(dǎo)致每個(gè)攝像頭只能捕捉到卡車的一部分的情況,以致出現(xiàn)錯(cuò)判和漏檢的情況發(fā)生。這種情況下,浪潮信息AI團(tuán)隊(duì)引入了鳥(niǎo)瞰圖,即通過(guò)上帝視角,來(lái)把不同水平視角的圖像融合成一個(gè)統(tǒng)一的以自動(dòng)駕駛車輛為中心的俯視視角的特征圖。這樣就可以最清晰和完整地為自動(dòng)駕駛控制器提供車輛周邊的情況。在遇到體積較大的物體時(shí),3D目標(biāo)檢測(cè)以及其他的檢測(cè)、分類、分割等視覺(jué)感知任務(wù)就能夠非常輕松地完成。
但要獲得上帝視角的鳥(niǎo)瞰圖的構(gòu)建并非一蹴而就。浪潮信息AI團(tuán)隊(duì)早在今年年初就構(gòu)建了一個(gè)基于Transformer架構(gòu)的多視角特征融合模型CBTR、MASTER(Multi-camerA Spatial and Temporal feature ExtractoR,多相機(jī)時(shí)空特征提取器)算法、并在MASTER算法的基礎(chǔ)上進(jìn)一步引入了深度估計(jì)網(wǎng)絡(luò)等等,最終實(shí)現(xiàn)了更為高效穩(wěn)定的BEV(鳥(niǎo)瞰圖)輸出。此外,通過(guò)圖像數(shù)據(jù)增強(qiáng)、BEV特征增強(qiáng)和樣本貼圖增強(qiáng)等多尺度的數(shù)據(jù)增強(qiáng)技術(shù)等,提升模型的檢測(cè)效果,進(jìn)而持續(xù)助力DABNet4D算法在NuScenes數(shù)據(jù)集中的優(yōu)異表現(xiàn)。
總結(jié)
浪潮此次打榜成功的DABNet4D算法,讓我們看到了感知層的另一個(gè)解決思路方案:通過(guò)對(duì)于態(tài)勢(shì)感知算法的持續(xù)優(yōu)化,來(lái)不斷提升純視覺(jué)方案的辨識(shí)精度,為純視覺(jué)方案在自動(dòng)駕駛領(lǐng)域的部署蹚出了一條新的道路。
在滾滾向前的自動(dòng)駕駛浪潮中,作為全球領(lǐng)先級(jí)AI算力基礎(chǔ)設(shè)施提供商,浪潮不僅在于利用自己過(guò)往在服務(wù)器這樣的硬件領(lǐng)域的優(yōu)勢(shì),持續(xù)強(qiáng)化自己硬件平臺(tái)協(xié)同優(yōu)勢(shì),同時(shí)也正在大力提升自己在AI算法方面的競(jìng)爭(zhēng)力,通過(guò)算法優(yōu)化來(lái)提升相關(guān)的效率,雙向賦能,提升橫跨軟硬件的集群優(yōu)勢(shì)。從NuScenes榜單技術(shù)的快速迭代來(lái)看,我們有理由相信,隨著算力、算法的持續(xù)型突破,自動(dòng)駕駛產(chǎn)業(yè)化落地進(jìn)程也將多一層“騰飛動(dòng)力之源”。而這些,也都是車企所關(guān)注的方向,也是未來(lái)車企發(fā)展智能駕駛能力的關(guān)鍵。