賈浩楠 發(fā)自 副駕寺,智能車參考 | 公眾號(hào) AI4Auto
大家有沒有發(fā)現(xiàn),這幾個(gè)月所有主機(jī)廠、自動(dòng)駕駛公司做技術(shù)宣傳時(shí),不約而同提到一個(gè)新名詞:OCC,或者說占用網(wǎng)絡(luò)。
這是深度學(xué)習(xí)算法領(lǐng)域在自動(dòng)駕駛的新應(yīng)用,2023年10月,極越汽車首次在國(guó)內(nèi)將OCC引入量產(chǎn)車。
而這項(xiàng)技術(shù),也被認(rèn)為是自動(dòng)駕駛純視覺路線的一個(gè)重大進(jìn)展,被解讀為“替代激光雷達(dá)”的最強(qiáng)殺手锏。
于是如今,不管理解沒理解,上車沒上車,搞自動(dòng)駕駛的言必稱占用網(wǎng)絡(luò)。
而率先引入這個(gè)概念的極越汽車,剛剛把應(yīng)用OCC的智駕方案推送給用戶,成為國(guó)內(nèi)首個(gè)。
各家都在吹的OCC,極越已經(jīng)上車了
2月23日,極越正式向全量用戶OTA推送V1.3.1版本軟件。
這其中最種亮點(diǎn)最大的,就是的OCC占用網(wǎng)絡(luò)正式“上車”。極越也成為國(guó)內(nèi)首個(gè)全量推送OCC占用網(wǎng)絡(luò)的車企。
之前,極越還有一個(gè)第一,就是國(guó)內(nèi)首個(gè)實(shí)現(xiàn)“純視覺”技術(shù)方案量產(chǎn)的玩家,也是國(guó)內(nèi)第一個(gè)明確走純視覺智能駕駛方案的車企。
還秀出了上海核心城區(qū)高峰期一鏡到底不接管的實(shí)測(cè):
CEO夏一平,也在不久前親自上路直播展示了純視覺“點(diǎn)到點(diǎn)”的量產(chǎn)高階智駕能力:
這次的OCC上車,也是極越在純視覺技術(shù)路線上的一個(gè)超級(jí)重要的進(jìn)展。
最具變革意義的是感知識(shí)別能力的提升,能夠?qū)φ系K物進(jìn)行3D精細(xì)刻畫,模型精度可達(dá)厘米級(jí),比肩甚至超越激光雷達(dá)。
同時(shí),OCC占用網(wǎng)絡(luò)對(duì)于運(yùn)動(dòng)障礙物的速度識(shí)別精度能達(dá)到0.1米/秒誤差范圍。大幅提升了對(duì)于柵欄、護(hù)欄、水馬和施工隔離欄等有一定長(zhǎng)度的通用障礙物邊界的識(shí)別能力,有效進(jìn)行避讓、剎停等,留出更多安全行車距離。
OCC上車極越,對(duì)于用戶最直接的體驗(yàn)提升,是城市、高速NOA功能更安全:
什么是OCC?上車有什么用?
OCC即Occupancy Network(占用網(wǎng)絡(luò)),最早由特斯拉提出。
系統(tǒng)的主要感知識(shí)別數(shù)據(jù)仍然是視覺圖像,攝像頭采集的數(shù)據(jù)通過基于Transformer的BEV網(wǎng)絡(luò),應(yīng)用自注意力機(jī)制進(jìn)行特征提取,獲得當(dāng)前場(chǎng)景各個(gè)目標(biāo)的語義分割信息,并加入時(shí)序特征。
OCC的作用,是在傳統(tǒng)3D目標(biāo)識(shí)別能力之上,通過體素(Voxel)化的方式理解和處理空間信息。
可以簡(jiǎn)單理解為將場(chǎng)景空間分割成單位化的“方塊”,感知系統(tǒng)可以對(duì)3D空間的可通行區(qū)域進(jìn)行高保真度還原。不需要考慮物體是什么,只考慮當(dāng)下這個(gè)“方塊”是否被占用。
OCC除了替代激光雷達(dá)外,因?yàn)橄到y(tǒng)不需要識(shí)別出物體具體是什么,只需要知道自己是不是被阻擋了,所以也就不再像過去那樣依賴于訓(xùn)練集。
實(shí)際其實(shí)占用網(wǎng)絡(luò)上車的一個(gè)初衷,是替代激光雷達(dá)。OCC帶來的“輕雷達(dá)”甚至是“去雷達(dá)”趨勢(shì),可以使量產(chǎn)智駕系統(tǒng)的硬件成本降到極低,理論上能更快大規(guī)模普及。
視角再擴(kuò)大一些,智能駕駛的成熟,解放用戶更多負(fù)擔(dān),車上的自由時(shí)間和娛樂休閑辦公需求會(huì)爆發(fā),從而更加推動(dòng)智能座艙技術(shù)、生態(tài)的發(fā)展。
可以做一個(gè)大膽的語言:
如果智能汽車、自動(dòng)駕駛也存在“技術(shù)爆炸”的話,那么BEV、Transformer就是一直積蓄的能量,OCC可能就是引燃的“火種”。
極越走在了行業(yè)最前端,同時(shí)揭示了2024智能汽車內(nèi)卷方向和主題。
智能車今年卷什么?
當(dāng)然,OCC只是一個(gè)算法模塊,屬于極越“B.O.T三向箔”智駕技術(shù)體系的一部分。
B.O.T的意思是“BEV+OCC+Transformer”。這其中,Transformer是深度學(xué)習(xí)算法的基礎(chǔ)架構(gòu)模型,尤其擅長(zhǎng)處理自動(dòng)駕駛連續(xù)圖像數(shù)據(jù)這樣的超大規(guī)模數(shù)據(jù)。
BEV也是一種數(shù)據(jù)處理算法,即在前端就利用環(huán)視攝像頭的數(shù)據(jù)連續(xù)生成車輛周圍360°的鳥瞰視角圖。
BEV圖像數(shù)據(jù)是帶有3D位置關(guān)系和時(shí)序因果關(guān)系的,這就從本質(zhì)上改變了以往利用單幀圖像數(shù)據(jù)做訓(xùn)練和感知的自動(dòng)駕駛技術(shù)。
Transformer和BEV,最早由特斯拉提出,去年逐漸被國(guó)內(nèi)玩家完全理解吸收,并且成為席卷自動(dòng)駕駛業(yè)界、重構(gòu)技術(shù)體系的浪潮。
比如華為ADS,從1.0的馬馬虎虎到2.0的“遙遙領(lǐng)先”,其實(shí)背后就是用BEV+Transformer重構(gòu)了所有代碼。
毫無疑問,OCC是在Transformer和BEV之外,今年自動(dòng)駕駛、智能汽車內(nèi)卷的一個(gè)重要方向。
其他還有什么?
極越CEO夏一平和百度IDG技術(shù)委員會(huì)主席王亮給出了最新判斷。
首先是最近爆火的SORA,文生視頻的能力震撼所有人,是大模型威力從NLP向CV領(lǐng)域快速延伸的里程碑。
而作為CV領(lǐng)域應(yīng)用最成熟、市場(chǎng)最廣闊的自動(dòng)駕駛/智能汽車,自然要問:SORA會(huì)帶來什么樣的影響?
王亮認(rèn)為,SORA本質(zhì)是transformer機(jī)器學(xué)習(xí)的工具加上diffusion的技術(shù)。對(duì)自動(dòng)駕駛的顛覆,可能是從預(yù)測(cè)的角度。
自動(dòng)駕駛系統(tǒng)感知環(huán)境并構(gòu)建,其實(shí)決策規(guī)劃不是建立在當(dāng)下,而是對(duì)未來預(yù)判,可能是3秒可能是8秒。對(duì)未來預(yù)判越準(zhǔn),做的規(guī)劃就越合理。
SORA可以比較好預(yù)測(cè)未來60秒可能發(fā)生的事情。如果用SORA生成式技術(shù),那么對(duì)未來的預(yù)測(cè),包括決策規(guī)劃的影響會(huì)很巨大。
第三個(gè)重要趨勢(shì),或者說是自動(dòng)駕駛內(nèi)卷方向,是預(yù)訓(xùn)練模型。
自動(dòng)駕駛的很多任務(wù),檢測(cè)紅綠燈,檢測(cè)車道線,可分為兩個(gè)部分,backbone(提取特征),以及HED(解決具體任務(wù))。
backbone很重要,但算力是有限的,且每個(gè)backbone能分配到的算力是平均的。
所以對(duì)感知來說需要有更強(qiáng)的視覺底座基礎(chǔ)模型,放到車上合并小模型,讓算力加大,從這個(gè)平臺(tái)上分出多個(gè)任務(wù),讓每個(gè)任務(wù)解決的更好。
總結(jié)一下,極越或者說背后的百度Apollo,對(duì)于自動(dòng)駕駛技術(shù)段內(nèi)卷做出了預(yù)判。
首先是量產(chǎn)上車的層面,OCC成必爭(zhēng)之地,因?yàn)樗情_啟智駕技術(shù)、體驗(yàn)爆炸的鑰匙。
研發(fā)端的基礎(chǔ)設(shè)施——預(yù)訓(xùn)練模型,成為一個(gè)玩家在這樣的內(nèi)卷中能不能持續(xù)發(fā)力的關(guān)鍵。
而對(duì)于可能潛在的顛覆性SORA大模型,對(duì)自動(dòng)駕駛的意義可能最先在“預(yù)測(cè)”這個(gè)模塊生效。
極越為什么能成?
百度是極越汽車背后的兩大“支柱”之一,這不是什么秘密。另一個(gè)是自主龍頭之一,也是目前國(guó)內(nèi)最大的汽車集團(tuán)吉利。
從極越新年首次OTA的內(nèi)容中,就能看出極越為何能把智能汽車做到如此極致。
智駕方面,百度自動(dòng)駕駛業(yè)務(wù)Apollo全力支持極越,IDG技術(shù)委員會(huì)主席王亮的團(tuán)隊(duì),不光把最強(qiáng)技術(shù)給了極越,還幾乎做到了兩個(gè)團(tuán)隊(duì)“同吃同住同勞動(dòng)”的高效率協(xié)作。
資源上,百度云業(yè)務(wù)給了極越自動(dòng)駕駛開發(fā)的啟動(dòng)算力1.8-2.2Eflops,上不封頂(特斯拉dojo發(fā)布時(shí)候的啟動(dòng)算力1.1Eflops)。
另外智艙的文心一言大模型、百度地圖都給了極越100%支持。
極越的城市高階智駕功能,也馬上能做到“全國(guó)都能開”。背后是百度地圖革命性的升級(jí)。按照夏一平的說法,未來只要百度地圖能覆蓋的地方,極越PPA都能開。
當(dāng)然還有吉利,現(xiàn)在也有跡象顯示出加大對(duì)極越的支持。
除了極越本身采用吉利浩瀚架構(gòu)造車,在補(bǔ)能和用戶體驗(yàn)上,現(xiàn)在也直接無縫對(duì)接吉利的資源。
比如今年3月,極越將打通共享極氪所有自建超充站,全國(guó)900多座,而且是800V。這會(huì)給極越所用用戶帶來出行體驗(yàn)的質(zhì)變。
智能汽車創(chuàng)業(yè),或者是車企智能化轉(zhuǎn)型,極越也走出一條獨(dú)特的公式:
必須有AI科技基因、能快速適應(yīng)GPT,Sora等潮流,有自研、獨(dú)立開發(fā)能力;然后是汽車公司從制造方式創(chuàng)新,材料創(chuàng)新,平臺(tái)創(chuàng)新等一樣有不斷突破能力。
兩者加起來的車企,能脫穎而出。
極越就是這樣“AI頭部+創(chuàng)新型汽車集團(tuán)支持”的企業(yè)。一直以來,定位都是最強(qiáng)AI技術(shù)(百度Apollo、文心一言),落在最強(qiáng)電動(dòng)車平臺(tái)(吉利浩瀚SEA)。
現(xiàn)在極越展現(xiàn)出的趨勢(shì),是技術(shù)越來越領(lǐng)先,體驗(yàn)越來越靠譜。極越背后百度和吉利的支持,也越來越藏不住了。
而且這樣的支持,還有一個(gè)想象空間更大的觀察角度:
路特斯代表了吉利豪華品牌特性,極氪代表了吉利性能特性,而極越就是智能天花板特性的代表。
路特斯和極氪,相繼都實(shí)現(xiàn)了戰(zhàn)略目標(biāo),開始IPO進(jìn)程,路特斯已經(jīng)成了,極氪馬上。
已經(jīng)實(shí)現(xiàn)智能戰(zhàn)略目標(biāo)的極越,或許也快了…