誰真正走通了“端到端”,誰就有可能在智駕終局拿到勝利的入場券。
“要對城市NOA有客觀的認(rèn)識(shí)?!?/p>
這是汽車百人會(huì)論壇上,地平線創(chuàng)始人兼CEO余凱的表態(tài),同時(shí)也是業(yè)界諸多智駕工作者的心聲。
大家普遍認(rèn)為,當(dāng)前市面上的高速NOA剛好達(dá)到“好用”,還未讓消費(fèi)者“愛用”,城區(qū)NOA的現(xiàn)狀,恐怕連“可用”都是一個(gè)問題。
由此可見,高階智駕的赤膊戰(zhàn)還有“終局”未分勝負(fù)。賽道玩家現(xiàn)階段關(guān)注的,是解決“可用和“愛用”的問題,接著再解決“好用”的難題。標(biāo)準(zhǔn)場景的通過率、體驗(yàn)更擬人、通行效率更高,成了所有企業(yè)重點(diǎn)加碼的智駕“痛點(diǎn)”。
從本屆北京車展來看,智駕公司與車企強(qiáng)調(diào)的技術(shù)熱點(diǎn),已經(jīng)從去年的BEV+Transformer切換到“端到端”。從車展媒體日的發(fā)布會(huì)可以看出,大部分高管提及智駕業(yè)務(wù),都會(huì)提一嘴“端到端”的戰(zhàn)略部署——
未來幾年,似乎誰真正走通了“端到端”,誰就有可能在智駕終局拿到勝利的入場券。
不過,從“端到端”鼻祖特斯拉來看,基于該公司的投資強(qiáng)度,端到端大模型其實(shí)非常燒錢,可能得百億起步。
毫末智行數(shù)據(jù)智能科學(xué)家賀翔曾在采訪中提到,端到端模型是一個(gè)純粹的數(shù)據(jù)系統(tǒng),原則上模型參數(shù)夠大,數(shù)據(jù)分布性更好,就能不斷地提高。燒錢,且費(fèi)時(shí)間,但天花板也很高。
01、高階智駕爭奇斗艷
北京車展前夕,華為發(fā)布了以智駕為核心的“乾崑”新品牌。其中,高階智能駕駛乾崑ADS 3.0采用了端到端的全新架構(gòu),基于GOD(通用障礙物識(shí)別)大網(wǎng),實(shí)現(xiàn)了從簡單“識(shí)別障礙物”到深度“理解駕駛場景”的進(jìn)步。
乾崑ADS 3.0全新架構(gòu)采用PDP(預(yù)測決策規(guī)控)網(wǎng)絡(luò)實(shí)現(xiàn)預(yù)決策和規(guī)劃一張網(wǎng),從而實(shí)現(xiàn)類人化的決策和規(guī)劃,行駛軌跡更類人,通行效率更高,復(fù)雜路口通過率>96%。
小鵬
小鵬汽車的智駕一直處于國內(nèi)第一梯隊(duì),據(jù)悉,基于端到端大模型,小車的XNGP高階智能駕駛輔助系統(tǒng),將完成感知大模型升級(jí)和規(guī)控大模型上車。
何小鵬表示,目前小鵬汽車已開始公測端到端的解決方案,并將在5月正式對外分享端到端實(shí)際數(shù)據(jù)表現(xiàn)。通過行業(yè)首個(gè)量產(chǎn)的2K純視覺占用網(wǎng)絡(luò)大模型上車,用超過200萬個(gè)高精度網(wǎng)格重構(gòu)世界,能清晰識(shí)別動(dòng)、靜態(tài)障礙物的每一個(gè)細(xì)節(jié)。
商湯絕影
作為首個(gè)提出感知決策一體化自動(dòng)駕駛通用模型的公司,商湯絕影在本屆車展首次向公眾展示了面向量產(chǎn)的端到端自動(dòng)駕駛解決方案UniAD(Unified Autonomous Driving)的道路測試。
該方案能在無高精地圖條件下,僅依靠視覺感知的實(shí)際道路測試成果。無論是復(fù)雜城市道路還是無中線的鄉(xiāng)村道路上,車輛能高效準(zhǔn)確地完成包括大角度左轉(zhuǎn)上橋、避讓占道車輛及施工區(qū)域、繞行跑步行人等一系列高難度操作。
雖然沒有強(qiáng)調(diào)端到端的布局,但傳統(tǒng)供應(yīng)鏈巨頭博世,成為傳Tier1在高階智駕的一抹亮色。博世在此次車展帶來的智駕技術(shù)和產(chǎn)品,呈現(xiàn)出跨越式的飛躍。
旗下最新的艙駕一體解決方案,只用一顆芯片就能搞定智駕和智艙,有望在2026年量產(chǎn),對比當(dāng)前智艙、智駕雙芯片的解決方案,可降本30%。
博世中國高階智能駕駛解決方案,由博世智能駕駛與控制系統(tǒng)事業(yè)部中國區(qū)本土開發(fā),已于2023年實(shí)現(xiàn)量產(chǎn)。其中,城市領(lǐng)航輔助功能將從5月開始逐步推送。
地平線
地平線展出了全場景智能駕駛解決方案SuperDrive,這是該公司打造的高階城區(qū)智駕樣板間。如果說,征程6是地平線軟硬結(jié)合領(lǐng)域的硬件集大成,SuperDrive則是軟件層面的護(hù)城河。
憑借動(dòng)態(tài)、靜態(tài)、OCC(Occupancy占用網(wǎng)絡(luò))三網(wǎng)合一的端到端感知架構(gòu),數(shù)據(jù)驅(qū)動(dòng)的交互式博弈算法,SuperDrive在任何道路環(huán)境下都能兼顧場景通過率、通行效率和行為擬人。
據(jù)悉,SuperDrive可以像老司機(jī)一樣靈活處理復(fù)雜交通流,在擁堵場景下變道成功率提升50%,路口通過率提升67%。
02、新的燒錢巨坑
2022年底,商湯及其聯(lián)合實(shí)驗(yàn)室提出了行業(yè)首個(gè)感知決策一體化自動(dòng)駕駛通用模型UniAD,并于次年榮獲2023年國際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(CVPR)最佳論文。
如果說,商湯2022年還無法讓業(yè)界感受到端到端的潛在價(jià)值,那么到2023年,這家企業(yè)榮獲的論文大獎(jiǎng),終于讓學(xué)術(shù)圈和汽車行業(yè)意識(shí)到端到端在自動(dòng)駕駛賽道的廣闊前景。
在實(shí)踐層面,特斯拉曾在去年嘗試了特斯拉FSD V12的直播測試,讓更多企業(yè)看到端到端的落地可能性;今年3月向北美車主推送了FSDV12.3.1版本,引入了端到端神經(jīng)網(wǎng)絡(luò),瞬時(shí)掀起業(yè)界的極大波瀾。
很多人默認(rèn),特斯拉是端到端的鼻祖。也正因?yàn)榇?,特斯拉也成了業(yè)界抽絲剝繭、詳細(xì)了解端到端的先鋒案例。此前有咨詢公司分析,參考特斯拉這幾年的投資強(qiáng)度,端到端大模型其實(shí)非常燒錢,可能得百億起步。
前文也提到,毫末智行數(shù)據(jù)智能科學(xué)家賀翔曾在采訪中提到,端到端模型是一個(gè)純粹的數(shù)據(jù)系統(tǒng),原則上模型參數(shù)夠大,數(shù)據(jù)分布性更好,就能不斷地提高——
天花板很高,但燒錢,且費(fèi)時(shí)間。
此外,端到端模型的訓(xùn)練非常依賴且消耗算力,僅僅是2024年,特斯拉計(jì)劃向Dojo超算投入的資金就要超10億美元。
2023年初,特斯拉曾表示,該公司已經(jīng)分析了從特斯拉客戶的汽車中收集的1000 萬個(gè)視頻片段(clips)。且特斯拉判斷,完成一個(gè)端到端自動(dòng)駕駛的訓(xùn)練至少需要100萬個(gè)、分布多樣、高質(zhì)量的clips才能正常工作。
不僅是燒錢巨坑,端到端還是個(gè)長期工程,很多企業(yè)在短期內(nèi)是很難看到結(jié)果的。這也意味著,端到端是少數(shù)企業(yè)的游戲,只有資金儲(chǔ)備充足、且愿意長期投資的頭部公司,才有能力支持端到端所需的龐大數(shù)據(jù)與算力。
商湯在此次車展表示,行業(yè)里很多企業(yè)在布局端到端解決方案,但一般都分為三種——
第一,是決策層和感知層彼此獨(dú)立的云端計(jì)算工程;第二,是組合式端到端,意味著連接感知層和決策層需要強(qiáng)力中介,也更容易落地;第三即真正的端到端,也就是商湯目前開發(fā)出的方案,能夠讓企業(yè)以最低成本滿足智駕需要。
不過,這套蓄力已久的端到端方案,累計(jì)投入了多少資金,商湯絕影并沒有提及。
作者丨北? ??岸
責(zé)編丨崔力文
編輯丨別? ? 致