作者 | 朱世耘,編輯 | 章漣漪
“我們內(nèi)部一直有爭議:是有一點(diǎn)就拿出來一點(diǎn),還是做到爆款的水平之后再拿出來。因?yàn)橹馗兄?、輕地圖的方案是更難的?!?毫末智行董事長張凱表示。
如今,毫末終于亮出了自己的“爆款”產(chǎn)品,并將于今明兩年先后上車。
10月11日,毫末AI DAY上發(fā)布了三款第二代HPilot高階智駕預(yù)控產(chǎn)品:HP170、HP370、HP570價(jià)格分別在3000、5000和8000元,可實(shí)現(xiàn)高速無圖NOH、城市記憶行車+記憶泊車,城市全場景無圖NOH等功能。相比之下,如今已量產(chǎn)的同功能預(yù)控產(chǎn)品成本大多在5000-10000元,城市領(lǐng)航則在3萬元左右。
毫末此舉,意味著可適配車型價(jià)格從25-30萬元級及以上,下探到了20萬元以下,甚至更低。“價(jià)格打下來,性能打上去。讓中階智駕便宜更好用,讓高階智駕好用更便宜?!睆垊P表示。
01、物盡其用,把L2+的價(jià)格打下來
“第二代平臺(tái)主打性價(jià)比,對芯片和硬件的優(yōu)化壓榨,都做到了極致?!睆垊P向《賽博汽車》表示。
智駕市場的風(fēng)向正在發(fā)生根本性的改變。
2020年時(shí),以Mobileye為核心的ADAS供應(yīng)商L2級系統(tǒng)價(jià)格為250美元(約1700元,匯率按6.8計(jì)算)以上;L2+級為2380元;L2++級為2.04-2.72萬元。
但如今,中國車規(guī)級ADAS系統(tǒng)的供應(yīng)體系正變得“品類豐富、豐儉由人”。在《電動(dòng)汽車觀察家》2022年年底的調(diào)查中,已有定點(diǎn)的高速NOA+記憶泊車產(chǎn)品價(jià)格在3000-5000元不等,城市NOA等點(diǎn)到點(diǎn)的智駕域控系統(tǒng)價(jià)格在5000元以上。
單從價(jià)格來看,毫末第二代HPilot基本與行業(yè)定點(diǎn)情況持平。但從上車落地的實(shí)際情況來看,HP170、370和570確實(shí)將”物盡其用“推向了新的高度。
賽博汽車制圖
同樣是基于地平線征程3的產(chǎn)品,第三代榮威RX5(2022年6月上市)基于3顆征程3和26個(gè)傳感器(不含兩個(gè)駕駛員監(jiān)測傳感器),實(shí)現(xiàn)高速領(lǐng)航和全場景泊車功能;
今年3月問世的深藍(lán)SL03應(yīng)用雙征程3+27顆傳感器(含1個(gè)前視800萬像素攝像頭、1顆4D毫米波雷達(dá))的高配智駕方案,能夠?qū)崿F(xiàn)高速領(lǐng)航功能。標(biāo)配的單征程3方案,則僅支持L2級輔助駕駛功能;
將于2024年年初上車的毫末HP170基于單征程3+20個(gè)傳感器實(shí)現(xiàn)高速領(lǐng)航和泊車功能。
在中階方案上,德州儀器的TDA4-H還屬于新產(chǎn)品,目前大疆在五菱云朵上車的方案采用32TOPS+19顆傳感器(含1個(gè)慣導(dǎo)雙?攝像頭),實(shí)現(xiàn)高速領(lǐng)航和記憶泊車等功能,將高階智駕功能的上車價(jià)打到了15萬元以下。
將于2024年內(nèi)上車的毫末HP370在傳感器配置上更加豐富一些,32Tops+24顆傳感器,將功能從高速拓展到了城市中的記憶行車。
高階方案上,高通5nm制程的8255/8295作為智駕芯片上車的方案仍非常新,也非常少。奔馳剛發(fā)布的新一代E級車采用8295實(shí)現(xiàn)高速領(lǐng)航;零跑的方案中,8295+恩智浦S32G高配芯片實(shí)現(xiàn)L2+級智能駕駛輔助能力,將于2024年上車。
毫末HP570的方案則將功能上限從高速徹底拓展到了城市路況。對于高通的方案,張凱告訴《賽博汽車》,算力為360Tops的HP550方案將于首先搭載于魏牌藍(lán)山DHT-PHEV車型上,于明年一季度正式量產(chǎn)。HP570車型采用QC8650,算力72/100Tops將在藍(lán)山之后的改款車型上上車應(yīng)用。
至少從紙面對比來看,計(jì)劃于2024年先后落地的毫末第二代HPilot產(chǎn)品,將更低硬件需求、更高性能上限的智駕性價(jià)比競爭激烈度進(jìn)一步推高。
其中當(dāng)然有后發(fā)優(yōu)勢。張凱表示,近幾年快速的技術(shù)迭代和模型輕量化特征,使之前需要在大算力平臺(tái)上布置的算法得以在中平臺(tái)上布置。而大算力芯片的單位算力價(jià)格也在下行。
此外,毫末自身的工程化能力也是其拉低價(jià)格的重要原因。
三款產(chǎn)品,三個(gè)計(jì)算平臺(tái),意味著大量的模型遷移和適配工作,也使很多團(tuán)隊(duì)望而卻步。但毫末在HP1.0平臺(tái)的上車應(yīng)用過程中,積累了大量的工程化能力,使其能否完成這樣困難的工作。
《賽博汽車》了解到,今年上半年,除特斯拉的代工廠外,德賽西威、知行科技和毫末智行是量產(chǎn)量前三的智駕域控商。
”我們還是要做平臺(tái)的系列化,把系列化做好,以滿足高中低不同價(jià)位車型的需求?!皬垊P表示。
02、識(shí)別萬物,云端能力提上來
終端價(jià)格打下去的另一面,是云端的能力進(jìn)一步提升,以更加簡潔、高效的算法模型為終端降本服務(wù)。如特斯拉FSD V12版通過采用完全的神經(jīng)網(wǎng)絡(luò),端側(cè)系統(tǒng)減少了30萬行代碼,運(yùn)行速度快了10倍。
目前國內(nèi)尚未有明確的自動(dòng)駕駛端到端的模型范式,但此次AI DAY上,毫末向業(yè)內(nèi)展示了自動(dòng)駕駛生成式大模型DriveGPT雪湖·海若在云端實(shí)現(xiàn)端到端運(yùn)行的方式。
毫末發(fā)布的行業(yè)首個(gè)自動(dòng)駕駛生成式大模型DriveGPT在云端分為感知和認(rèn)知兩個(gè)大模型。
其中,感知大模型通過感知數(shù)據(jù)輸入,建立包含時(shí)序信息的4D向量空間后,引入開源的圖文多模態(tài)大模型,從而形成含有視覺圖像中語義信息的“5D”空間。
從而,將"前方有一個(gè)離地兩米,一米多長,靜止不動(dòng)的障礙物",翻譯為“綠色的柳條”,使自動(dòng)駕駛系統(tǒng)的識(shí)別能力從障礙物提升到萬物。
在認(rèn)知大模型中,基于5D的感知結(jié)果,DriveGPT通過構(gòu)建駕駛語言(Drive Language)來描述駕駛環(huán)境和駕駛意圖,再結(jié)合導(dǎo)航引導(dǎo)信息以及自車歷史動(dòng)作,并借助外部大語言模型LLM的海量知識(shí)來輔助給出駕駛決策。
例如將”綠色的柳條“這一文本解釋為”柔軟“,從而成為車輛可忽略該障礙物,正常通行的決策依據(jù)。
值得注意的是,雖然仍分為感知和認(rèn)知模塊,并且存在引入外部開源的多模態(tài)和大語言模型,而非一個(gè)完整的神經(jīng)網(wǎng)絡(luò)系統(tǒng)。但從數(shù)據(jù)的層面來看,由于引入外部大模型,從輸入到最后輸出決策策略的過程中,不再存在數(shù)據(jù)量消減的問題。
由此,模型獲得世界知識(shí),從而提升自動(dòng)駕駛策略的可解釋性和泛化性。
毫末智行數(shù)據(jù)智能科學(xué)家賀翔向《賽博汽車》表示:多模態(tài)和大語言模型將此前不宜存儲(chǔ)傳輸?shù)膱D片信息,提煉為文本信息組成隱式場,供感知和決策模型希望進(jìn)一步完善信息時(shí)調(diào)用查閱,由此保證了數(shù)據(jù)從輸出到輸出端的完整性。
截止2023年10月DriveGPT雪湖·海若共計(jì)篩選出超過100億幀互聯(lián)網(wǎng)圖片數(shù)據(jù)集和480萬段包含人駕行為的自動(dòng)駕駛4D Clips數(shù)據(jù)。
目前,DriveGPT還是在云上的大模型,但已在數(shù)據(jù)生產(chǎn)和端側(cè)模型訓(xùn)練上發(fā)揮作用。
毫末智行CEO顧維灝在演講中表示,DriveGPT的駕駛場景理解可以對海量駕駛場景數(shù)據(jù)進(jìn)行秒級特征搜索,從而實(shí)現(xiàn)更高效的數(shù)據(jù)篩選,為大模型挖掘海量高質(zhì)量訓(xùn)練數(shù)據(jù);駕駛場景標(biāo)注是采用了開集(Open-set)場景下的Zero-Shot自動(dòng)標(biāo)注,可實(shí)現(xiàn)對任意物體既快速又精準(zhǔn)的標(biāo)注,預(yù)標(biāo)注準(zhǔn)召達(dá)到80%以上。
此外,駕駛場景生成,可以基于駕駛場景的文生圖模型,通過文字描述批量生成平時(shí)難以獲取的Hardcase數(shù)據(jù),實(shí)現(xiàn)無中生有的可控生成;對于駕駛場景遷移,基于AIGC生成能力,可實(shí)現(xiàn)多目標(biāo)場景生成,能將采集到的一個(gè)場景,遷移到該場景的不同時(shí)間、不同天氣、不同光照等各類新場景下,可同時(shí)獲取全天候駕駛數(shù)據(jù),實(shí)現(xiàn)瞬息萬變的高效場景遷移。
車端模型開發(fā)模式變革方面,毫末正在嘗試用蒸餾的方法,也就是用大模型輸出的偽標(biāo)簽作為監(jiān)督信號,讓車端小模型來學(xué)習(xí)云端大模型的預(yù)測結(jié)果,或者通過對齊Feature Map的方式,讓車端小模型直接學(xué)習(xí)并對齊云端的Feature Map,從而提升車端小模型的能力?;谡麴s的方式,可以讓車端的感知效果提升五個(gè)百分點(diǎn)。
顧維灝認(rèn)為,未來的自動(dòng)駕駛系統(tǒng)一定是跟人類駕駛員一樣,不但具備對三維空間的精確感知測量能力,而且能夠像人類一樣理解萬物之間的聯(lián)系、事件發(fā)生的邏輯和背后的常識(shí),并且能基于這些人類社會(huì)的經(jīng)驗(yàn)來做出更好的駕駛策略,真正實(shí)現(xiàn)完全無人駕駛。