7月11日-7月13日,“2024中國汽車論壇”在上海嘉定召開,作為汽車產(chǎn)業(yè)發(fā)展的“風(fēng)向標”,本屆論壇以“引領(lǐng)新變革 共贏新未來”為主題,匯聚政府主管部委、行業(yè)領(lǐng)導(dǎo)、主流車企掌門、產(chǎn)業(yè)鏈重點企業(yè)高層、行業(yè)精英等共同探索汽車產(chǎn)業(yè)的未來之路,旨在凝聚各方力量,形成發(fā)展共識,指引未來方向,推動汽車產(chǎn)業(yè)可持續(xù)高質(zhì)量發(fā)展。
對于汽車產(chǎn)業(yè)的未來,不得不提的兩個關(guān)鍵詞就是:“電動化”和“智能化”。目前,中國汽車行業(yè)正處于電動化與智能化的轉(zhuǎn)折點,2024年新能源汽車的滲透率將達到50%,行業(yè)整體的技術(shù)發(fā)展正經(jīng)歷從初步技術(shù)突破到性能優(yōu)化的轉(zhuǎn)變,并開啟了由電動化向智能化的邁進。
而對于智能化下半場的發(fā)展,本次論壇邀請了國內(nèi)智駕科技企業(yè)地平線總裁陳黎明博士,以智駕頭號玩家的角度,以《產(chǎn)研向高而行,解鎖高階智駕新思路》為主題,為大家解析并展望了智能駕駛領(lǐng)域的未來趨勢。
地平線總裁陳黎明博士
自動駕駛將迎“ChatGPT時刻”,當下城區(qū)NOA體驗未達“好用”
目前高階智駕正處于市場高速增長前的關(guān)鍵拐點,2023年,中國中高端車型中NOA功能滲透率激增,20萬-30萬區(qū)間車型從18.5%升至42.2%,30萬以上車型從45.9%增至65.1%。十大中高端車型中,八款已標配NOA,近期中國車企推出的大多數(shù)高端車型也都配備了NOA功能。
在智能化高速發(fā)展的市場趨勢下,陳博士認為,2025年,自動駕駛將迎來ChatGPT時刻,如同大語言模型帶來的驚喜,自動駕駛領(lǐng)域?qū)崿F(xiàn)類似突破。為了實現(xiàn)這一目標,需要解決的是智能駕駛的體驗問題。
陳博士著重指出,當下已量產(chǎn)的城區(qū)NOA智能駕駛產(chǎn)品體驗仍未及“好用”,目前的智駕系統(tǒng)雖然解決了基本的物理安全問題,但在通行效率、駕駛行為的擬人化以及應(yīng)對復(fù)雜場景的能力上仍然不及消費者預(yù)期。而真正“好用”的智駕2.0的系統(tǒng),除了物理安全,更需要解決用戶心理安全的問題,這就要求系統(tǒng)必須提供擬人化的智駕體驗,實現(xiàn)通行效率、駕駛擬人、場景通過率的全面突破。達到“好用”后,才能更再進一步,打造用戶“愛用”的智駕系統(tǒng)3.0,實現(xiàn)智駕平權(quán)。
頂級的軟件算法和計算架構(gòu),推動智駕從用戶可用、好用走向愛用
陳黎明博士闡明:“我們認為,智駕系統(tǒng)要做到‘好用’,必須解決‘Scale Out(橫向泛化性提升)’和‘Scale Up(縱向性能上限提升)’難題?!癝cale up”的問題是什么?就是如何在特定、固定、受控的小ODD范圍內(nèi)實現(xiàn)性能最優(yōu),以處理復(fù)雜的場景;“Scale out”方面的問題,則是怎樣在盡可能大的地域空間及各種天氣條件下實現(xiàn)盡可能高的Scale Up性能。
作為從算法出發(fā)思考智駕系統(tǒng)的公司,地平線首先思考的就是如何通過算法來解決“Scale Out”和“Scale Up”難題。目前在算法上有兩大開發(fā)范式,一種是規(guī)則驅(qū)動,另一種則是數(shù)據(jù)驅(qū)動。二者各有利弊,規(guī)則驅(qū)動基于大量人工規(guī)則,系統(tǒng)上限低,下限可控;數(shù)據(jù)驅(qū)動的端到端系統(tǒng),實現(xiàn)信息無損傳遞,系統(tǒng)上限高,而下限不可控。所以無論是規(guī)則驅(qū)動或數(shù)據(jù)驅(qū)動,單一都無法全面提升系統(tǒng)能力,這就形成了技術(shù)迭代的“蹺蹺板效應(yīng)”——不得不在系統(tǒng)上限的提升和系統(tǒng)下限的保障二者之間做取舍。
面對種種難題,地平線通過融合基于規(guī)則的系統(tǒng)與數(shù)據(jù)驅(qū)動的端到端系統(tǒng),采用端到端與交互博弈,打破了技術(shù)迭代的“蹺蹺板效應(yīng)”,在確保系統(tǒng)下限可控的同時,大幅提升系統(tǒng)上限,打造出“Scale Out”和“Scale Up”的最優(yōu)解。
首先在感知端,地平線采用“三網(wǎng)合一”端到端,能夠把傳感器信息、包括地圖、導(dǎo)航信息都作為一個輸入源輸入到一個模型中進行訓(xùn)練推理;同時,基于感知端到端的優(yōu)勢,不僅可以輸出動靜態(tài)目標信息,還能輸出高維特征級信息,實現(xiàn)信息的無損傳遞,從而提升感知端的系統(tǒng)上限,帶來對于世界的認知能力和系統(tǒng)性能的全面提升;接著無損信息輸入到下游的規(guī)控,規(guī)控里面有基于神經(jīng)網(wǎng)絡(luò)的模塊,也有少量基于規(guī)則的部分做安全兜底,既能提升系統(tǒng)上限,也能確保系統(tǒng)下限,整個系統(tǒng)基于動靜態(tài)推理與數(shù)據(jù)訓(xùn)練,實現(xiàn)場景認知與理解,提升場景泛化能力,從而實現(xiàn)全域可開。
其中端到端技術(shù),也算是近期行業(yè)里的熱門話題,但其實地平線在端到端上早就開始了前沿探索和技術(shù)積累。
早在2016年,地平線便率先提出了自動駕駛端到端的演進理念,并持續(xù)取得技術(shù)創(chuàng)新與突破:在2022年提出行業(yè)領(lǐng)先的自動駕駛感知端到端算法Sparse4D,是行業(yè)領(lǐng)先的高性能、高效率、長時序的純稀疏融合感知架構(gòu),完美解決了以往BEV+Transformer架構(gòu)里面的感知范圍和精度與計算效率的平衡問題,打造端到端系統(tǒng)的強大感知基座,在nuScenes公開數(shù)據(jù)集排行榜第一,是接棒“BEV+Transformer”的下一代架構(gòu),為自動駕駛感知帶來新突破,從陳博士現(xiàn)場的展示中,我們也可以看到,對比BEVFormer,Sparse4D確實在夜間城區(qū)密集人群的精準感知、遠距離及時感知的場景下,有著更精準的感知結(jié)果。
2022年12月,由地平線學(xué)者發(fā)表的自動駕駛大模型UniAD,是業(yè)界第一個公開發(fā)表的端到端自動駕駛大模型,首次實現(xiàn)整體框架的端到端訓(xùn)練,是自動駕駛領(lǐng)域第一次獲得CVPR最佳論文。以往的自動駕駛大模型,很多都是感知的端到端,或者最多做到預(yù)測的端到端,而UniAD做到了規(guī)控的端到端,也就是圖像輸入,自車軌跡做輸出,是更徹底的端到端;UniAD首次提出一個完整的端到端的神經(jīng)網(wǎng)絡(luò),把檢測、跟蹤、建圖、軌跡預(yù)測、占據(jù)格柵預(yù)測及規(guī)劃整合到一個基于Transformer的巨大的神經(jīng)網(wǎng)絡(luò),實現(xiàn)了感知決策一體化,同時相對于全棧“黑盒”的端到端,UniAD更可控、可解釋、可拓展;在NuScenes數(shù)據(jù)集上獲得了SOTA (state of the art),評測結(jié)果最優(yōu),當下產(chǎn)業(yè)界的很多端到端都有受到UniAD啟發(fā),從而開啟端到端的上車應(yīng)用,學(xué)術(shù)與科研界也以UniAD作為基準去對標。
除了在端到端方面的探索,在針對數(shù)據(jù)驅(qū)動的交互博弈算法上,地平線也有革命性的創(chuàng)新。地平線提出領(lǐng)先的模仿-強化混合學(xué)習(xí)技術(shù),讓駕駛更擬人、更安全。一方面,通過模仿學(xué)習(xí)提高學(xué)習(xí)效率,解決“擬人化”問題;另一方面通過強化學(xué)習(xí)克服模仿學(xué)習(xí)在長尾問題解決等方面存在的缺陷,解決”安全性“問題,進而讓整個智駕系統(tǒng)的擬人化和安全性都得以提升。經(jīng)測試,與單純的模仿學(xué)習(xí)相比,混合學(xué)習(xí)框架具有更好的閉環(huán)性能,碰撞率降低50%,而與單純的強化學(xué)習(xí)規(guī)控策略相比,則具有更好的擬人性,舒適度提升20%。
地平線憑借在端到端和交互博弈算法上的創(chuàng)新與深厚積累,積極將這些先進算法通過創(chuàng)新性的計算架構(gòu)轉(zhuǎn)化為現(xiàn)實。早在2016年,地平線便敏銳地意識到,通過硬件實現(xiàn)軟件功能,不僅能顯著提升系統(tǒng)性能,更能大幅削減成本。為此,地平線提出了“智能計算的新摩爾定律”,為智能計算方案設(shè)計與性能提升鋪設(shè)了一條明確的道路。在“智能計算的新摩爾定律”的指導(dǎo)下,地平線自主研發(fā)創(chuàng)新性的計算架構(gòu)BPU。
BPU是地平線自主設(shè)計研發(fā)的創(chuàng)新性智能計算架構(gòu),緊跟深度學(xué)習(xí)和算法發(fā)展趨勢,專注神經(jīng)網(wǎng)絡(luò)架構(gòu)與高級別自動駕駛應(yīng)用,通過深度學(xué)習(xí)加速技術(shù),持續(xù)優(yōu)化計算密度和能效,實現(xiàn)算法、靈活性與硬件效率的完美平衡。
作為智能計算的核心,BPU具備“智能進化”特性,融合算法、編譯器與架構(gòu)設(shè)計,通過數(shù)據(jù)驅(qū)動自動化驗證,持續(xù)迭代優(yōu)化,加速智能進化。BPU歷經(jīng)三次迭代,從伯努利架構(gòu)的高性能低功耗感知計算,到貝葉斯架構(gòu)的感知預(yù)測高效計算,再到納什架構(gòu)的全場景NOA交互博弈支持,不斷演進。
從第一代BPU伯努利架構(gòu)到從最新一代納什架構(gòu),六年的時間里,通過軟件和硬件的優(yōu)化,BPU整個計算性能提升了246倍,對于Transformer的性能3年內(nèi)提升了27倍。而在摩爾定律下,計算性能6年最多提升16倍。以“軟硬結(jié)合”為核心的新摩爾定律的性能提升速度,遠超摩爾定律。
地平線軟硬結(jié)合,推動高階智駕量產(chǎn)落地,實現(xiàn)人人可及
端到端、交互博弈和BPU,就是地平線要打造“好用、愛用”的智駕系統(tǒng),走向自動駕駛ChatGPT時刻的技術(shù)底座。陳博士強調(diào),“我們用軟硬結(jié)合的技術(shù)實力推動智能駕駛從‘可用’到‘好用’最后到‘愛用’?!?/p>
地平線也始終秉持,產(chǎn)品是檢驗技術(shù)領(lǐng)先性的唯一標準?;谏詈竦乃惴ǚe累和創(chuàng)新的硬件架構(gòu),地平線在今年也推出了全新產(chǎn)品,加速智能駕駛面向全場景落地。
據(jù)陳博士介紹,地平線今年推出了“一硬一軟”兩款新產(chǎn)品。硬件產(chǎn)品是業(yè)內(nèi)唯一滿足全階智能駕駛量產(chǎn)的系列計算方案——征程6,作為一款系列化的車載智能計算方案,征程6系列共有6個版本,全面覆蓋低、中、高階智能駕駛需求。據(jù)悉,這一系列化方案采用統(tǒng)一的硬件架構(gòu)、工具鏈和軟件棧,確保了開發(fā)環(huán)境的一致性和兼容性,極大提升了合作伙伴的開發(fā)效率,加速自動駕駛技術(shù)的商業(yè)化進程。憑借其平臺化的計算架構(gòu)和成熟的量產(chǎn)開發(fā)平臺,征程6系列也能支持上層應(yīng)用的高效開發(fā)與靈活部署,幫助車企迅速實現(xiàn)產(chǎn)品上市,搶占市場先機。
而另一款軟件產(chǎn)品,則是Horizon SuperDrive全場景智能駕駛解決方案,旨在通過軟硬結(jié)合,打造擬人化、優(yōu)雅從容的智駕2.0系統(tǒng)。利用“三網(wǎng)合一”端到端感知架構(gòu)和交互博弈算法,SuperDrive在各類復(fù)雜城區(qū)路況下展現(xiàn)卓越的通過率、效率和擬人駕駛風(fēng)格。配合征程6旗艦版,不僅加速了城區(qū)NOA方案的量產(chǎn),還為行業(yè)提供了提供高階智駕“樣板間”,促進產(chǎn)業(yè)鏈研發(fā)與交付效率,共同推進智駕技術(shù)的全面升級。
SuperDrive能覆蓋全場景,包括城區(qū)、高速和泊車場景,實現(xiàn)全場景無差別的高階智駕,現(xiàn)場陳博士也向大家作了視頻展示,從視頻可以看出SuperDrive能實現(xiàn)擁堵時靈活換道、效仿老司機適時調(diào)整路線、輕松過環(huán)島、精準匯入主路,安全禮讓行人等一系列操作,同時兼顧了行車安全與通行效率。
在過去九年,地平線始終堅持Tier-2的定位,征程家族累計出貨量超過500萬片,累計定點量產(chǎn)車型達230余個,攜手100多家合作伙伴一起服務(wù)了20多家主機廠,合作超過110款量產(chǎn)車型上市,陪伴用戶行駛百億公里里程。正如陳博士所言,未來,地平線還將堅定的攜手行業(yè)伙伴,一起推動自動駕駛向高而行,用高效的軟硬協(xié)同智駕解決方案賦能合作伙伴,共同推動自動駕駛技術(shù)走向可用、好用,讓用戶更愛用。