作者 | 百日夢(mèng)想家
編輯 | 王博
智算中心拼什么?
2022年過去,數(shù)據(jù)驅(qū)動(dòng)成為自動(dòng)駕駛演進(jìn)共識(shí)。沿著數(shù)據(jù)驅(qū)動(dòng)這條路線,自動(dòng)駕駛加速邁入智算時(shí)代。
智算中心應(yīng)運(yùn)而生。
實(shí)際上,將智算引入自動(dòng)駕駛的開先河者是特斯拉,其率先發(fā)布了專用于自動(dòng)駕駛訓(xùn)練的超級(jí)計(jì)算中心Dojo,此后,一眾玩家如毫末、小鵬等紛紛宣布建立智算中心。
各大智算中心比拼什么?
答案是,如何用低成本且高效的方式實(shí)現(xiàn)海量數(shù)據(jù)的閉環(huán)驅(qū)動(dòng)。
“自動(dòng)駕駛大模型加速降低開發(fā)成本,數(shù)據(jù)更接近人駕環(huán)境?;诹慨a(chǎn)實(shí)車數(shù)據(jù)的仿真技術(shù)將與自動(dòng)駕駛云端超大模型結(jié)合,迎來新突破。超算中心成為自動(dòng)駕駛的入門配置?!焙聊┲切卸麻L(zhǎng)張凱在2023十大自動(dòng)駕駛趨勢(shì)預(yù)測(cè)中表示。
1月5日,在第七屆HAOMO AI DAY上,毫末智行正式發(fā)布了由其與字節(jié)跳動(dòng)旗下火山引擎聯(lián)合打造的智算中心雪湖綠洲(MANA OASIS),這也是中國(guó)自動(dòng)駕駛公司首個(gè)設(shè)立的智算中心。
“綠洲”登場(chǎng),為我們揭開了智算時(shí)代的戰(zhàn)場(chǎng)一角,也讓毫末成為對(duì)陣特斯拉中最有看點(diǎn)的自動(dòng)駕駛公司之一。
1、自建智算中心,劍指數(shù)據(jù)閉環(huán)
這應(yīng)該是目前中國(guó)自動(dòng)駕駛行業(yè)最大智算中心了。
每秒浮點(diǎn)運(yùn)算可達(dá)67億億次,存儲(chǔ)帶寬每秒2T,通信帶寬每秒800G,毫末官方在介紹MANA OASIS時(shí)給出這樣一組數(shù)據(jù)。?
基于火山引擎豐富的大數(shù)據(jù)積累和底層技術(shù),MANA OASIS實(shí)現(xiàn)了計(jì)算、存儲(chǔ)、通訊能力,可讓數(shù)據(jù)更快速轉(zhuǎn)化成知識(shí)。
有了這一新利器,毫末智行CEO顧維灝宣布,預(yù)計(jì)2024年上半年,毫末城市NOH落地將達(dá)到100城,2025年實(shí)現(xiàn)全無人駕駛。
MANA OASIS的出現(xiàn)是有其背景的。
隨著感知技術(shù)與計(jì)算平臺(tái)的逐漸成熟與趨同,影響高階自動(dòng)駕駛落地的關(guān)鍵因素,不再是解決常見的一般案例,而是解決“路口”問題,也即各類不常見,但不斷出現(xiàn)的“長(zhǎng)尾問題”,
作為一種模仿人類的科學(xué),AI自動(dòng)駕駛與人類認(rèn)知世界的邏輯基本一致,想讓汽車更好地理解世界,就需要構(gòu)建更精準(zhǔn)的模型。但算法模型的建立并非一勞永逸,自動(dòng)駕駛車輛在行駛過程中總會(huì)遇到各種陌生場(chǎng)景。
因此,如何對(duì)新場(chǎng)景數(shù)據(jù)進(jìn)行大規(guī)模高效處理并快速優(yōu)化算法模型,即成為自動(dòng)駕駛技術(shù)迭代的關(guān)鍵。換言之,構(gòu)建基于數(shù)據(jù)驅(qū)動(dòng)的自動(dòng)駕駛數(shù)據(jù)閉環(huán),讓數(shù)據(jù)實(shí)現(xiàn)高效流動(dòng),是實(shí)現(xiàn)高階自動(dòng)駕駛的必由之路。
為滿足實(shí)現(xiàn)數(shù)據(jù)閉環(huán)的所需要的超大算力數(shù)據(jù)中心,MANA OASIS出現(xiàn)了。
它的直接任務(wù),便是為毫末智行的MANA數(shù)據(jù)智能體系提供超級(jí)算力,幫助MANA的五大模型實(shí)現(xiàn)低成本且高效的迭代。
MANA OASIS具備4大核心能力,包括以穩(wěn)健系統(tǒng)架構(gòu)保證高效存儲(chǔ)和網(wǎng)絡(luò)通訊、數(shù)據(jù)管理能力、算力優(yōu)化能力以及訓(xùn)練加速能力。
顧維灝介紹,基于火山引擎豐富的大數(shù)據(jù)積累和底層技術(shù),MANA OASIS實(shí)現(xiàn)的計(jì)算、存儲(chǔ)、通訊能力,可以讓GPU不再等待數(shù)據(jù),數(shù)據(jù)轉(zhuǎn)化成知識(shí)的速度也會(huì)更快。毫末數(shù)據(jù)、算力、訓(xùn)練效率也迎來全面提升。
具體來看,在數(shù)據(jù)管理能力方面,為充分發(fā)揮智算中心價(jià)值,讓GPU持續(xù)飽和運(yùn)行,毫末歷經(jīng)2年研發(fā),建立了全套面向大規(guī)模訓(xùn)練的Data Engine,實(shí)現(xiàn)了百P數(shù)據(jù)篩選速度提升10倍、百億小文件隨機(jī)讀寫延遲小于500us。
在算力優(yōu)化方面,毫末與火山引擎合作,部署了Lego高性能算子庫、ByteCCL通信優(yōu)化能力、以及大模型訓(xùn)練框架。軟硬一體,把算力優(yōu)化到極致。
在訓(xùn)練效率方面,基于Sparse MoE,通過訓(xùn)練平臺(tái)的持續(xù)優(yōu)化,毫末可實(shí)現(xiàn)單機(jī)訓(xùn)練百億參數(shù)大模型,以及實(shí)現(xiàn)跨機(jī)共享expert的方法,完成千億參數(shù)規(guī)模大模型訓(xùn)練,訓(xùn)練成本降低到百卡周級(jí)別,訓(xùn)練效率提升100倍。
那么,MANA OASIS是怎么提升毫末的數(shù)據(jù)閉環(huán)效率的呢?
2、幫助MANA五大模型升級(jí),更低成本、更高效
基于MANA OASIS智算中心,MANA數(shù)據(jù)智能體系的五大模型迎來了升級(jí)。
這五大模型包括:視頻自監(jiān)督大模型、3D重建大模型、多模態(tài)大模型、動(dòng)態(tài)環(huán)境大模型以及人駕自監(jiān)督認(rèn)知大模型。
其中,視頻自監(jiān)督大模型、3D重建大模型的應(yīng)用目的是為了降低成本,另外三個(gè)大模型的應(yīng)用是為了提升數(shù)據(jù)流轉(zhuǎn)效率。
具體來說,毫末智行視頻自監(jiān)督大模型主要做數(shù)據(jù)標(biāo)注工作,能夠讓毫末 4D clip 標(biāo)注實(shí)現(xiàn) 100%自動(dòng)化,人工標(biāo)注成本降低 98%。
3D 重建大模型可以實(shí)現(xiàn)以低成本獲取 normal case,生成各種高成本 corner case,其生成的數(shù)據(jù),不僅比傳統(tǒng)的人工顯式建模再渲染紋理的方法效果更好、成本更低,增加 NeRF 生成的數(shù)據(jù)后,還可將感知的錯(cuò)誤率降低 30%以上。
多模態(tài)互監(jiān)督大模型,能夠精準(zhǔn)識(shí)別異形障礙物。毫末智行通過引入激光雷達(dá)作為視覺監(jiān)督信號(hào),直接使用視頻數(shù)據(jù)來推理場(chǎng)景的通用結(jié)構(gòu)表達(dá),而通用結(jié)構(gòu)的檢測(cè),可以很好地補(bǔ)充已有的語義障礙物檢測(cè),有效提升自動(dòng)駕駛系統(tǒng)在城市復(fù)雜工況下的通過率。
動(dòng)態(tài)環(huán)境大模型,可以精準(zhǔn)預(yù)測(cè)道路的拓?fù)潢P(guān)系,讓車輛始終行駛在正確的車道中。
毫末智行通過在 BEV(鳥瞰圖)的 feature map(特征圖)基礎(chǔ)上,以標(biāo)精地圖作為引導(dǎo)信息,使用自回歸編解碼網(wǎng)絡(luò),將 BEV 特征,解碼為結(jié)構(gòu)化的拓?fù)潼c(diǎn)序列,實(shí)現(xiàn)車道拓?fù)漕A(yù)測(cè),從而使毫末智行在感知能力上能夠像人類一樣在標(biāo)準(zhǔn)地圖的導(dǎo)航提示下就可以實(shí)現(xiàn)對(duì)道路拓?fù)浣Y(jié)構(gòu)的實(shí)時(shí)推斷。
毫末智行認(rèn)為,解決了路口問題實(shí)際就解決了大部分城市 NOH 問題,目前在保定、北京,毫末對(duì)于 85%的路口拓?fù)渫茢鄿?zhǔn)確率高達(dá) 95%。即便是非常復(fù)雜、非常不規(guī)則的路口,毫末也能準(zhǔn)確預(yù)測(cè)。
人駕自監(jiān)督認(rèn)知大模型,能夠掌握高水平司機(jī)的開車技法,讓駕駛決策更聰明。
在探索“使用大量人駕數(shù)據(jù),毫末智行全新引入用戶真實(shí)的接管數(shù)據(jù),同時(shí)用 RLHF(從人類反饋中強(qiáng)化學(xué)習(xí))思路先訓(xùn)練一個(gè) reward model(獎(jiǎng)勵(lì)模型)來挑選出更好的駕駛決策。通過這種方式,使毫末智行在掉頭、環(huán)島等公認(rèn)的困難場(chǎng)景中,通過率提升 30%以上。
此外,基于綠洲的支持,MANA最新的車端感知架構(gòu),從過去分散的多個(gè)下游任務(wù)都集成到一起,形成一個(gè)更加端到端架構(gòu),包括紅綠燈、局部路網(wǎng)、預(yù)測(cè)等任務(wù),實(shí)現(xiàn)了跨代升級(jí)。
以上這些,意味著毫末的感知能力更強(qiáng),自動(dòng)駕駛功能有了更大的可挖掘空間。
3、2025年實(shí)現(xiàn)全無人駕駛,毫末的底氣是什么?
此次AI DAY上,毫末智行正式宣布將在2025年實(shí)現(xiàn)全無人駕駛。
毫末智行的底氣在是什么?顧維灝給出的答案,是重感知的技術(shù)路線、大模型的技術(shù)應(yīng)用。
這里有一個(gè)先后順序,需要先有大量數(shù)據(jù),再進(jìn)行數(shù)據(jù)的處理和應(yīng)用。
在智算中心之前,毫末智行率先引入Transform等新技術(shù),確立以數(shù)據(jù)閉環(huán)驅(qū)動(dòng)形式的數(shù)據(jù)智能體系MANA,其已經(jīng)成為毫末智行所有產(chǎn)品迭代的核心動(dòng)力,截止目前,其學(xué)習(xí)時(shí)長(zhǎng)已經(jīng)超過42萬小時(shí),虛擬世界駕齡相當(dāng)于人類司機(jī)5.5萬年的駕齡。
當(dāng)前,毫末智行已經(jīng)完成數(shù)十萬全要素、多模態(tài)CLIPS的標(biāo)注,在場(chǎng)景庫積累方面已經(jīng)建設(shè)完成300萬小時(shí)中國(guó)道路駕駛認(rèn)知場(chǎng)景庫,可以真正做到感知智能和認(rèn)知智能的有效協(xié)同。
之后,怎么更好的處理數(shù)據(jù)。
智算中心的建立,能夠讓毫末智行在實(shí)現(xiàn)數(shù)據(jù)高效流轉(zhuǎn)閉環(huán)的同時(shí),還能夠降低整個(gè)研發(fā)成本,從而促進(jìn)自動(dòng)駕駛系統(tǒng)快速實(shí)現(xiàn)量產(chǎn)落地。
值得一提的事,毫末智行自研的AEB算法助力魏牌、歐拉、坦克共計(jì)四款車型獲得ENCAP、ANCAP五星安全,毫末是中國(guó)首個(gè)自研AEB算法落地海內(nèi)外的公司,毫末也成為第一個(gè)出海歐洲、澳洲的自動(dòng)駕駛公司。
在專利方面,截止到2022年12月,毫末擁有專利證書146件,全面覆蓋數(shù)據(jù)融合、智能感知、智能決策、控制執(zhí)行、模型算力提升等領(lǐng)域。
實(shí)際上,毫末還有一重優(yōu)勢(shì),那就是背靠長(zhǎng)城的量產(chǎn)優(yōu)勢(shì)。
毫末智行能夠快速實(shí)現(xiàn)量產(chǎn)能力,也是能夠反哺其自動(dòng)駕駛技術(shù)快速升級(jí)迭代的重要因素之一。
目前正在陸續(xù)交付中的車型有摩卡DHT-PHEV激光雷達(dá)版、歐拉閃電貓、歐拉芭蕾貓、全新一代長(zhǎng)城炮等。
這些車型上市之后,也能夠?yàn)楹聊┲切刑峁┰絹碓蕉嗟母哔|(zhì)量的自動(dòng)駕駛數(shù)據(jù),助力其自動(dòng)駕駛系統(tǒng)不斷迭代升級(jí)。
截止2022年底,毫末HPilot搭載車型近20款,已經(jīng)搭載上市車型包括魏牌摩卡、魏牌拿鐵、魏牌瑪奇朵、坦克300、坦克500、哈弗神獸、拿鐵DHT-PHEV等。用戶輔助駕駛行駛里程突破2500萬公里。
城市輔助駕駛上,毫末智行的城市NOH軟件達(dá)到交付狀態(tài),目前已經(jīng)開啟多城路測(cè),毫末城市 NOH 是中國(guó)第一個(gè)可大規(guī)模落地的城市導(dǎo)航輔助駕駛,搭載毫末城市 NOH 的車型將在 2023 年上市。預(yù)計(jì)在2024年上半年落地城市達(dá)到100個(gè)。
毫末智行雖然成立僅三年時(shí)間,但已經(jīng)穩(wěn)居中國(guó)量產(chǎn)自動(dòng)駕駛第一名。憑借此次發(fā)布的智算中心綠洲,毫末在自動(dòng)駕駛領(lǐng)域的身位將持續(xù)靠前。
4、技術(shù)路線殊途同歸,自動(dòng)駕駛決戰(zhàn)2025
自動(dòng)駕駛行業(yè)已經(jīng)進(jìn)入以商業(yè)化量產(chǎn)為主的下半場(chǎng)競(jìng)爭(zhēng)。
據(jù)不完全統(tǒng)計(jì),除北上廣之外,深圳、重慶、長(zhǎng)沙等40多個(gè)省市,都積極出臺(tái)相應(yīng)管理辦法或?qū)嵤┘?xì)則,從載人測(cè)試、道路測(cè)試、示范運(yùn)營(yíng)到無人化等多個(gè)階段開展探索,大力推進(jìn)自動(dòng)化駕駛。
同時(shí),據(jù)《中國(guó)自動(dòng)駕駛乘用車市場(chǎng)數(shù)據(jù)追蹤報(bào)告》發(fā)布的數(shù)據(jù)顯示,2022年1季度國(guó)內(nèi)L2級(jí)自動(dòng)駕駛在乘用車市場(chǎng)的新車滲透率已達(dá)23.2%。
汽車之家研究院最新的一組報(bào)告預(yù)測(cè),到2025年,中國(guó)L2級(jí)以上智能汽車銷量將超過1000萬輛,相應(yīng)的智能汽車滲透率將達(dá)到49.3%。
與數(shù)據(jù)形成對(duì)比的,則是國(guó)內(nèi)企業(yè)在自動(dòng)駕駛賽道中激進(jìn)的態(tài)度。
除了毫末外,百度此前宣布將于2023年打造全球最大無人駕駛服務(wù)區(qū),華為計(jì)劃將在2025年成為中國(guó)自動(dòng)駕駛領(lǐng)導(dǎo)者。小馬智行則表示2025年無人駕駛講迎來真正的商業(yè)化應(yīng)用。
與此同時(shí),隨著自動(dòng)駕駛商業(yè)化落地競(jìng)爭(zhēng)的開始,不管是走漸進(jìn)式路線,還是跨越式路線,亦或者是純感知路線,或多傳感器融合路線,最終大家的目的都在殊途同歸,即加速自動(dòng)駕駛技術(shù)的量產(chǎn)落地,搶占自動(dòng)駕駛決賽入場(chǎng)資格。
有業(yè)內(nèi)人士表示,預(yù)計(jì)到2025年,自動(dòng)駕駛行業(yè)的入場(chǎng)券將會(huì)截止。而作為國(guó)內(nèi)走在自動(dòng)駕駛量產(chǎn)前列的企業(yè),毫末智行無疑已經(jīng)獲得2025決賽入場(chǎng)資格證。
張凱曾提到,數(shù)據(jù)是驅(qū)動(dòng)自動(dòng)駕駛成熟的核心要義,漸進(jìn)式路線是數(shù)據(jù)積累的最佳路徑。如今,隨著智算中心綠洲的出現(xiàn),毫末對(duì)數(shù)據(jù)和大模型的應(yīng)用越來越嫻熟,自動(dòng)駕駛再進(jìn)一步已是順理成章。