賈浩楠 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
上海車展,60多家主機廠(子品牌合并計算)正在集中秀智能秀新車。
汽車產業(yè)憋3年,這是一次空前釋放。
誰技術最好?誰能代表智能化未來?還真不好說。
但有30多家車企,卻不約而同“商量”了一下:
商湯絕影,車展上諸多熱門車型上都有它的身影,或智駕或智艙。而商湯絕影自己的展臺,還展現(xiàn)出了平臺型AI公司給智能車帶來的新想象空間。
大模型“商量”、AIGC平臺“秒畫”融入智艙系統(tǒng),突破了現(xiàn)在“平板電腦”式的車內交互。
通過AI數(shù)字人可喚醒“商量”,而它則會根據用戶屬性、應用場景,身兼多職。比如行車過程中收到郵件時,商量化身“郵件助手”,自動提煉關鍵信息、回復郵件:
它還是位聰明的“會議助理”,可以自動生成會議紀要,大大節(jié)省用戶行車時處理工作的時間和精力。
“商湯秒畫SenseMirage”文生圖創(chuàng)作平臺還會根據乘客的屬性和喜好,生成各類風格的圖像:
大模型上車所帶來的全新場景體驗,讓車圈談論數(shù)年的“第三生活空間“概念似乎已近在眼前。
官宣不過1年多時間,絕影展現(xiàn)出的智能汽車技術量產落地的情況是:合作主機廠30多家、超50個生態(tài)合作伙伴,定點3100萬輛,而且覆蓋智駕智艙兩個領域。
這也讓商湯絕影成了車展上最不顯山不露水的贏家之一。
而回溯商湯的歷史,這樣的劇本似乎早就寫好了——ChatGPT帶火的AI大模型能力,是商湯從2019年就開始就投入探索建設的。
“絕影”出沒車展
絕影,三國曹操的坐騎,與赤兔、的盧一樣青史留名的千里馬。這屆車展上,這匹“絕影”頻繁出沒于各大主機廠的展臺。
廣汽埃安旗下主打實用性的中型SUV LX Plus,搭載具備高速領航輔助能力的ADAS系統(tǒng),背后的支持,是商湯絕影的環(huán)視BEV感知能力和通用目標感知能力。
而商湯絕影的全棧智能駕駛能力,搭載在了新勢力哪吒的轎跑新車S上,將為消費者帶來安全可靠、高效舒適的高速領航輔助駕駛體驗。
至于商湯絕影的智能座艙技術,量產落地范圍就更廣了。
比如蔚來NT2.0平臺的ET7/ET5/ES7等等,支持出行場景下對駕駛員的疲勞狀態(tài)進行實時提醒,同時助力提供Face ID、兒童遺忘檢測系統(tǒng)(CPD -Child Presence Detection)等乘員感知技術。
前段時間亮相的極氪兩廂純電小鋼炮X,首次采用了完全無門把手的設計,而是在B柱上集成了包括FaceID在內的感應交互功能,同樣是由商湯絕影提供。
長安逸達還搭載了絕影健康檢測產品,可在不到半分鐘內檢測出車艙乘員的多種健康指標,帶來車載健康管理新體驗。
在本屆車展亮相的東風猛士917、廣汽傳祺E9、影酷以及M8宗師、高合HiPhi等車型,也都用了商湯絕影駕駛員感知和乘員感知的多項功能。
總結一下,今年全球汽車行業(yè)首個A級車展上,60多個主機廠卷的主題依然是智能化,而這其中,有30多家已經和商湯絕影達成合作,定點3100萬輛。
“絕影”確如其名,展現(xiàn)的同樣是千里馬躡影追風的速度。
絕影展現(xiàn)出了怎樣的技術能力?
商湯絕影在量產車方向,提供的主要是智艙和智駕兩個產品。
智能車艙SenseAuto Cabin由駕駛員感知系統(tǒng)(DMS)、車艙感知系統(tǒng)(OMS)、智能進入系統(tǒng)及車艙APP等產品組成。
最基本的功能如“刷臉開車門”。DMS能夠根據駕駛員身份同步完成座椅、后視鏡等調節(jié)。駕駛過程中,還可以對駕駛員行車狀態(tài),對疲勞、分心及危險行為進行預警,并且根據駕駛員注視區(qū)域及視線方向,提供安全的無接觸式交互。
甚至還有更加個性化的功能設置。比如可以根據乘客需要,提供基于年齡、性別等屬性的多種定制化服務。
智能駕駛SenseAuto Pilot則是行泊一體的方案,充分共享行車傳感器與泊車傳感器的感知數(shù)據,統(tǒng)一行車域與泊車域的軟件架構以及在計算平臺的部署,降低軟硬件成本,同時提升芯片算力的利用效率,推進智能駕駛全場景打通和落地應用。
在高速場景下,可支持智能導航變道、靈活效率變道等L2+功能,同時可以支持大曲率匝道通行、異性車輛識別與響應,進一步提高功能體驗。在城市領航下,絕影通過豐富的感知元素識別能力和識別精度,可以支持路口紅綠燈啟停、無保護左轉、擁堵場景跟車等功能。
商湯絕影記憶泊車產品支持跨層停車場的路徑記憶、路徑循跡、 智能避讓以及目標車位泊入功能,可實現(xiàn)大型多層停車場的跨層路線記憶。
針對高性價比車型,商湯絕影還推出SenseAuto Pilot Entry(6V1R)方案,行車功能可以有效復用泊車的魚眼相機,最大程度共用傳感器,壓縮計算資源,實現(xiàn)主動安全、L2 駕駛輔助與 APA 泊車輔助功能。
所以,能看出商湯絕影無論座艙還是智駕,提供區(qū)別于其他供應商的獨特功能,以及在同等體驗下實現(xiàn)成本控制的基礎,都是通用視覺識別能力——商湯一貫的強項和核心優(yōu)勢。
實際上感知技術被稱為智能車業(yè)務的先手環(huán)節(jié)。
無論是交通、醫(yī)療、金融等等行業(yè)的AI落地應用,幾乎無一例外要求極佳視覺感知能力,以及決策能力,這兩項為商湯建設的通用AI能力核心。
從2019年開始,商湯從10億參數(shù)的視覺模型研發(fā),到今天有320億全球最大規(guī)模的通用視覺的模型,實現(xiàn)了高性能的目標檢測、圖像分割和多物體識別算法,并在自動駕駛、工業(yè)質檢、醫(yī)療影像等多個領域得到廣泛應用。
決策方面,商湯聯(lián)合上海人工智能實驗室推出了OpenDILab決策AI平臺。這其中的DI-drive是一套自動駕駛仿真訓練平臺,可通過決策AI在仿真器中構建訓練和評測場景,讓AI在自動駕駛的復雜交互環(huán)境中實現(xiàn)更加精準的決策、規(guī)劃和控制。
絕影將決策 AI 引入到自動駕駛中的規(guī)劃控制,正逐步改變以往人為規(guī)則驅動的開發(fā)模式,高效助力在駕乘體驗、數(shù)據閉環(huán)效率的巨大提升。
這些AI大模型的建設,并不是商湯在2017開始布局汽車業(yè)務時才開始的,而是貫穿了商湯自創(chuàng)業(yè)以來,在各個場景落地使用AI技術的過程。
所以說,商湯絕影的進展,不是單一的車業(yè)務輸出,而是平臺型AI公司在智能車浪潮中底層核心能力的復用和釋放。
通用感知技術、AI決策能力,讓商湯絕影能在最合適的時間“上新”“交貨”,而他們的背后,離不開商湯對AI大裝置的長期投入建設。
什么讓商湯“絕影”
算法能力來自大模型,而大模型離不開“大裝置”的支持。
商湯AI大裝置SenseCore是支撐商湯軟件平臺的通用人工智能基礎設施,用了5年時間建設。總共有27000塊的GPU芯片卡,可以輸出5.0 exaFLOPS的總算力,是亞洲目前最大的智能計算平臺之一。
可實現(xiàn)批量的算法模型生產、部署和迭代升級,支持超大參數(shù)通用大模型訓練。
基于大裝置的能力,商湯構建了計算機視覺、自然語言處理、AI內容生成、多模態(tài)、決策智能等多個領域的大模型,持續(xù)演進能力并廣泛支持各種應用。
在智能車產品的研發(fā)和迭代中,這樣的能力發(fā)揮出重要作用。
比如智能駕駛量產方向上,商湯發(fā)布的多模態(tài)多任務通用大模型“書生(INTERN)2.5”。其擁有30億參數(shù),是目前全球開源模型中ImageNet準確度最高、規(guī)模最大,同時也是物體檢測標桿數(shù)據集COCO中唯一超過65.0 mAP的模型。
而OpenGVLab通用視覺開源平臺通過“書生”大模型實現(xiàn)了4類核心視覺任務的全覆蓋,包括10萬多標簽的智能識別,為商湯絕影提供強大通用感知能力。
通用感知能力的提前布局,讓絕影成為業(yè)內率先將BEVFormer++的感知算法實現(xiàn)大規(guī)模量產落地的玩家。
智能座艙方向,商湯絕影在車展上展示的未來座艙,首次將語言大模型“商湯商量SenseChat”以及AIGC文生圖平臺“商湯秒畫SenseMirage”上車。
類GPT的能力,使得智能座艙的功能、交互方式、體驗有了全新的形式,顛覆了一直以來智能座艙=平板電腦的模式。
這也是智能車領域值得關注的最新趨勢:全能型AI玩家入場,用大模型大裝置能力改變了以往艙駕分離,各自為戰(zhàn)的格局。
對大模型能力的前瞻建設,保證了商湯絕影在智艙智駕技術和產品本身層面的競爭力和使用體驗。
而商湯在通用AI能力建設、落地過程中沿途點亮的“燈”,又給了商湯絕影業(yè)務更大的潛力空間。
怎么說?
智能駕駛覆蓋ODD范圍不斷擴大,使得座艙之內的交互、應用需求也快速增長,“智慧出行空間”的概念,從來沒離普通用戶這么近過。
自然而然,商湯以往在其他領域落地的AI技術,現(xiàn)在也能開始在智能車這個平臺上輸出:
智能車本身作為娛樂、健康、交通服務的需求者同時,也是各種感知、視覺數(shù)據的生產的源頭。
深度挖掘這些數(shù)據蘊含的價值,商湯可以以車為核心,以過往業(yè)務為節(jié)點,連接起一個包含各個行業(yè)的生態(tài)。
全能型玩家入場,智能車的游戲規(guī)則可能很快就會被改寫。