作者|劉佳藝,編輯|白雪
AI 定義汽車時代,商湯絕影可謂「家里有礦」,贏在了起跑線。
背靠商湯科技這棵大樹,可汲取的算力養(yǎng)分高達 20 EFLOPS。
一個直觀對比是,目前蔚小理三家新勢力公布的算力數(shù)據(jù)總和,還不到 10 EFLOPS。
充沛的算力資源,讓商湯絕影擁有對 AI 的率先領(lǐng)悟力。
2023 年,商湯絕影拿下了 CVPR 論文獎,提出了行業(yè)首個感知決策一體化自動駕駛通用模型 UniAD,在端到端浪潮下拿到了首批船票。
目前商湯絕影的智駕方案,上車了 3 家車企,6 款車型。而占領(lǐng)技術(shù)高地的端到端方案,明年四季度將迎來落地。
與此同時,為獲得更多確定性籌碼,商湯絕影把技術(shù)創(chuàng)新的步子邁的更大,更深,從數(shù)據(jù)驅(qū)動的底層邏輯出發(fā),把戰(zhàn)場從車端擴大到云端——世界模型「開悟」,或?qū)⒊蔀樯虦^影的新底牌。
01、AI 疊 buff:純視覺、端到端、L3
秉持 AI 基因,商湯絕影的智駕之路開局順利。
2017 年夏天,商湯絕影僅用兩顆攝像頭的純視覺方案,就完成了本田的暴雨天氣智駕測試,就此開啟了方案商的征途。
得益于堅實的算力基礎(chǔ),商湯絕影的智駕方案接連在廣汽埃安 LX Plus、哪吒 S、昊鉑 GT 等車型上落地。
但行業(yè)內(nèi)卷的「價格戰(zhàn)」壓力下,方案商還需要在產(chǎn)品力上加大力度。
這次,商湯絕影選擇攻堅「性價比」,最新推出了中高階智駕方案,把性價比做到極致:
- AD Pro,基于地平線 J6E 芯片,算力最高達 80TOPS,搭載 7 個攝像頭、多個雷達,支持高速領(lǐng)航、記憶行車、記憶泊車;AD Max,基于地平線 J6M 芯片,算力最高達 200TOPS,搭載 11 個攝像頭、多個雷達,支持高速領(lǐng)航、城區(qū)領(lǐng)航、記憶行車、記憶泊車。
據(jù)介紹,采用高性價比計算芯片,搭載低成本傳感器,讓這兩套智駕方案在價格上擁有高競爭力,比如 AD Max,成本可以做到 5000 元左右。
一個直接對比是,卓馭智駕的 7V+100TOPS 的對標城區(qū)智駕方案,成本來到了 7000 元。
在落地上,商湯絕影這兩套方案都將在明年二季度落地。包括新推出的端到端智駕方案 AD Ultra,商湯絕影宣稱「極致體驗」,也將在 10 個月后與用戶見面。
正是這樣,商湯絕影決定把勝算攥到下一個賽段。
實際上,在 UniAD 獲得 2022 年 CVPR 最佳論文時,就意味著商湯絕影對端到端具備絕對發(fā)言權(quán)。
這兩年,端到端熱詞席卷智能駕駛宇宙,在行業(yè)還在為端到端定義、技術(shù)分歧、真假端到端爭論不休時,商湯絕影喊出了「真·一段式端到端」的口號。
現(xiàn)在,這個聲音逐漸獲得了業(yè)內(nèi)共振。
Momenta 創(chuàng)始人曹旭東曾表示,一段式端到端比兩段式端到端優(yōu)勢明顯,兩段式端到端由于感知與規(guī)控端到端分段,感知對于落石、水坑等障礙物容易誤判,而一段式端到端可以提前學(xué)習(xí)未定義物體,有效處理更復(fù)雜的極端情況。
但他也強調(diào),一段式端到端上限高但研發(fā)挑戰(zhàn)大,對于算力、數(shù)據(jù)量要求更高,Momenta 已經(jīng)從兩段式端到端轉(zhuǎn)向了一段式端到端落地。
目前,行業(yè)不少玩家都將一段式端到端視為兩段式端到端的進階狀態(tài)。
這么看,商湯絕影掌握了技術(shù)先機,對 AD Ultra 寄予了厚望。
這是其首創(chuàng)的端到端+純視覺高階智駕方案,搭載了 NVIDIA DRIVE Thor/Orin 芯片,僅需 1 個毫米波雷達和 11 個攝像頭,就能夠?qū)崿F(xiàn)一段式端到端智駕,提供「類人」駕駛體驗。
據(jù)商湯絕影一位產(chǎn)品經(jīng)理介紹,點到點領(lǐng)航智駕相當(dāng)于現(xiàn)在智駕第一梯隊主推的「車位到車位」功能,可以保證智駕場景的全覆蓋。
另外一點是,AD Ultra 會更偏向于與 Thor 做適配,如果從競爭維度考慮,在目前其它玩家搭載 Orin 方案已經(jīng)成熟的階段,商湯絕影選擇算力更大的 Thor,意味著能領(lǐng)先一步走,從性能上補齊時間差。
能看到的是,AD Ultra 已經(jīng)把上限做到了 L3 級,基于這種高階方案,或許可以在未來給商湯絕影帶來更多勝算。
可見,基于濃重的 AI 底色,商湯絕影從純視覺方案步入端到端技術(shù)路徑,現(xiàn)在,又通過端到端叩開 L3 的大門,穩(wěn)扎穩(wěn)打下,商湯絕影走上新臺階。
02大模型玩家再出招,世界模型「開悟」
在殘酷的智能化競爭場域,量產(chǎn)一直是關(guān)鍵競速尺度,商湯絕影需要盡快從其它層面補齊差距。
開拓產(chǎn)品矩陣成為商湯絕影的新思路,新底牌是——世界模型。
上一次行業(yè)對「世界模型」的認知還來源于蔚來的 NWM——具備強大的場景理解與生成能力,能有效運用大模型的數(shù)據(jù)采集、訓(xùn)練、仿真測試等階段。
世界模型也逐漸被行業(yè)認定為智駕下半場的重要關(guān)鍵詞。
事實上,商湯絕影背靠強大的大模型體系,為世界模型的誕生提供了豐沃土壤。
商湯科技的「日日新」大模型,涵蓋大語言模型、文生圖模型、多模態(tài)模型等多種能力,并在尺度定律下快速迭代,綜合能力已經(jīng)可以對標 GPT-4 Turbo。
商湯絕影基于這套大模型體系,已經(jīng)衍生出了豐富的汽車智能化產(chǎn)品。
比如新推出的智能座艙創(chuàng)新產(chǎn)品——A New Member For U,亮點是讓智能座艙跳出了「工具人」的框架,變成了會察言觀色,主動提供情緒價值與服務(wù)的「賈維斯」。
而在智能駕駛層面,商湯絕影把觸角延伸至端到端的數(shù)據(jù)驅(qū)動邏輯上。
商湯絕影 CEO 王曉剛表示,數(shù)據(jù)驅(qū)動模式需要建設(shè)完善的數(shù)據(jù)閉環(huán),打造強大的數(shù)據(jù)基礎(chǔ)設(shè)施,更低成本、更高效的生產(chǎn)數(shù)據(jù)是競爭獲勝關(guān)鍵。
由此,商湯絕影探索出一條新路,通過實車采集與仿真生成「雙輪驅(qū)動」的數(shù)據(jù)閉環(huán),打造出世界模型「開悟」。
- 一方面,基于真實采集數(shù)據(jù),「開悟」可以完成數(shù)據(jù)泛化,生成大量高質(zhì)量場景,包括稀有標志牌、施工場景等極端場景;另一方面,模型可以在「開悟」中完成自車與他車,環(huán)境交互的閉環(huán)仿真訓(xùn)練。
一個重要數(shù)據(jù)是,基于一張 A100 GPU 打造的「開悟」世界模型,平均每天生成 2 萬個場景,相當(dāng)于 100 臺路測車數(shù)據(jù)采集能力,及 500 臺量產(chǎn)車的效率。
當(dāng)然,降本增效的前提是「開悟」生成的場景足夠真實、準確。
曾有業(yè)內(nèi)人士認為,采用世界模型生成式數(shù)據(jù)比較粗糙,代替不了真實世界,只能作為輔助性工具使用。
而「開悟」攻克了世界模型的難點、痛點,能夠理解真實世界的物理規(guī)則、交通規(guī)則,生成的的場景視頻,最長為 150 秒,分辨率高達 1080P。
另一個維度是時空一致性,在行業(yè)內(nèi)都輸出 1V、6V 視角視頻時,「開悟」直接挑戰(zhàn)最高難度,生成 11V 多視角時空一致的高信息密度視頻。
此外,強大的泛化能力,讓「開悟」能夠定制長尾場景,精準改變天氣、交通要素,目前場景集覆蓋的各類天氣、光照條件、道路類型的場景種類高達 1024 類,構(gòu)建千萬級場景庫。
王曉剛表示,目前商湯絕影數(shù)據(jù)采集過程中,20% 的數(shù)據(jù)由「開悟」生成,未來這個比例可以達到 80%。
顯然,「開悟」世界模型對端到端玩家而言,是一項面向未來的提質(zhì)生產(chǎn)力工具,商湯絕影放出這個大招,意味著率先預(yù)定了未來競爭場的入場券。
目前,圍繞高階智駕量產(chǎn)、端到端量產(chǎn)、AI 云服務(wù)、AI 大模型等產(chǎn)品維度,商湯絕影已經(jīng)與奇瑞大卓智能、東風(fēng)建立戰(zhàn)略合作關(guān)系。
03「互補」,找準自己的生態(tài)位
今天,大多數(shù)車企都走上了全棧可控這條路。
掌握了數(shù)據(jù)命脈,車企就有底氣把野心放大。
奇瑞大卓智能 CEO 谷俊麗表示,奇瑞全球用戶高達 1510 萬,覆蓋全球 100 個國家,當(dāng)下 AI 戰(zhàn)等于資源戰(zhàn),數(shù)據(jù)就是流動的黃金。
在奇瑞的智駕產(chǎn)品序列上,從 L2 延展到 L4,包含乘用車、商用車,也包括青海大數(shù)據(jù)、天穹超算中心等基礎(chǔ)數(shù)據(jù)設(shè)施。
這其中,商湯絕影扮演了重要的賦能者角色。
據(jù)透露,目前商湯絕影與奇瑞具體合作情況是,絕影提供算法方案,奇瑞負責(zé)工程化落地。
此外也有媒體報道,商湯絕影選擇直接給奇瑞交付白盒方案。
在方案商的視角里,算法方案作為核心資產(chǎn),完全暴露給車企,是一步險棋。
但商湯絕影選擇不對車企設(shè)防線,原因可能有兩點。
一是建立信任關(guān)系。
商湯絕影似乎在極力給車企釋放一種真誠合作的態(tài)度。
王曉剛表示,「絕影」一詞源于曹操的汗血寶馬,它隨曹操四處征戰(zhàn),所向披靡。在這層寓意上,商湯絕影建立了深刻自我認知。
「我們團隊如同千里馬一樣,忠誠可靠,迅速全面助力合作伙伴在競爭中領(lǐng)先卓越?!顾毖浴?/p>
所以,交白盒正是完全打消車企卡脖子的顧慮,讓雙方?jīng)]有間隙地開展合作。
二是雙方合作尺度加深。
谷俊麗也大方提到,大卓與奇瑞一起建設(shè)了天穹超算中心,云端算力為 1500 PFlops。
這意味著,雙方已經(jīng)不局限于單獨的項目定點合作,而是深入到云端算力維度,在商湯絕影助力下,大卓可以基于強大的算力體系,建立良性的數(shù)據(jù)訓(xùn)練閉環(huán)。
王曉剛認為,單打獨斗模式早已行不通,AI 公司跟主機廠合作是一個趨勢,并且二者不再是標準化黑盒的交付,更多的是研發(fā)體系對齊、共創(chuàng)共建的過程。
所以,商湯絕影希望能借與奇瑞的合作,打造一個樣本。
在這個樣本中,車企與方案商形成一種互補協(xié)同的生產(chǎn)關(guān)系。
- 車企懂用戶,懂市場,可以發(fā)揮用戶數(shù)據(jù)價值,打通產(chǎn)品交付的最后一公里;AI 企業(yè)通過豐富的 AI 經(jīng)驗、算力資源幫助車企解決模型迭代的效率、性能難題。
谷俊麗同樣認為,整個智能駕駛生態(tài)鏈,要向 PC 時代一樣走進千家萬戶,車企、方案商都必須在生產(chǎn)鏈條上找到站位,找到最匹配的合作伙伴。
當(dāng)然,生態(tài)建設(shè)需要共創(chuàng)共建共享,但生意經(jīng)的另一面是,方案商面臨的殘酷市場環(huán)境。
某種程度上,方案商必須構(gòu)建自己獨特的互補能力,才會引起車企關(guān)注。
商湯絕影的確準備充分,一家方案商能把產(chǎn)品矩陣覆蓋到智能座艙、智能駕駛、世界模型三個層面,的確是業(yè)內(nèi)少數(shù)派。
這也意味著,如果與奇瑞的樣本打造成功,商湯絕影可以打破橫亙在面前的端到端「量產(chǎn)」高墻。
現(xiàn)在,它迫切需要用這個機會證明自己。