作者 |??程茜,編輯?|??漠影
聚焦具身大模型和機器人整機,海淀設(shè)立三個“小目標(biāo)”。
智東西4月29日報道,024中關(guān)村論壇年會盛大落幕。其中,首次舉辦的主題日活動「人工智能主題日」為學(xué)術(shù)大牛、企業(yè)代表與參會觀眾打造了一場探索未來人工智能發(fā)展趨勢的高規(guī)格交流平臺。
其中,堪稱當(dāng)下最熱門話題的具身智能引爆了當(dāng)日幾波小高潮。中關(guān)村科學(xué)城管委會副主任、海淀區(qū)副區(qū)長唐超發(fā)布了海淀區(qū)《打造全國具身智能創(chuàng)新高地三年行動方案》(以下簡稱《行動方案》)。這也是海淀區(qū)政府首次專門針對具身智能的細(xì)化行動方案發(fā)布。
《行動方案》重點聚焦具身大模型和機器人整機,部署六大行動,力爭到2026年,初步建成全國具身智能原始創(chuàng)新策源地、應(yīng)用示范新高地和產(chǎn)業(yè)加速集聚地,成為國內(nèi)參與全球具身智能競爭的核心力量。
其中重點提到三個“小目標(biāo)”:
1、突破一批具身智能前沿核心技術(shù),率先研制出國內(nèi)領(lǐng)先、國際先進的多模態(tài)具身大模型和多形態(tài)機器人。
2、打造一批具身智能標(biāo)桿應(yīng)用示范,率先實現(xiàn)具身大模型在萬臺機器人上的融合應(yīng)用。
3、集聚一批具身智能創(chuàng)新團隊,率先培育出具有國際競爭力的領(lǐng)軍企業(yè)。
中關(guān)村科學(xué)城產(chǎn)業(yè)四處處長陳鐳在與智東西等媒體交流時提到,《行動方案》是政府與海淀區(qū)頭部機器人企業(yè)共同探討、反復(fù)思考的最新成果。具身智能的創(chuàng)新迭代飛速進行,政府將建立為創(chuàng)新主體解決共性難題的數(shù)據(jù)共享、訓(xùn)練平臺。
他補充說,今年年內(nèi),依據(jù)《行動方案》要與頭部玩家探討清楚創(chuàng)新中心等平臺的具體模式、組合形式、牽頭方等,銜接好機器人企業(yè)、場景方、科研機構(gòu)。
此外,在未來人工智能先鋒論壇圓桌對話環(huán)節(jié),由智源研究院院長王仲遠(yuǎn)主持,7位國內(nèi)具身智能領(lǐng)域代表性的創(chuàng)業(yè)者及研發(fā)負(fù)責(zé)人同臺輸出對具身智能的發(fā)展思辨。
包含星動紀(jì)元創(chuàng)始人陳建宇,傅利葉智能創(chuàng)始人兼CEO顧捷,智元機器人聯(lián)合創(chuàng)始人、上海人工智能研究院院長宋海濤,銀河通用機器人創(chuàng)始人、智源具身智能研究中心負(fù)責(zé)人王鶴,宇樹科技創(chuàng)始人兼CEO王興興,小米機器人團隊負(fù)責(zé)人許多,ACM會士李航7位嘉賓。
包括數(shù)字世界中是否有可能實現(xiàn)通用人工智能,以及具身智能興起的意義、重要特征與系統(tǒng)性工程、與AI智能體如何協(xié)同、研發(fā)與工程挑戰(zhàn)、仿真數(shù)據(jù)與現(xiàn)實數(shù)據(jù)兩種路線、技術(shù)發(fā)展與產(chǎn)業(yè)應(yīng)用等。
1.具身智能發(fā)展已成業(yè)界共識海淀區(qū)機器人創(chuàng)新優(yōu)勢凸顯
具身智能當(dāng)之無愧是當(dāng)下AI產(chǎn)業(yè)的一大熱潮,并成為通往AGI(通用人工智能)的重要路徑。
相比于語言、圖像、視頻等非具身大模型,擁有身體的具身大模型可以直接與物理世界進行交互。因此,陳建宇認(rèn)為,通過具身智能實現(xiàn)AGI非??赡埽呱碇悄芗染邆湔Z言和圖像的理解能力,還能控制身體。從這一概念被提出起,主要的觀點就是通過和物理世界的交互促進人的智能發(fā)展,但沒有身體的智能會缺失很多交互的方式。
王鶴也表達(dá)了相同的觀點:“具身智能與非具身智能互補,其全集才是AGI?!?/p>
他用“讀萬卷書,行萬里路”進行類比,互聯(lián)網(wǎng)的圖文信息是“讀萬卷書”,讓智能體理解人類的思維,但這無法替代“行萬里路”,需要依靠具身智能賦予智能體身體,以及和物理世界交互并從中學(xué)習(xí)的能力。
宋海濤認(rèn)為通往AGI之路非常漫長,具身智能是其中的一個關(guān)鍵里程碑。
可以看出,具身智能的發(fā)展迭代迫在眉睫,與此同時,具身智能仍處于發(fā)展初期,未達(dá)產(chǎn)業(yè)發(fā)展的臨界點。具身智能是系統(tǒng)性的工程,目前硬件和軟件在發(fā)展速度上并不匹配,硬件的突破、數(shù)據(jù)收集的效率等是困擾產(chǎn)業(yè)的難題。在此背景下,在機器人領(lǐng)域具有得天獨厚優(yōu)勢的海淀區(qū)迅速搶占發(fā)展新先機。海淀區(qū)聚焦了全市40%的企業(yè),人形機器人企業(yè)數(shù)量近200家(占全市半數(shù)以上),包括十余家人形機器人本體企業(yè)(占全市一半以上),有3家本體上市企業(yè)、2家獨角獸企業(yè),清華、北大、北航、北理、中科院等高校院所,銀河通用機器人、智源研究院聯(lián)合研發(fā)了140億參數(shù)量的具身智能多模態(tài)大模型Emu。
此外,海淀區(qū)于4月初承辦了首屆中國人形機器人產(chǎn)業(yè)大會暨具身智能峰會,為企業(yè)搭建交流平臺,激發(fā)思考和討論的同時,觸及更多具身智能相關(guān)合作。
2.以創(chuàng)新中心為核心,重點部署六大行動,突圍技術(shù)突破、應(yīng)用測試、場景部署
基于上述背景,《行動方案》重點部署了六大行動。
一是源頭創(chuàng)新突破行動。重點開展大腦技術(shù)創(chuàng)新、小腦能力突破、腦身系統(tǒng)協(xié)同三項任務(wù),加快突破一批具身智能前沿核心技術(shù)。
具身智能包括機器人本體,和決定其智能化的大腦、小腦、腦身協(xié)同。陳鐳解釋說,目前大腦的研究方向是大模型,讓機器人聽懂人的語言;小腦為控制身體運動,掌握基本運動技能;腦身協(xié)同指機器人的意識訓(xùn)練。
不同于語言、視頻等大模型,具身智能的最大特點在于其要直接和物理世界交互。因此在具體的技術(shù)布局方面,《行動方案》會關(guān)注于多模態(tài)大模型開發(fā),實現(xiàn)機器人的全身協(xié)調(diào)、靈巧操作,并提升數(shù)字世界的模擬能力以及提升虛擬世界到物理世界的遷移技術(shù)。
二是整體產(chǎn)品領(lǐng)跑行動。重點開展機器人整機性能提升,模塊化部組件攻關(guān),加快研制一批國內(nèi)領(lǐng)先、國際先進的多形態(tài)機器人。
現(xiàn)在有一大技術(shù)路線為,人形機器人本體通過傳感器、攝像頭獲得的物理世界數(shù)據(jù)進行訓(xùn)練,慢慢提升智能化。
因此,《行動方案》會重點關(guān)注整機機器人打造,以及伺服器、靈巧手等機器人關(guān)鍵零部件的研發(fā)。陳鐳談道,他們計劃在北京建立一個共享零部件加工中心,以加速機器人的研發(fā)進程。
在這背后,海淀區(qū)政府將打通產(chǎn)業(yè)和科研的資源,加速高校科研成果轉(zhuǎn)化。
三是創(chuàng)新平臺賦能行動。重點打造具身智能創(chuàng)新中心等共性技術(shù)支撐平臺、產(chǎn)業(yè)創(chuàng)新孵化平臺,加快提升樣機研發(fā)、檢驗測試、中試服務(wù)、生產(chǎn)制造等產(chǎn)業(yè)公共服務(wù)能力。
人形機器人的發(fā)展處于早期,很多企業(yè)在研發(fā)階段很難產(chǎn)生利潤空間。因此,陳鐳認(rèn)為,具身智能創(chuàng)新中心可以為企業(yè)提供訓(xùn)練的場景,幫助其獲取更多數(shù)據(jù),從而降低研發(fā)成本。
同時,《行動方案》還會通過合作運營的方式,打造研究院、孵化器、加速期等平臺。
四是應(yīng)用場景示范行動。重點面向科研、工業(yè)、消費等場景,組織實施一批可復(fù)制、可推廣的具身智能應(yīng)用示范工程。
陳鐳透露,目前他們已經(jīng)征集了人形機器人、四足機器人等的應(yīng)用場景方向。此外,諸如小米、聯(lián)想等企業(yè)的工廠總部均位于海淀區(qū),也可以為機器人提供應(yīng)用測試合作的機會。
五是產(chǎn)業(yè)集群建設(shè)行動。重點開展企業(yè)梯次培育,建設(shè)具身智能特色園區(qū),打造有競爭力的產(chǎn)業(yè)集群。
這也是為企業(yè)提供開放測試環(huán)境的重要平臺,陳鐳談道,他們計劃在海淀北部打造機器人小鎮(zhèn),為企業(yè)提供技術(shù)交流的平臺。
六是生態(tài)雨林打造行動。重點加強人才隊伍建設(shè),打造具身智能人才社區(qū)。強化金融賦能,加大市區(qū)基金對具身智能的投資力度。制定標(biāo)準(zhǔn)規(guī)范,提升具身智能科技倫理治理能力。支持建設(shè)具身智能開源社區(qū),舉辦具身智能論壇、峰會、大賽等活動,形成開放合作的產(chǎn)業(yè)生態(tài)。
3.具身智能創(chuàng)業(yè)者、研發(fā)負(fù)責(zé)人同臺,熱議AGI時代終極形態(tài)、技術(shù)突破、應(yīng)用前景
產(chǎn)業(yè)層面,7位嘉賓在圓桌對話環(huán)節(jié),圍繞著具身智能產(chǎn)業(yè)的科技創(chuàng)新和產(chǎn)業(yè)革命進行了思想交鋒。
李航總結(jié)了具身智能的三大特點,機器人有自主性;能基于不同數(shù)據(jù)產(chǎn)生不同智能;結(jié)合多模態(tài)大模型在物理世界不斷演進。
但由于具身智能產(chǎn)業(yè)的發(fā)展尚處早期,對于其終極形態(tài)并沒有明確的定義,但人形目前已成為業(yè)界共識。王興興談道,機器人的形態(tài)對具身智能而言并不重要,只是目前的發(fā)展決定了,人形是社會公認(rèn)的理想形態(tài),可以方便從人的現(xiàn)實生活中采集數(shù)據(jù)?!耙苿涌蛇_(dá)、操作可達(dá)、語義可達(dá)、價值和智慧可達(dá)”是小米理解的機器人產(chǎn)品做到可用的四個層次。許多解釋說,基于這四個目標(biāo),人形是當(dāng)下人們可想象的形態(tài)中最優(yōu)的選擇,但也不排除未來會有超越人類的更多形態(tài)出現(xiàn)。
具身智能的智能化表現(xiàn)除了與機器人本體相關(guān),更為重要的就是軟件,但目前的難點在于兩者研發(fā)并不匹配。對于此,顧捷談道,機器人本體迭代是切入點,因為如果本體自身的任務(wù)完成能力差,就會加大基于其開發(fā)軟件的難度。因此當(dāng)本體迭代、基本應(yīng)用開發(fā)完成后,才會進行本體收斂,以及更豐富應(yīng)用開發(fā)。
許多也認(rèn)為,短期內(nèi)具身機器人的挑戰(zhàn)在于硬件,要突破移動空間可達(dá)做到1cm,手眼協(xié)同做到0.1mm。遠(yuǎn)期來看就是數(shù)據(jù)閉環(huán)的工程效率,上層大模型在硬件上大規(guī)模高效率收集數(shù)據(jù)。
在李航看來,具身智能可能在某個階段,需要軟硬件一起往前推進、優(yōu)化。但未來會有一個很明顯的趨勢,不同的團隊會有不同側(cè)重,既有單獨做軟硬件,也有軟硬兼做的玩家。
數(shù)據(jù)是智能的重要推動力,具身智能最重要的一大瓶頸就是缺乏數(shù)據(jù)。
不同于非具身大模型,人形機器人沒有數(shù)據(jù)集。因此王鶴認(rèn)為,具身智能的數(shù)據(jù)實現(xiàn)0-1可能會完全靠仿真數(shù)據(jù)驅(qū)動。其中最實際的方式就是通過物理仿真,制造模擬在真實世界訓(xùn)練的虛擬世界。
當(dāng)這樣的機器人大規(guī)模存在后,在真實世界中交互的數(shù)據(jù)閉環(huán)最終會成為具身智能的源頭活水,釋放更多的能力。
陳建宇補充說,仿真世界的采集數(shù)據(jù)更快,但其也有局限性,就是難以準(zhǔn)確搭建復(fù)雜場景。因此,他認(rèn)為,機器人前期會通過仿真世界搭建簡單場景學(xué)習(xí),當(dāng)能力迭代到一定程度,就進入真實世界的復(fù)雜環(huán)境采集數(shù)據(jù)。
在技術(shù)路徑之外,面向具身智能的商業(yè)化應(yīng)用前景。業(yè)界都普遍認(rèn)為工業(yè)會是最先落地的。陳建宇稱具身智能在工業(yè)場景3-5年內(nèi)會實現(xiàn)規(guī)模化,進入與人交互更頻繁的場景會需要更長時間。除了工業(yè)場景本身的具體、可重復(fù)性高,適合技術(shù)演進先做出來產(chǎn)生商業(yè)價值的特點外,工業(yè)場景還具有廠商付費意愿高、公眾可感知度高等特點。
宋海濤透露,他們目前在3C制造領(lǐng)域已經(jīng)有了實測,他們主要關(guān)注的場景特點是融合度較高、公眾感知度更強、場景的買單能力更強。
同時,他還強調(diào)了研發(fā)過程中的三個真實,真實的場景、真實的重大工程問題、真實的數(shù)據(jù)。基于此,未來3-5年是具身智能的滲透期,在整個構(gòu)建過程中,以算力+基礎(chǔ)的訓(xùn)練框架構(gòu)成的新型數(shù)字基礎(chǔ)底座形成,5-8年會有快速上量過程。
王鶴談到了更為具體的布局規(guī)劃,從能力的角度,合成大數(shù)據(jù)今年、明年將會出現(xiàn)能做拿取放的通用大模型;機器人成本方面,輪式底盤的機器人成本低于勞動力一年的工資,他們已經(jīng)與某些車廠、商超溝通合作,預(yù)計1-2年起量。
從整個產(chǎn)業(yè)來看,具身智能的發(fā)展突飛猛進,但好的地方在于AI的出現(xiàn)讓產(chǎn)業(yè)中的參與者更為平等。
王興興談道,在AI的世界很平等,技術(shù)的突破更多要靠個人的學(xué)習(xí)能力、思維能力,并且目前來看具身智能的發(fā)展尚未突破臨界點,因此誰能率先突破都有可能。
4.結(jié)語:海淀區(qū)以產(chǎn)業(yè)積累率先拉開具身智能產(chǎn)業(yè)變革大幕
AI主題日落幕,但具身智能作為最具劃時代意義的技術(shù)之一,大幕才剛剛拉開。前沿產(chǎn)業(yè)從底層技術(shù)突破到應(yīng)用場景落地,無不需要經(jīng)過長期且艱難市場的檢驗,這背后離不開財力、人力的大規(guī)模投入。一直以來在人工智能領(lǐng)域率先布局的海淀區(qū),已經(jīng)擁有深厚的創(chuàng)新底座以及產(chǎn)業(yè)集聚優(yōu)勢。海淀區(qū)是全國人工智能創(chuàng)新基礎(chǔ)最好、人才密度最高、研發(fā)能力最強、產(chǎn)品迭代最活躍的地區(qū)。從研發(fā)機構(gòu)、人才、全產(chǎn)業(yè)鏈玩家,到大模型、算力布局等,都為大模型的場景應(yīng)用落地提供了優(yōu)勢條件。這些產(chǎn)業(yè)積累將成為具身智能這一系統(tǒng)性工程的強大底座,依據(jù)《行動方案》將科研院所、機器人企業(yè)、場景方相結(jié)合,推進技術(shù)革新與產(chǎn)業(yè)落地,使得AGI愿景在具身智能的承載下成為現(xiàn)實。
此外,基于《行動方案》,下一步,海淀區(qū)將凝聚各方力量全力保障方案的落地實施,在具身智能共性技術(shù)服務(wù)平臺建設(shè)、重點企業(yè)培育與引進、推進應(yīng)用場景落地、打造具身智能特色園區(qū)等方面持續(xù)發(fā)力,加快形成具身智能創(chuàng)新發(fā)展的良好格局,開啟具身智能產(chǎn)業(yè)發(fā)展新篇章,為打造首都新質(zhì)生產(chǎn)力示范區(qū)貢獻(xiàn)力量。