作者 |??汪越,編輯?|??心緣
30多位機器人和具身智能行業(yè)大拿中關村圍爐談話。
智東西12月2日報道,11月27日,2024年中關村仿生機器人大會在北京海淀舉行,邀請了30多位機器人和具身智能領域的院士、學術專家和企業(yè)家作分享。
他們暢聊了人形機器人產(chǎn)業(yè)的核心壁壘與落地難點,密集輸出數(shù)據(jù)集建設、系統(tǒng)設計、具身智能算法、世界模型、AI Agent、靈巧手操作、應用場景與量產(chǎn)時機、傳感器、本體感知控制、大腦類器官、人工肌肉、算力資源等諸多熱點干貨。會上足足有16家明星人形機器人公司的創(chuàng)始人分別發(fā)表演講或參與圓桌討論。
據(jù)智東西此前統(tǒng)計,今年有33家國內(nèi)人形機器人創(chuàng)企公布新融資,公開融資總額超過50億元。(人形機器人融資,爆爆爆!)其中,優(yōu)必選聯(lián)合創(chuàng)始人兼CTO、國家地方共建具身智能機器人創(chuàng)新中心總經(jīng)理熊友軍分析了未來人形機器人技術的三大趨勢。銀河通用創(chuàng)始人,北京大學前沿計算研究中心助理教授、博士生導師,北京智源人工智能研究院具身智能研究中心主任王鶴指出目前高質量數(shù)據(jù)集仍欠缺。星動紀元創(chuàng)始人兼CEO陳建宇談到可以通過使用世界模型協(xié)同學習來解決數(shù)據(jù)質量問題;宇樹科技創(chuàng)始人、CEO、CTO王興興談到機器人領域應采用統(tǒng)一的模型,而不是分裂的多模態(tài)大模型;加速進化創(chuàng)始人兼CEO程昊預測具身智能將構建一個龐大的AI Agent生態(tài)系統(tǒng),預計會包含上萬個Agent和百萬級的開發(fā)者。
帕西尼感知科技創(chuàng)始人兼CEO許晉誠說,人形機器人過度對標人類的行為導致產(chǎn)品研發(fā)難度極大;月泉仿生創(chuàng)始人兼CEO李天靈、松延動力技術副總監(jiān)覃幫羽都談道,人形機器人大規(guī)模應用的關鍵障礙之一是產(chǎn)業(yè)鏈不完善;云深處科技聯(lián)合創(chuàng)始人兼CTO李超說,AI將在提升仿生機器人自適應能力和智能水平方面繼續(xù)扮演核心角色。還有一些專注于做人形機器人靈巧手的創(chuàng)企代表。因時機器人創(chuàng)始人兼CEO蔡穎鵬談道,微型化和柔性化將成為未來關鍵突破點,尤其是在小型精密運動部件的研發(fā)上;靈心巧手聯(lián)合創(chuàng)始人兼CTO周永預測未來傳感器的種類將大幅增加,或超過5至10種。
歐洲科學院院士、哈爾濱工業(yè)大學交叉科學研究中心主任高會軍說,類器官-腦機接口技術是未來創(chuàng)新方向;國家優(yōu)青、清華大學機械工程系的長聘副教授趙慧嬋重點談到“仿生”技術,認為“自清理”機制是提高人工肌肉壽命的關鍵創(chuàng)新。千尋智能聯(lián)合創(chuàng)始人高陽、跨維智能創(chuàng)始人賈奎、國訊芯微CTO兼執(zhí)行總裁蔣琛、樂聚機器人合伙人兼副總裁柯真東、青瞳視覺創(chuàng)始人兼CEO張海威、靈初智能聯(lián)合創(chuàng)始人柴曉杰、他山科技聯(lián)合創(chuàng)始人兼CEO馬揚和北京軟體機器人科技CTO鮑磊,分別分享了他們對數(shù)據(jù)質量、商業(yè)化落地難度、下肢移動和靈巧手、材料應用和感知技術等觀點。
1.優(yōu)必選聯(lián)合創(chuàng)始人熊友軍:解讀人形機器人技術發(fā)展三大趨勢
在優(yōu)必選聯(lián)合創(chuàng)始人兼CTO、國家地方共建具身智能機器人創(chuàng)新中心總經(jīng)理熊友軍的演講中,他分享了人形機器人產(chǎn)業(yè)的最新進展與未來趨勢。
熊友軍稱,人形機器人已經(jīng)進入產(chǎn)業(yè)化落地階段,市場前景巨大。根據(jù)高盛的報告,全球人形機器人市場規(guī)模預計從2023年初的60億美元提升至2035年的380億美元,這一增長將主要得益于出貨量的增加和制造成本的降低。預計到2035年,人形機器人的出貨量將達到140萬臺,且行業(yè)盈利速度將加快。
人形機器人技術已有50多年的發(fā)展歷史。2023年以來,海外企業(yè)已開始將人形機器人應用于實際場景,并計劃在2025年推出多款產(chǎn)品。國內(nèi)科技公司自2018年開始布局,2023年被視為“人形機器人元年”,多家公司已發(fā)布產(chǎn)品并進入量產(chǎn)階段。
熊友軍談道,未來人形機器人技術的發(fā)展呈現(xiàn)三大趨勢:
首先,運動規(guī)劃與控制技術正在向深度學習和模仿學習方法演變。傳統(tǒng)的基于經(jīng)典模型的控制算法和優(yōu)化控制算法,正在被深度強化學習等先進方法取代,從而提升機器人的運動控制能力,尤其是在動態(tài)環(huán)境下的自適應能力。
其次,數(shù)據(jù)集成為了行業(yè)的核心壁壘。熊友軍強調(diào),機器人技術的進步離不開高質量的數(shù)據(jù)集,尤其是跨模態(tài)融合的數(shù)據(jù)生成體系。這些數(shù)據(jù)集用于訓練具身智能體,使機器人能夠更好地理解和處理現(xiàn)實世界中的任務、物體和環(huán)境。因此,建設機器人數(shù)據(jù)生成平臺是一個行業(yè)方向。
最后,具身智能的新范式是“大腦+小腦”的結合。具體來說,AI大模型主要負責任務規(guī)劃(“大腦”),例如支持人與機器的交互,用于寫作、編程、設計和辦公等。具身智能體通過數(shù)據(jù)驅動的端到端技能執(zhí)行(“小腦”)來實現(xiàn)機器人與物理世界的交互,廣泛應用于工業(yè)、商業(yè)、家庭和特種行業(yè)。
2. 銀河通用創(chuàng)始人王鶴:高質量數(shù)據(jù)集仍欠缺
北京銀河通用成立于2023年5月,今年累計融資12億元,以投資方陣容豪華聞名,不僅有美團、科大訊飛等科技名企,還有北京、上海、香港、深圳四大地方國資。
其創(chuàng)始人王鶴也是北京大學前沿計算研究中心助理教授、博士生導師,北京智源人工智能研究院具身智能研究中心主任。王鶴討論了通用機器人在多種應用場景中的潛力,并分享了當前機器人研發(fā)中的關鍵進展。
目前,主流的機器人訓練數(shù)據(jù)收集方法是通過遙控操作(teleoperation)。這種方法是指人類遠程控制機器人,收集不同環(huán)境下的動作和感知數(shù)據(jù)。特斯拉等公司通過遙控操作提供了大量的訓練數(shù)據(jù)。
此外,谷歌團隊近期開發(fā)了一個名為OpenVLA的大模型,用于機器人訓練。該模型被設計為能夠在不同的環(huán)境、物體和擺放方向下進行訓練,但現(xiàn)實中的效果卻不理想,幾乎無法成功抓取物體。王鶴談道,數(shù)據(jù)的不足、雜亂和質量不高是導致這一問題的核心原因。
相比自動駕駛,機器人技術的復雜性更高,特別是在物理交互方面。為了提高機器人的適應性,訓練所需的數(shù)據(jù)不僅需要數(shù)量龐大,還必須具備極高的質量。這意味著,機器人訓練的第一步必須從二維視覺提升至三維世界,這樣才能更好地模擬現(xiàn)實環(huán)境中的物體和場景。然而,單靠傳感器不足以解決這一問題,必須依賴大模型的深度學習,才能提升機器人對復雜幾何信息的理解。
王鶴進一步談道,機器人抓取動作的學習至關重要。通過深度傳感器技術,機器人能夠更精確地感知周圍環(huán)境和物體的三維信息。深度傳感器通過激光或紅外線等技術測量物體與傳感器之間的距離,能夠幫助機器人準確感知并理解物體形狀,進而做出更有效的抓取動作。在這一過程中,機器人通過監(jiān)督學習獲取動作標簽,從而逐步掌握如何執(zhí)行各種任務,包括精準抓取。
3.宇樹科技王興興:人形機器人是通過AGI最大捷徑
宇樹科技成立于2016年,今年B2輪單筆融資額近10億元,是2024年人形機器人領域單筆融資額最大的公司,投資方包括美團、深創(chuàng)投、中國互聯(lián)網(wǎng)投資基金等。
其創(chuàng)始人、CEO、CTO王興興談道,深度強化學習算法已在四足機器人和人形機器人中得到充分驗證,但在手臂和手指操作方面,是否能夠同樣實現(xiàn)成功應用仍是一個待解的問題。
當前,許多機器人使用觸覺感知來操作三指力控靈巧手,但如果能夠實現(xiàn)本體感知控制,就可以避免依賴外部傳感器,從而簡化操作系統(tǒng)。
關于運動控制,王興興說,目前的挑戰(zhàn)是如何通過一個統(tǒng)一的模型來實現(xiàn)各種全身運動?,F(xiàn)有的強化學習方法雖然已在仿真環(huán)境中取得一定成效,但其效率仍然較低,且當這些算法移植到實際機器人上時,由于硬件差異,往往會產(chǎn)生許多偏差。
王興興還談道,目前許多大語言模型存在幻覺問題,即它們?nèi)狈壿嬎伎寄芰?,像人做夢一樣迷失在?shù)據(jù)海洋中,無法區(qū)分真假和對錯。要實現(xiàn)具身智能的目標,必須將強化學習與實際機器人數(shù)據(jù)相結合。對于復雜的機器人系統(tǒng)來說,直接用實物機器人進行機器學習是至關重要的。
王興興說,當前AI模型的最大問題在于缺乏自我理解和學習的能力。現(xiàn)有的AI模型架構通常是純數(shù)據(jù)驅動的,即數(shù)據(jù)越多,模型能力越強。但這種方式導致了AI模型的泛化能力較差,難以適應新的場景和任務。王興興設想了一個理想中的AI智能模型——一個能夠自我持續(xù)學習、理解、推理的完備模型。這種模型從小數(shù)據(jù)開始,通過持續(xù)的強化學習,能夠實現(xiàn)指數(shù)級增長和快速學習。
在談到世界模型時,他說,這種模型可能實現(xiàn)了理想中AI的自我迭代能力,并且能使機器人越來越快速地學習和增強能力。此外,行業(yè)未來需要的是統(tǒng)一的模型,而非分裂的多模態(tài)大模型。例如,靈巧手的操作本質上與機器人的導航避障和決策問題類似,完全可以通過一個統(tǒng)一的模型來實現(xiàn)。
最后,王興興總結道,人形機器人是通往AGI的一條捷徑。當前的GPT模型主要處理文本數(shù)據(jù),缺乏足夠的認知理解能力。未來,可能需要首先實現(xiàn)類似動物的認知理解能力的AI模型,再進一步發(fā)展成人類認知能力的AI模型。
4.星動紀元創(chuàng)始人陳建宇:世界模型與zero-shot泛化能力是未來?
星動紀元成立于2023年,是一家由清華大學持股的人形機器人公司。今年1月,該公司獲得了來自聯(lián)想創(chuàng)投等機構超過億元人民幣的天使輪投資。其創(chuàng)始人陳建宇也是清華大學交叉信息研究院的助理教授。
陳建宇談道,當前的技術趨勢是將自然語言處理模型(如ChatGPT)與機器人技術結合,打造“原生”機器人模型。該模型具有全模態(tài)特點,能夠與物理世界進行全面的交互,并采用端到端架構,無需復雜編程或人類先驗知識,從而提高系統(tǒng)的通用性和靈活性。通過這一架構,具身智能體能夠在簡潔的算法下實現(xiàn)規(guī)?;╯caling up)。
在實現(xiàn)通用具身智能體的過程中,陳建宇強調(diào)了三個核心要素:本體、算法和數(shù)據(jù)。他說,本體與算法需要聯(lián)合優(yōu)化,而數(shù)據(jù)和算法也應通過反饋優(yōu)化,以不斷提升系統(tǒng)性能。此外,本體反饋數(shù)據(jù)進一步推動優(yōu)化。
關于數(shù)據(jù),陳建宇說,構建通用具身智能體需要大規(guī)模、高質量的專門數(shù)據(jù)。GPT-3的訓練數(shù)據(jù)已經(jīng)達到45TB,類似的大規(guī)模數(shù)據(jù)集對提高機器人智能至關重要。除了傳統(tǒng)的文本和圖像數(shù)據(jù),行為、觸覺等來自現(xiàn)實世界的反饋維度也必不可少,這些數(shù)據(jù)能夠幫助機器人更好地理解環(huán)境。
在算法方面,陳建宇談道,通用、可擴展的具身智能算法研究是關鍵。像預測下一個Token這樣的算法將是未來具身智能研究的重要方向,能夠在不同情境下做出智能決策。
陳建宇還談道,當前的研究通過將大規(guī)模視頻數(shù)據(jù)與機器人數(shù)據(jù)融合進行預訓練,盡管數(shù)據(jù)質量仍面臨挑戰(zhàn)。可以通過世界模型協(xié)同學習來優(yōu)化數(shù)據(jù)質量來解決該問題,從而提升機器人的感知和理解能力。他還提到了具身智能體的zero-shot泛化能力,即機器人能夠在沒有預訓練的情況下,處理新的、未知的任務和環(huán)境。
最后,陳建宇基于機器人圖靈測試的概念,提出了一個問題:機器人是否能通過圖靈測試,自動執(zhí)行任務而無需遙控操作?這是他對機器人是否能夠具備與人類相似智能的深入思考。
5.加速進化程昊:具身智能生態(tài)將包含上萬個AI Agent
加速進化成立于2023 年,今年9月完成了億元Pre-A系列輪融。其團隊核心成員出身于清華機器人控制實驗室及清華火神足球隊。其創(chuàng)始人兼CEO程昊在演講中重點討論了具身智能領域的行業(yè)發(fā)展、技術迭代和開發(fā)者生態(tài)。
程昊談道,移動互聯(lián)網(wǎng)的載體是智能手機,而具身智能的終局是人形機器人。
程昊說,具身智能仍處于初期階段,未來將經(jīng)歷多輪迭代。具體而言,當前正處于TPMF(技術產(chǎn)品匹配)的第一輪產(chǎn)品化階段,雖然許多公司已展示出相關技術的Demo,但這些并未轉化為實際落地的產(chǎn)品?,F(xiàn)階段,具身智能的應用場景主要集中在科研、教育、競賽和展覽等領域,并且隨著技術的發(fā)展,開發(fā)成本正在逐步降低。
在談到具身智能的未來時,程昊分享了他對具身智能的全景圖構想:具身智能將構建一個龐大的AI Agent生態(tài)系統(tǒng),預計將包含上萬個Agent和數(shù)百萬開發(fā)者。這一生態(tài)系統(tǒng)需要強大的端側支持(設備端計算與處理能力)和云側支持(云端計算與數(shù)據(jù)存儲)。最終的模型可能是基于具身算法,核心是開發(fā)者能夠將這些算法應用到機器人中,使其成為具體的AI Agent。
程昊還談道,開發(fā)者的遷移是具身智能發(fā)展的一個重要趨勢。他指出,開發(fā)者將從PC時代的軟件開發(fā)者、到互聯(lián)網(wǎng)時代的網(wǎng)站開發(fā)者、再到移動互聯(lián)網(wǎng)時代的APP開發(fā)者,最終遷移到AI時代的具身開發(fā)者。然而,當前具身智能領域仍處于起步階段,開發(fā)者面臨諸多困難,必須首先完善開發(fā)者生態(tài)。隨著開發(fā)平臺的成熟,更多開發(fā)者將能參與其中,共同推動人形機器人技術的普及與應用。
6.哈工大高會軍:探索類器官如何與機器智能融合
在歐洲科學院院士、哈爾濱工業(yè)大學交叉科學研究中心主任高會軍的演講中,他重點介紹了類器官領域的最新研究進展,特別是類器官與腦機接口的結合,作為一個全新的前沿研究課題。近年來,類器官作為體外模擬人體器官功能的生物模型,逐漸成為疾病研究的重要工具,相關研究成果也頻繁出現(xiàn)在Nature和Science等頂級期刊上。
目前類器官普遍依賴人工培養(yǎng),且在自然再生過程中存在一致性差、批次效應嚴重和細胞組成單一等問題。這使得類器官難以實現(xiàn)標準化批量生產(chǎn),從而限制了其在醫(yī)學轉化中的應用。解決這一問題的關鍵在于如何將類器官的自然再生過程轉變?yōu)榭煽氐脑偕^程,這仍然是當前研究中的一大難題。
高會軍談道,類器官再生的研究涉及三個核心問題:如何對細胞進行顯微操作、分析類器官再生的機制、以及如何智能控制類器官的生長過程。針對這些問題,研究者已將研究領域細分為多個方向,包括生物材料合成、類器官芯片、細胞間通訊機制等方面。
在未來的研究方向上,類器官將在以下四個領域引領未來發(fā)展:
1、利用心肌細胞驅動機器人,類似于哈佛大學2022年基于生物組織制造的自發(fā)運動機器人。
2、發(fā)展機器-類器官混合計算系統(tǒng),探索自然智能與人工智能的融合。
3、AI與自然智能的結合,利用類器官替代傳統(tǒng)AI實現(xiàn)類似人類智能的行為。
4、創(chuàng)新的類器官-腦機接口技術,將類器官作為新的腦機接口,取代傳統(tǒng)芯片接口,提供更自然的人機交互體驗。
7.清華大學趙慧嬋:“自清理”機制提高人工肌肉壽命,感知向力觸和復雜形狀發(fā)展
在國家優(yōu)青、清華大學機械工程系的長聘副教授趙慧嬋的演講中,她探討了軟體機器人領域的發(fā)展背景、關鍵技術進展,以及柔性人工肌肉的應用。她談道,機器人發(fā)展已有70多年,但現(xiàn)有機器人在特殊環(huán)境適應和人機接觸方面仍面臨挑戰(zhàn)。因此,構建更加安全、柔順、生物兼容的機器人本體是軟體機器人技術發(fā)展的重要方向。
趙慧嬋介紹了機器人柔性驅動技術的三大關鍵:柔性驅動、外界感知,以及本體設計方法與應用形態(tài)。
關于機器人柔性驅動,趙慧嬋說下一代機器人的驅動器是高性能人工肌肉。人工肌肉作為一種重要的柔性驅動技術,雖然已經(jīng)取得一定進展,但但尚未形成工業(yè)化應用。挑戰(zhàn)主要在于驅動電壓過高,接近材料的擊穿極限,以及材料的退化和壽命較短。解決方案是,通過電流對瑕疵點進行絕緣,從而確保材料在長時間使用中的穩(wěn)定性,這被稱為“自清理”機制。
有了這些核心技術,人工肌肉就能廣泛應用于昆蟲級仿生機器人、微細管道的探測與檢修以及柔性微型隔膜泵等領域。趙慧嬋談道,人工肌肉技術經(jīng)歷了從低電壓驅動到高功率、高頻率驅動,再到多介質驅動的發(fā)展。目前,人工肌肉技術的關鍵突破之一是新型構型的開發(fā)。未來的挑戰(zhàn)包括將人工肌肉技術應用于更極端的環(huán)境,擴大制備工藝以實現(xiàn)大規(guī)模制造,并進一步提高技術的壽命,力求在現(xiàn)有基礎上再提升1至2個壽命極限。
在感知方面,趙慧嬋談道,過去的研究主要依賴基于光學原理的柔性光波導技術,使得機器人能夠感知應變、氣壓變化和手指的觸覺力度等信息。現(xiàn)在,感知技術的研究正朝著多向力感知發(fā)展。具體而言,新的軟材料被用來制造微小電片,通過這些電片,機器人可以實現(xiàn)三向力感知。該技術可以布置在機械手指尖或協(xié)作機械臂的外表面,只需貼上即可實現(xiàn)感知。
除了力觸感知,趙慧嬋還談到了復雜形狀感知的進展。由于機器人本體的形狀通常為復雜的三維結構,趙慧嬋稱,利用更先進的光學檢測技術,機器人現(xiàn)在能夠對復雜三維形狀進行重構,并實時獲取整體的本體形態(tài)。通過這些技術,機器人不僅能夠感知力的變化,還能更加準確地了解自身形態(tài)和與環(huán)境的互動。
8.圓桌對話之具身智能:受數(shù)據(jù)、算力限制未來一兩年落地難度大
在圓桌論壇環(huán)節(jié)中,圍繞“AI驅動機器人進入具身智能時代”這一主題,北京郵電大學“拔尖人才”教授、中國人工智能學會認知系統(tǒng)與信息處理專委會秘書長方斌主持了討論。
與會嘉賓包括千尋智能聯(lián)合創(chuàng)始人、清華大學交叉信息學院博導、清華大學視覺與具身智能實驗室主任高陽,跨維智能創(chuàng)始人、香港中文大學(深圳)終身教授賈奎,以及國訊芯微CTO兼執(zhí)行總裁蔣琛。
千尋智能成立于2024年1月,是一家具身智能機器人研發(fā)商,今年8月完成了2億元天使輪融資,投資方為順為資本;跨維智能成立于2021年6月,是一家以Sim2Real技術為核心的人工智能企業(yè),今年5月完成了A輪融資,投資方包括聯(lián)想創(chuàng)投,廣州華南理工資管。
高陽首先討論了“scaling law”在具身智能中的應用,特別是與數(shù)據(jù)和大語言模型相關的研究。高陽說,具身智能與大語言模型的最大不同在于,具身智能并沒有無限的數(shù)據(jù)源,因此在構建具身智能的“scaling law”時需要特別考慮這一點。
高陽談道,據(jù)研究,在通用場景中,機器人只需幾千條數(shù)據(jù)即可實現(xiàn)任務的廣泛泛化。這意味著,通過相對較少的數(shù)據(jù)量,具身智能能夠有效地應對多種任務,表現(xiàn)出較強的適應能力和靈活性。
然而,賈奎對高陽的結論提出了不同看法。賈奎說,現(xiàn)實情況遠比理論推斷復雜,特別是在不同異構數(shù)據(jù)之間存在顯著差異的情況下,幾千條數(shù)據(jù)的量級并不足以支撐機器人在復雜環(huán)境下的任務泛化。
幾千條數(shù)據(jù)通常屬于一維信號,而在感知層面的復雜度要高得多,尤其是在信息量較大的情境下,如圖像拍攝或三維數(shù)據(jù)的處理。賈奎說,單憑幾千條數(shù)據(jù)難以實現(xiàn)數(shù)據(jù)泛化,數(shù)據(jù)量至少要達到上億條才能有效支持機器人的智能行為。此外,如何構建高效的數(shù)據(jù)管道和工具鏈,降低成本并推動應用落地,才是當前面臨的真正挑戰(zhàn)。
蔣琛從芯片算力的角度談到了具身智能面臨的困難。他說,當前的具身智能仍處于非常早期的階段,且面臨著算力限制。對于VLA模型(超大規(guī)模語言模型)而言,尚不明確該模型需要多少參數(shù),以及哪些數(shù)據(jù)是基于真實世界的數(shù)據(jù),哪些是基于模擬數(shù)據(jù)。蔣琛談道,現(xiàn)有的算力限制了具身智能的進一步發(fā)展,并且預計未來1至2年內(nèi),具身智能應用落地的實現(xiàn)難度仍然較大,難以迅速突破。
在討論行業(yè)共識和共同構建數(shù)據(jù)集的問題時,高陽談道,雖然一些基準測試(benchmark)已經(jīng)取得了一定進展,但機器人領域尚未形成一個普遍認可的標準基準。特別是機器人技術需要與環(huán)境進行交互,因此創(chuàng)建通用的基準測試標準非常困難。高陽舉例說,李飛飛教授的行為數(shù)據(jù)集(behavior 100k)就是一種嘗試,或許可以通過提升指標和進行算法比較來推動這一領域的研究進展。
賈奎補充道,在不同硬件環(huán)境下的機器人系統(tǒng),模擬和真機之間的差異使得標準化和比較變得困難。當前的研究應多做嘗試,并加大投入,以推動技術的進步。
蔣琛從數(shù)據(jù)質量出發(fā),談到了只有在高質量數(shù)據(jù)集的支持下,機器人系統(tǒng)才能實現(xiàn)有效的標準化。當前,數(shù)據(jù)集的來源尚未標準化,這導致了后續(xù)的標準化工作變得困難,無法形成統(tǒng)一的基準測試。此外,現(xiàn)在的運動捕捉(動捕)數(shù)據(jù)等可能并非高質量數(shù)據(jù),未來大概率會被淘汰,但它們目前占用了大量的GPU算力。蔣琛補充道,將高質量數(shù)據(jù)集的采集作為核心研究命題,解決數(shù)據(jù)質量問題是推動具身智能發(fā)展的關鍵。
9.圓桌對話之人形機器人:靈巧手是突破關鍵,多重挑戰(zhàn)阻礙發(fā)展
在山東大學教授、博士生導師張偉的主持下,樂聚機器人合伙人兼副總裁柯真東、青瞳視覺創(chuàng)始人兼CEO張海威、帕西尼CEO許晉誠、月泉仿生CEO李天靈,以及松延動力技術副總監(jiān)覃幫羽,圍繞當前人形機器人研發(fā)的技術突破、瓶頸問題以及未來商業(yè)化落地展開了深入討論。
青瞳視覺創(chuàng)立于2015年,專注于3D智能感知和人機交互系統(tǒng)的研發(fā);帕西尼成立于2021年,是一家觸覺傳感器和人形機器人公司,今年5月已完成數(shù)億元A輪及A1輪融資,投資方包括新奧資本、北汽產(chǎn)投、南山戰(zhàn)新投等機構。
在談到當前階段人形機器人技術的重點時,與會嘉賓普遍認為,上半身的靈巧操作更加重要。覃幫羽談道,大部分應用場景下,機器人手部的抓取和操作是核心任務,而下半身的移動則更依賴于具體場景的需求。李天靈說,雖然雙足機器人移動仍面臨高能耗問題,但在實現(xiàn)目標時,機器人手部的靈巧操作才是突破的關鍵。
許晉誠也說,雖然下肢的選擇性較多,但上肢的通用工具能力才是推動機器人廣泛應用的關鍵因素。張海威稱,復雜環(huán)境下任務完成的關鍵仍然是雙手,靈巧手加遙操作將是未來的核心技術方案??抡鏂|談道,隨著技術發(fā)展,移動不再是限制因素,未來的重心可能會轉向極限應用場景中對下肢移動的需求。
討論進一步聚焦到當前人形機器人研發(fā)中的最大技術瓶頸。柯真東說,當前最大的問題是缺乏足夠的高質量數(shù)據(jù),尤其是用于泛化操作的數(shù)據(jù)來源存在較大爭議。隨著技術的不斷進步,這一瓶頸可能會被突破,但現(xiàn)階段數(shù)據(jù)問題仍然困擾著研發(fā)。
張海威談道,產(chǎn)業(yè)化目標下的最大挑戰(zhàn)是可用性、成本和續(xù)航問題,首要任務是解決機器人的可操作性和泛化能力。
許晉誠談道,人形機器人與人類進行對標的挑戰(zhàn)很大,產(chǎn)品定義的不明確使得這一對標困難重重,未來需要更加收斂的設計方向。李天靈補充道,科研突破到工程化應用的轉化過程中,材料選擇與供應鏈的問題是難點。覃幫羽說,除了數(shù)據(jù)問題,算法的部署與硬件一致性、電池能源問題也是制約技術發(fā)展的瓶頸,此外,產(chǎn)業(yè)鏈尚未成熟,成本依舊高昂。
在討論到未來5年人形機器人商業(yè)化的落地及行業(yè)爆發(fā)點時,柯真東談道,當前機器人最有潛力的應用場景仍然是科研領域,工業(yè)應用也在逐步落地,但要達到理想的投入產(chǎn)出比(ROI),還需要時間。他預計,隨著數(shù)據(jù)能力和作業(yè)效率的提升,機器人將在服務行業(yè)和家庭場景中逐漸嶄露頭角,但具體量產(chǎn)的時機尚不明朗。
張海威說,由于工業(yè)場景的應用要求較高,而家庭生活場景的需求體量更龐大,因此未來人形機器人在家庭中的應用前景更為廣闊。許晉誠稱,產(chǎn)業(yè)應用將率先取得突破,特別是在規(guī)則明確的場景中,而家庭場景的挑戰(zhàn)則主要來源于對機器人的評價標準問題。
李天靈談道,目前人形機器人在工業(yè)場景中已有應用,不過終極目標仍是進入家庭,尤其是在陪護等領域的需求逐漸明確。覃幫羽說,人形機器人和工業(yè)機器人存在本質差異,人形機器人難以替代大部分工業(yè)機器人應用,但其在家庭陪護等領域的潛力巨大,短期內(nèi)可以從娛樂導覽和科研教育等場景入手。
10.圓桌對話之仿生機器人:三大技術創(chuàng)新趨勢,傳感器或將超過10種
在這場圓桌論壇中,多個專家圍繞仿生機器人技術的發(fā)展現(xiàn)狀與未來趨勢進行了探討。論壇由南京航空航天大學教授、神源生智能董事長戴震東主持,參與的嘉賓包括云深處科技聯(lián)合創(chuàng)始人兼CTO李超、因時機器人CEO蔡穎鵬、靈心巧手CTO周永、靈初智能聯(lián)合創(chuàng)始人柴曉杰、他山科技聯(lián)合創(chuàng)始人兼CEO馬揚和北京軟體機器人科技CTO鮑磊。
云深處科技成立于2017年,是一家四足仿生機器人研發(fā)商;因時機器人成立于2016年,提供機器人核心零部件以及整機解決方案;靈初智能成立于2024年,致力于打造通用操作智能體;他山科技成立于2017年,是一家人工智能觸覺傳感芯片創(chuàng)企。
在討論單元模塊的技術創(chuàng)新時,蔡穎鵬提出了微型化、一體化和柔性化(力控)三個發(fā)展趨勢。他補充道,底層技術的創(chuàng)新是關鍵,尤其是在如何將不同領域的技術痛點統(tǒng)一方面,例如小型化精密部件的研發(fā)。
關于感知與機械手的關系,周永說,機械手本質上只是一個載體,所有的智能操作都依賴于感知技術。他談道,未來仿生機器人將采用多種傳感器進行數(shù)據(jù)采集,目前的主要技術路線有兩種:一是側重力傳感的自動化路線,二是側重視覺感知。周永預測,未來傳感器將大量應用,種類或超過5至10種。
在材料應用方面,柴曉杰談道,高性能材料(如碳纖維和高強度硅膠)可以減少機器人在復雜應用中的誤操作和碰撞風險,提高安全性,并降低生產(chǎn)成本。此外,觸覺傳感器的性能也與材料的選擇息息相關,良好的材料可以提升觸覺反饋的穩(wěn)定性和靈敏度,從而改善機器人在實際場景中的表現(xiàn)。
關于觸覺傳感技術,馬揚談道,觸覺傳感與視覺傳感的最大區(qū)別在于其需要更高密度的傳感器布置,依賴快速反應和高精度感知。當前,觸覺傳感的前端技術面臨的主要挑戰(zhàn)是如何在硬件層面提供支持,尤其是在邊緣計算中實現(xiàn)高效的數(shù)據(jù)處理。
在未來技術發(fā)展上,李超預測,AI將在仿生機器人中繼續(xù)扮演重要角色,推動機器人的自適應能力和智能水平進一步提升。蔡穎鵬說,微型化和柔性化將成為未來技術突破的關鍵,尤其是在精密小型運動部件的開發(fā)上。馬揚談道,觸覺技術與力控技術將在醫(yī)療、家居和工業(yè)自動化等領域的精細操作中發(fā)揮重要作用。
11.結語:機器人行業(yè)尚未形成共識
數(shù)據(jù)量和數(shù)據(jù)質量的不足被廣泛認為是制約機器人在復雜環(huán)境中實現(xiàn)任務泛化的主要障礙。雖然關于機器人泛化所需的具體數(shù)據(jù)量級仍存在不同看法,但建設高質量的數(shù)據(jù)集已成為行業(yè)的共識。此外,芯片算力的局限性也限制了機器人廣泛應用的可能性。而在軟體機器人領域,力控感知和復雜形狀感知已成為研究的關鍵方向。目前,機器人行業(yè)的各家公司,無論是專注硬件、軟件,還是深度學習或大模型的研發(fā),都面臨著方法論和數(shù)據(jù)集不統(tǒng)一的問題。這一現(xiàn)象與ChatGPT等AI應用不同,機器人不僅涉及復雜的硬件設計,還需應對與物理環(huán)境交互的適應性和智能化問題。
(本文系網(wǎng)易新聞?網(wǎng)易號特色內(nèi)容激勵計劃簽約賬號【智東西】原創(chuàng)內(nèi)容,未經(jīng)賬號授權,禁止隨意轉載。)