作者 |??程茜,編輯?|??漠影
AI時代進入下半場,具身智能顛覆生產力。
今年初,家用機器人Mobile ALOHA火爆出圈,炒菜、洗碗、掃地、逗貓、疊衣服樣樣精通,堪稱全能管家;時隔半年,原班團隊再度推出機器人自主導航基礎模型Mobility VLA,機器人在公司轉一圈就能聽從人類語音指令,快速變身導航員。
像這樣逐漸深入我們生活的機器人越來越多,做咖啡、打掃衛(wèi)生、酒店配送,甚至連按摩、作手術、康復訓練等諸多崗位上都出現(xiàn)了機器人的身影。
但即便如此,這些機器人也只是按部就班、聽命行事,距離電影中高度智能的機器人形象仍相距甚遠。
AI技術革命,并非一蹴而就,橫空出世,而是在科技歷史長河中持續(xù)地發(fā)生。2022年底,以生成式人工智能 ChatGPT為起點的大語言模型(LLM),帶來人機對話交互變革。2024年,LAM(大型動作模型)正在起勢,機器人覺醒新紀元來臨。
具身智能已經(jīng)在實際場景中落地應用,重構了生產關系,對生產力起到了顛覆意義,正在助推著新工業(yè)革命。可以說,AI為科幻電影中具有高度智能的機器人走出銀幕搭起了階梯。
作為新質生產力代表的具身智能聯(lián)想晨星足式機器人GS應運而生,這也是大模型與物理世界交互的最領先成果之一,作用于現(xiàn)實世界,具身智能具有更深遠的意義和影響。伴隨2024/2025財年Q1財報,聯(lián)想集團發(fā)布第三季硬核知識科普視頻的第一集《具身智能:人工智能如何成為人》。
視頻中采用了桌面電影形式的融合創(chuàng)新。極具《權力的游戲》風格的開場片頭,以串聯(lián)著機器人領域完整技術發(fā)展關系圖譜的科技樹為線索,帶領觀眾在時間中穿梭,重新探索機器人科技樹圖譜下三個技術路徑的競技與角逐。在講述中同時打碎重構桌面元素,讓信息在觀眾、主角IP和桌面中流動傳遞。
此外,視頻中以英國科技歷史學家、生物化學家、中科院外籍院士李約瑟為原型打造的智能體,也是一大亮點。立足于2100年的賽博版李約瑟,以未來的第一人稱視角首次為觀眾呈現(xiàn)具身智能完整的技術史觀,也在其中展示了新工業(yè)革命時代的革命先鋒——聯(lián)想晨星足式機器人GS如何深入工業(yè)場景,看到聯(lián)想集團使AI向實,幫助千行百業(yè)真正應用AI,釋放生產力還智于業(yè),完成變革,可謂是一支帶有十足革命感和大歷史觀的視頻大片。
01.百年技術角逐碰撞喚醒具身智能機器人
1959年,世界上第一臺機器人Unimate被安裝在汽車工廠的裝配線上,彼時其只能完成輔助汽車生產的簡單、重復任務;60余年后,各種類人、足式機器人出現(xiàn),大型商超、工業(yè)園區(qū)的巡邏安防、全天候的電力巡檢、消防應急救援、做咖啡等諸多場景都出現(xiàn)了機器人的身影。
與機器人形態(tài)發(fā)展的前提是技術的進階,隨著各項能力被慢慢點亮,機器人科技樹逐漸枝繁葉茂。
從聯(lián)想集團財報視頻打造的科技樹起點可看到,最先點亮機器人應用能力的是工業(yè),在第一臺機械手臂Unimate所在的技術路徑上,數(shù)控技術、工業(yè)機器人、機械手臂等技術被點亮。
在此之上,斯坦福大學研究人員發(fā)明的Stanford Arm擁有6個自由度,奠定了工業(yè)機器人的標準化基礎。20世紀70年代初期,第一臺由電動機驅動的工業(yè)機器人FAMULUS問世,ABB機器人(原ASEA)推出IRB 6,世界上首臺全電動微型處理器控制的機器人發(fā)布,使得工業(yè)機器人發(fā)展飛速,科技樹的這一支線也走向成熟。
但機器人的形態(tài)就穩(wěn)固于此了嘛?機器人科技樹發(fā)展的第二條技術路徑給出了答案。在“工業(yè)”技術路徑發(fā)展初期,機器人另一條技術路徑也開始萌芽——“移動”。
這條技術路徑中最直觀的變化就是機器人形態(tài)。1970年前后,美國斯坦福國際研究所開發(fā)了首臺移動機器人Shakey,它可以做到自主感知、環(huán)境建模、行動規(guī)劃并執(zhí)行任務,不過當時受限于計算機體積以及運算速度,Shakey往往需要耗費數(shù)個小時完成任務。
機器人在移動領域的技術節(jié)點被點亮,并且實現(xiàn)了與工業(yè)機器人技術路徑的交叉。這些貫穿著前后數(shù)十年歷程的技術節(jié)點,鑄成了機器人“覺醒之門”的鑰匙,成為讓機器人走出工廠、走進家庭、商場等場景的關鍵技術支持。
科技樹的第三條支線“智能與神經(jīng)”迎來爆發(fā),這也正是打造出能滿足人們對機器人終極幻想的關鍵條件。
1950年,內置光傳感器、觸摸傳感器、推進及轉向電機的電子烏龜誕生,可以摸索著向有光亮的地方前進,并在遇到障礙時改變方向,使得機器人展現(xiàn)出了擁有“生物智慧”的潛力。直到2016年,一場AlphaGo戰(zhàn)勝李世石的世紀決戰(zhàn),成為機器人發(fā)展的標志性時刻。
在智能與神經(jīng)與工業(yè)、移動三支技術支線相互碰撞的時刻,早在1950年就已經(jīng)被提出的智能體、具身智能概念,今年終于展現(xiàn)出了成為現(xiàn)實的可能。
2.嵌入大模型與體驗聯(lián)想具身智能“上崗”三大場景
如今“以機器人之軀,承載AI的靈魂”,已成為當下這一產業(yè)的熱門議題。
智慧最先只出現(xiàn)在虛擬世界當中。
早年間,DeepMind連發(fā)三篇論文,闡釋了通過機器學習教導AI自主學習走路;OpenAI基于強化學習讓智能體掌握了各種捉迷藏套路,并掌握了多種隱藏策略。后來,麻省理工學院的研究小組基于機器學習技術,讓“粘液”機器人具備了改變形狀完成復雜任務的潛力,于是大模型和物理世界產生連接。
這就是視頻中提到的“離身智能”,視頻中呈現(xiàn)的這場1963年的實驗,說明了“離身智能”與“具身智能”的關鍵區(qū)別。
實驗中籠子里的兩只貓,一只可以主動正常行走,另一只只能被動行走,最后的結果是被動行走的貓無法應用對環(huán)境深度感知的能力。
因此,實現(xiàn)具身智能最關鍵的就是自主感知、親身體驗,這也是擴寬機器人在產業(yè)場景中應用空間的先決條件。
機器人此前被應用于具體場景時,往往只能依賴于在軟件中學習的經(jīng)驗,或者僅完成簡單的重復性任務。但對于危險系數(shù)高的環(huán)境、人不方便進入的狹窄危險區(qū)域而言,機器人需要更高的智能屬性,才能應對這些場景,并真正輔助人類完成任務。
正如我們在視頻中看到,從科技樹中具身智能這一節(jié)點走進現(xiàn)實的還有聯(lián)想晨星足式機器人GS,就是當下機器人承載AI靈魂,并能真正滿足企業(yè)對于新質生產力的急迫需求的集大成者。
聯(lián)想集團要做的是真正讓懂人話、會規(guī)劃的機器人走出實驗室,落地到場景中——還智于業(yè)。
聯(lián)想晨星足式機器人GS已經(jīng)從單純的聽令行事,演進為可通過理解自然語言執(zhí)行復雜任務,且能夠自主糾錯應對特殊情況。
根據(jù)面對開放動態(tài)環(huán)境提出的具身導航框架,機器人可以基于大語言模型理解自然語言指令,將復雜指令分解成不同的動作序列,然后機器人基于狀態(tài)、任務需求協(xié)調動作網(wǎng)絡。
在執(zhí)行任務、規(guī)劃行走路徑時,機器人通過大模型和長短記憶可以推測目標方位,從而結合3D語義地圖給出的物體關系對制定目標進行搜尋。
此外,聯(lián)想集團還利用了生成式AI建立典型場景的隨機環(huán)境并加入物理引擎,采用強化學習訓練機器人行走和探索,優(yōu)化探索策略。
在形態(tài)的設計方面,聯(lián)想晨星足式機器人GS也始終服務于落地應用這一終極目標。
不同于常見的四足設計,它基于六足實現(xiàn)了三角靜態(tài)穩(wěn)定步態(tài),擁有能應對全地形的移動能力,爬樓梯、過斜坡、穿越崎嶇路面都不在話下。
另外,運動過程中的穩(wěn)定,也能保證搭載在其之上的傳感器采集到的圖像清晰、穩(wěn)定、一致性強,并能減少磕碰,延長使用壽命。
同時,機器人實際應用場景中為了完整復雜任務往往需要搭載機械臂輔助完成,但受限于穩(wěn)定性等因素,人形、四足機器人等可搭載的機械臂重量有限,而聯(lián)想晨星足式機器人GS負載能力達到100公斤級,因此在實際場景中的應用空間更大。
工業(yè)巡檢操作、應急救援支持、野外勘測任務這三大場景則成為其率先落地應用的任務。
在工業(yè)巡檢操作中,聯(lián)想晨星足式機器人GS可以實現(xiàn)自主巡檢、定位故障、收集數(shù)據(jù),以提供工業(yè)設備的運行效率和安全性。應急救援支持時,會遇到一些極端天氣,達到IP66防水等級的足式機器人可以在災難現(xiàn)場快速響應,實現(xiàn)救援搜救、物資運輸?shù)热蝿?。面對野外地形勘探任務,它還能實現(xiàn)高效精準的地形測繪、資源勘探、環(huán)境監(jiān)測。
還有,聯(lián)想投資的清華系機器人創(chuàng)企星動紀元,已經(jīng)成長為國內人形機器人產業(yè)的代表企業(yè),開發(fā)了具身智能人形機器人全棧技術架構,推出了全尺寸人形機器人XBOT。在不依賴預先編程和遙控操作的情況下,XBOT能完成全自主任務實現(xiàn)和規(guī)劃導航。
此外,人形機器人Figure 02也開始“進廠打工”。不僅外形更像人,還能實現(xiàn)與人類語音對話。Figure 02可直接作用于汽車工廠的生產制造環(huán)境,已具備執(zhí)行通常對人類工人具有挑戰(zhàn)性的復雜任務的能力,如將鈑金件插入特定固定裝置這一汽車底盤組裝中的關鍵步驟。
這一刻機器人的技術革命與場景應用的成果已經(jīng)達到了新的階段,人形、足式、輪式以及各類仿生形態(tài)的機器人落地到工業(yè)場景中,打通物理與信息世界邊界的標志性時刻到來。
3.聯(lián)想集團使AI向實為生產力變革注入強勁動力
聯(lián)想集團首款晨星機器人到如今的晨星足式機器人GS,在形態(tài)、能力變遷中已經(jīng)變?yōu)榱艘慌_擁有感知、思考和行動能力的智能體。
可以說,聯(lián)想晨星足式機器人GS是前沿技術與落地應用,在當下這一發(fā)展節(jié)點碰撞出的必然成功。
再看視頻中的科技樹,其技術延展的進程正在從終身智能、情感智能、倫理與公平到仿生手指,讓這些人類曾賦予無限想象空間的智能體將成為現(xiàn)實。
或許在未來某個時刻,伴隨著機器人科技樹枝椏繼續(xù)延伸,最終的智能體將與人的形象接近重合,從而實現(xiàn)技術狂想與現(xiàn)實世界的交織。
AI領域的技術突破與落地應用的研究一直齊頭并進,人工智能革命正在發(fā)生,我們親身感知到的,或許只是其中分支,而具身智能在新工業(yè)革命中有著更深遠的意義和影響。聯(lián)想集團董事長兼CEO楊元慶說道,聯(lián)想集團要做的就是:“讓人工智能走下云端,真正落地,走進千家萬戶千行百業(yè)?!?/p>
聯(lián)想集團實現(xiàn)機器人從輔助決策、能力增強到實現(xiàn)產業(yè)應用落地的變遷。使AI向實,推動了AI社會的進程,讓AI與千行百業(yè)緊密連接。
真正的AI時代應該基于以人為本、多元豐富的智能技術理念,將效率優(yōu)勢和創(chuàng)新優(yōu)勢兼收并蓄,釋放個體的創(chuàng)造力和生產力,使經(jīng)濟與社會發(fā)展的動能倍增,從而構建人本智能的璀璨未來。聯(lián)想正圍繞著“Smarter AI for all” 的愿景,催化助力AI落地應用。