文丨《瞭望東方周刊》記者萬宏蕾 原文標題:當AI“煉”成人形,能為人類做些什么?
完整、逼真的“人形”身體,因對人類有獨特的親和力、有望實現(xiàn)復雜功能等特性,被視為AI的一種理想載體,甚至“終極形態(tài)”。
7月4日,在2024世界人工智能大會拍攝的“十八金剛 眾創(chuàng)未來——人形機器人先鋒陣列”( 王翔/攝)
8月21-25日,在北京舉行的2024世界機器人大會上,27款國產人形機器人引發(fā)廣泛關注。“他們”在大會現(xiàn)場演奏揚琴、潑墨揮毫、比球賽、打辯論、跳“科目三”,賺足了流量。
7月4日,在上海開幕的2024世界人工智能大會(WAIC)上,由15款、18臺人形機器人組成的“十八金剛”陣列,向現(xiàn)場觀眾做出整齊的動作,分外吸睛。國家地方共建人形機器人創(chuàng)新中心的“青龍”、智元機器人的遠征A2、宇樹科技的Unitree H1、傅利葉的GR-1、達闥的雙足XR4等國產具身機器人產品紛紛亮相。
7月6日,在2024世界人工智能大會上,人們觀看宇樹科技通用人形機器人Unitree H1表演“科目三”舞蹈(王翔/攝)
“具身智能是人工智能發(fā)展的下一個浪潮。”中國工程院院士、清華大學信息學院院長、北京信息科學與技術國家研究中心主任、中國人工智能學會理事長戴瓊海說。
所謂“具身智能”,就是給能理解、推理并與物理世界互動的AI“頭腦”再加上一個“身體”,“身體”可以是手機、汽車、機床、機械臂等等,而完整、逼真的“人形”身體,因對人類有獨特的親和力、有望實現(xiàn)復雜功能等特性,被視為AI的一種理想載體,甚至“終極形態(tài)”。這兩年,在大模型高速發(fā)展帶動下,人形機器人產業(yè)迎來風口,成為全球科技業(yè)最熱的賽道之一。
2024年8月,美國具身智能公司Figure AI發(fā)布二代人形機器人Figure02。此前,Figure 01已進入寶馬工廠工作。國內,優(yōu)必選的人形機器人Walker S先后走進比亞迪、蔚來、東風柳汽、極氪等汽車工廠“打工”,智元機器人的人形機器人遠征A1也在汽車工廠完成底盤裝配和外觀質檢等任務……
“AI大模型將賦能人形機器人走向主動交互,成為繼計算機、智能手機、新能源汽車后的顛覆性產品。”8月13日,十四屆全國政協(xié)常委、工業(yè)和信息化部原副部長、中國電子學會理事長徐曉蘭在2024世界機器人大會新聞發(fā)布會上說。
越來越“像”人
在位于上海浦東張江科學城的國家地方共建人形機器人創(chuàng)新中心(以下簡稱“國地中心”)內,身高185厘米、體重80公斤,擁有多達43個主動自由度的人形機器人“青龍”雙臂輕展,用五根鋼鐵手指,將面包輕輕捏起。
全球首款全尺寸通用人形機器人開源公版機——“青龍”機器人正在展示(萬宏蕾/攝)
“‘青龍’具有五感能力:能看,能聞,能聽,有觸覺,還有姿態(tài)傳感器。它雙手非常靈活,能精準抓取兩厘米的小物件,能用工具在小米里挑出芝麻。”國地中心總經理許彬告訴《瞭望東方周刊》,“‘青龍’機器人平臺的核心技術前期經過了十余年的沉淀。從國地中心成立到最近在世界人工智能大會上整機亮相,我們團隊在短短半年時間內,厚積薄發(fā),從無到有,實現(xiàn)了突破。”
“端水、抓取,聽起來簡單,做起來復雜,涉及從感知、決策到控制的多項技術。”國地中心首席科學家江磊說,“‘青龍’一條手臂有7個自由度、末端手指有6個自由度,指尖有觸覺傳感器,因此可以完成對抓取的自主判斷。”
“對人形機器人來說,大腦對應智能系統(tǒng),小腦對應控制系統(tǒng),五官對應機器人的感知,執(zhí)行則通過關節(jié)進行。”上海機器人產業(yè)技術研究院副院長周梅杰說。
“‘青龍’之所以聰明,在于機器人和大模型的深度融合,負責人機交互和決策的‘大腦’(朱雀具身大腦大模型)、負責穩(wěn)定行走的‘小腦’(玄武小腦模型),共同形成人形機器人的技術基座。”江磊介紹說,朱雀具身大腦如同一個智能化指揮調度中心,以多模態(tài)大模型為核心,能夠接收文字信息、圖像信息等多種輸入,并輸出精準的語音交互以及明智的任務決策信息;玄武小腦模型側重于任務執(zhí)行,其軌跡規(guī)劃模塊采用“端到端”模仿學習驅動的方式。
“在大數(shù)據、大模型和大算力的支持下,人形機器人正在變得越來越聰慧,逐漸具備自主完成任務的能力。”徐曉蘭說。
機器人產業(yè)已發(fā)展多年,過去的機器人一般只側重一個“技能點”,“寫一段代碼做一件事”。比如:一些工業(yè)機器人,主要比“肌肉”,側重發(fā)展運動控制技術;掃地機器人是否好用,取決于能否規(guī)避障礙,把屋子打掃干凈,主要側重發(fā)展導航傳感技術。而人形機器人,要和人一樣有“知行合一”的綜合能力,就要在芯片、傳感器、軟件、人工智能、通信、機械、材料等諸多前沿技術以及綜合應用上實現(xiàn)突破。
“在此輪發(fā)展大模型之前,在機器人‘大腦’層面,技術上幾乎沒有什么水花,各家推出的模型,基本都只能實現(xiàn)簡單任務。這兩年,相關技術迎來質變的拐點。”許彬說,“未來,隨著人形機器人高速‘成長’,其心智或許很快會脫離稚嫩,邁向‘成年人’的賽道。”
“深度學習讓人工智能對世界有了感知,大模型則讓人工智能有了自主生成的決策能力。”北京新鼎榮盛資本管理有限公司董事長、創(chuàng)始合伙人張弛說,“不遠的未來,人形機器人將走向通用和商業(yè)化”。
多城市布局
“人形機器人正在成為科技競爭的新高地、未來產業(yè)的新賽道,蘊藏巨大的市場空間和發(fā)展機遇。”徐曉蘭在2024世界機器人大會新聞發(fā)布會上表示。
早在2021年,“十四五”規(guī)劃綱要就將機器人產業(yè)提到了重要位置。由工業(yè)和信息化部、國家發(fā)展改革委等十五部門發(fā)布的《“十四五”機器人產業(yè)發(fā)展規(guī)劃》提出,到2025年,中國要成為全球機器人技術創(chuàng)新策源地、高端制造集聚地和集成應用新高地。
2023年,隨著AI大模型技術加速迭代,“人形機器人”作為熱詞頻繁出現(xiàn)在國家和相關部委文件中。當年10月,工業(yè)和信息化部印發(fā)的《人形機器人創(chuàng)新發(fā)展指導意見》提出,到2025年,我國人形機器人創(chuàng)新體系初步建立;到2027年,人形機器人技術創(chuàng)新能力顯著提升,綜合實力達到世界先進水平。
以政策為牽引,各省市圍繞著人形機器人產業(yè)的布局加速展開。
2023年4月,杭州提出,力爭到2026年實現(xiàn)智能機器人全產業(yè)鏈工業(yè)產值突破500億元。
2023年5月,上海印發(fā)《上海市推動制造業(yè)高質量發(fā)展三年行動計劃(2023-2025年)》,特別提到加快人形機器人創(chuàng)新發(fā)展。同時,上海在全球投資促進大會現(xiàn)場發(fā)布2024“投資上海”政策包,其中最引人關注的就是千億母基金。該母基金由上海市國資委推動設立,圍繞集成電路、生物醫(yī)藥、人工智能三大先導產業(yè),重點投向集成電路、創(chuàng)新藥、智能機器人等領域。
同期,深圳印發(fā)《深圳市加快推動人工智能高質量發(fā)展高水平應用行動方案(2023-2024年)》,明確提出發(fā)展人形機器人。
2023年6月,北京印發(fā)《北京市機器人產業(yè)創(chuàng)新發(fā)展行動方案(2023-2025年)》,針對人形機器人行業(yè)進行政策指導,提出加緊布局人形機器人。
多地發(fā)展人形機器人的戰(zhàn)略圖景中出現(xiàn)了一個新角色——人形機器人創(chuàng)新中心。“創(chuàng)新中心本質上承擔著調動當?shù)刭Y源,促進當?shù)厝诵螜C器人產業(yè)發(fā)展的責任。”許彬說。
2023年5月在上海揭牌的國地中心,是人形機器人領域首個國家級公共平臺。“當時,為了國地中心選址,我們考察了好幾個城市。”許彬回憶說,“人形機器人很多技術基礎和工業(yè)機器人、新能源汽車的產業(yè)鏈是共通的,上海在這些領域產業(yè)基礎雄厚。出于產業(yè)基礎、政策環(huán)境等綜合考慮,落戶上海是優(yōu)選。”
“國地中心核心任務之一就是加速機器人通用場景的落地。”許彬辦公桌對面的白板上,密密麻麻手寫著其對創(chuàng)新中心組織架構的思考。“2024年,我們計劃在上海打造能容納 100臺人形機器人的訓練場。我們先選擇相對簡單的、方便實施的場景來落地,推動人形機器人產業(yè)技術創(chuàng)新,并帶動通用場景的落地。”
所謂“訓練場”,就是數(shù)據生產和數(shù)據規(guī)模化場地。這里會建設實時標定系統(tǒng)、控制系統(tǒng)、數(shù)據采集系統(tǒng)和數(shù)據反饋系統(tǒng),通過數(shù)字孿生來生成合成式數(shù)據,為人形機器人產業(yè)打造真實和生成式數(shù)據。
作為技術領域廣泛、生產工藝復雜的實體產業(yè),人形機器人涉及數(shù)千乃至上萬個零部件的細分產業(yè)。發(fā)展人形機器人,對直接創(chuàng)造產值、帶動就業(yè)、引領產業(yè)鏈發(fā)展,都具有重要意義。“這也是多地積極籌建人形機器人創(chuàng)新中心,大力推動人形機器人產業(yè)發(fā)展的原因之一。”許彬說。
目前,北京、上海、寧波、合肥、成都等城市均已建設人形機器人創(chuàng)新中心,在人形機器人賽道上搶先發(fā)力。
產業(yè)化在即
企查查數(shù)據顯示,目前我國機器人相關企業(yè)主要集中在深圳、廣州、上海和蘇州,這四個城市分別擁有4.94萬、4.41萬、3.61萬和3.52萬家相關企業(yè)。人形機器人最關鍵的核心零部件頭部供應商及供應鏈企業(yè),主要分布在長三角和珠三角。
產業(yè)發(fā)展離不開資本投入,伴隨人形機器人迎著風口“起飛”,VC(風險投資)、PE(私募股權投資)前仆后繼地涌入這條頗具科幻感的賽道。
2024年8月18日,被譽為“天才少年”的智元機器人聯(lián)合創(chuàng)始人彭志輝一口氣發(fā)布五款商用人形機器人新品,分別為“遠征”和“靈犀”系列。同時,彭志輝宣布智元機器人啟動一系列開源計劃:包括具身智能機器人訓練所需的百萬條真機數(shù)據集和千萬條仿真數(shù)據集。
“我們希望通過數(shù)據開源、提供零部件,讓更多人利用智元的零部件,快速掌握人形機器人技術。”智元機器人合伙人兼營銷服務副總裁姜青松說。
一年前的2023年8月,智元機器人發(fā)布第一代通用型具身智能機器人——遠征A1,并把2024年定義為智元機器人“商用元年”。該公司預測,2024年發(fā)貨量為300臺,其中雙足機器人200臺,輪式機器人100臺,主要用于交付服務場景和工業(yè)場景。
作為行業(yè)內的明星企業(yè),智元機器人融資迅猛。目前,該公司已完成天使輪、A輪、A1輪、A1+輪、A2輪等多輪融資,A系列融資多達6輪。
2024年2月,宇樹科技宣布完成B++輪融資,投資方包括美團、金石投資、源碼資本,老股東深創(chuàng)投、中網投、容億、敦鴻和米達鈞石跟投,融資近10億元。
把時間軸拉長,可以看到達闥機器人、傅利葉智能、樂森機器人等相關創(chuàng)業(yè)公司身后都擠滿了投資機構。據統(tǒng)計,2024年上半年相關融資總額超過70億元。
市場前景方面,據國際投資銀行高盛預測,到2035年,人形機器人市場規(guī)模有望達到1540億美元(約合人民幣11037億元)。
另據2024年4月首屆中國人形機器人產業(yè)大會上發(fā)布的《人形機器人產業(yè)研究報告》預測,2024年中國人形機器人市場規(guī)模將達約27億元,2026年達104億元,2029年達750億元,占彼時世界總量的32.7%,位居世界第一,到2035年有望達到3000億元規(guī)模。通過在“智慧大腦”的深度學習、“敏捷小腦”的精準控制、“強健肢體”的創(chuàng)新設計上取得關鍵性突破,人形機器人產業(yè)將加速從“樣機炫技”走向商業(yè)化應用的落地。
“人形機器人是人工智能技術與制造業(yè)場景深度融合的載體,中國人形機器人產業(yè)正處于井噴前夜。”徐曉蘭作出這樣的判斷。
開源新生態(tài)
2024世界人工智能大會上,國地中心正式發(fā)布“青龍”為全球首款全尺寸通用人形機器人開源公版機。
“每年我們團隊會更新一版公版機,大家拿到我們的設計參考,能有的放矢地進行很多人形機器人方面的創(chuàng)新。”許彬介紹,作為全球首款全尺寸通用人形機器人,“青龍”集成了43個主動自由度,實現(xiàn)了頭部、手部、臂部、腿部、腰部、踝部的全尺寸設計。“借鑒科學界和技術界在技術分享與開源創(chuàng)新方面的經驗和做法,經過評估,我們對‘青龍’設計圖紙、軟件代碼和數(shù)據集進行開源,旨在吸引全球范圍內的開發(fā)者、研究者和企業(yè)家共同參與人形機器人的研發(fā)和應用,加速人形機器人技術的普及和產業(yè)化進程。”
“我們有一個共同想法,要打造中國人形機器人的底座技術。”江磊說,開源不僅能夠匯聚全球智慧,加速技術創(chuàng)新,還能為中國科技在國際舞臺上贏得更多話語權。
“長期以來,全球科技領域的開源項目多由國外主導,我們在人形機器人領域亟待打破這一局面,建立屬于自己的全尺寸開源社區(qū)。”江磊說,通過開源,把相關技術向全社會開放,降低進入門檻,這樣就有更多資源、更多開發(fā)者涌入這個行業(yè),有利于促進整個行業(yè)的發(fā)展。“3年至5年后,人形機器人基本上可以在物流分揀等一些簡單生產線上使用,5年至10年后,基本上可以在家庭、服務等要求比較高、比較開放的環(huán)境下使用。”
針對當前人工智能行業(yè)普遍困擾的“大模型缺乏高質量訓練數(shù)據”等問題,國地中心將提供標準化的數(shù)據采集工具,以及基于數(shù)字孿生系統(tǒng)完成的快速數(shù)據二次評估。此外,國地中心還將構建開放、開源的標注工具,鼓勵生態(tài)聯(lián)盟單位一起加速數(shù)據集構建,通過開源數(shù)據場景和行業(yè)專用數(shù)據賦能應用。
目前,在國地中心打造的OpenLoong開源社區(qū)網站上,已經開源了機器人硬件結構及參數(shù),即將開源具身智能軟件包?傮w來看,人形機器人這個賽道目前規(guī)模還比較小,開源生態(tài)的建立有望吸引更多人才和企業(yè)加入,共同突破人形機器人的共性關鍵技術。
除了“青龍”系列機器人項目,目前,國地中心還在加快推進訓練中心建設,推動人形機器人在更多的真實場景中應用落地。根據規(guī)劃,中心首期可容納100個人形機器人訓練,計劃到2027年可容納1000個人形機器人同時訓練。
作為2024世界人工智能大會入口處“十八金剛”之一,傅利葉通用人形機器人GR-1已于7月在建設銀行上海浦東分行出任“大堂經理”。
“在建行的銀行大堂經理場景訓練基地,GR-1承擔的工作包括引導客戶、分流叫號,還能對客戶進行簡單的反詐培訓。”傅利葉智能CEO顧捷說,“目前,GR-1比較側重與客戶進行語言交互,我們希望下一步可以更多地開發(fā)身體功能,讓機器人完成迎賓接待、巡邏、文本裝訂,甚至存取款的工作。”
公眾非常期待讓人形機器人提供照顧老人孩子等家庭服務,客觀看,距離人形機器人實現(xiàn)大規(guī)模商用,甚至以平價“飛入尋常百姓家”,到底還有多遠?
“未來可期,投資火熱,但大熱賽道更需要冷靜攻堅。”許彬說。
“目前的人形機器人,功能有限,價格昂貴。在ChatGPT出現(xiàn)之前,大家也覺得AI不夠智能,這和人形機器人目前的狀態(tài)有些類似。”宇樹科技創(chuàng)始人、CEO王興興說。
“場景豐富是我們的最大優(yōu)勢之一。有場景,就有望驅動技術的攻堅突破。說到底,目前人類科學仍在弱人工智能階段,人形機器人離‘像人一樣學習和理解’還差十萬八千里。眼下最重要的是走出實驗室,真正走向市場。”中國科學院院士丁漢說。