安全問題,一直是機器人的核心與焦點命題。
近日,谷歌DeepMind團隊發(fā)布了三項重要進展:自動化機器人訓(xùn)練系統(tǒng)AutoRT、機器人速度優(yōu)化系統(tǒng)SARA-RT和機器人泛化系統(tǒng)RT-Trajectory,這三項新系統(tǒng)分別從數(shù)據(jù)采集、決策速度和泛化能力等方面,幫助提升現(xiàn)實世界中機器人的智能水平。
(1)AutoRT:自動化機器人數(shù)據(jù)收集系統(tǒng)
AutoRT是一個機器人的數(shù)據(jù)自動采集系統(tǒng)。它整合了大規(guī)模的基礎(chǔ)模型,如大型語言模型(LLM)、視覺語言模型(VLM)和機器人控制模型(RT-1、RT-2),通過這一系統(tǒng),機器人可以部署到全新環(huán)境中,并采集各類訓(xùn)練數(shù)據(jù)。
它可以同時控制多臺裝備攝像頭和機械臂的機器人,使其在不同環(huán)境中完成各種任務(wù),收集數(shù)據(jù)。
研究人員花費7個月時間,利用AutoRT系統(tǒng)控制機器人在辦公室內(nèi)完成任務(wù),已經(jīng)收集了涵蓋77000次試驗和6650個獨特任務(wù)的多樣化數(shù)據(jù),同時控制最多可達52臺機器人。
AutoRT的優(yōu)勢在于,借助大規(guī);A(chǔ)模型的力量,可以顯著提升機器人對人類語言指令的理解能力,并通過收集更豐富的數(shù)據(jù),來訓(xùn)練機器人適應(yīng)實際復(fù)雜環(huán)境。
(2)SARA-RT:加速機器人決策速度
SARA-RT優(yōu)化了著名的Transformer模型在機器人領(lǐng)域的應(yīng)用,使得機器人可以做出更快速的決策。
之前基于Transformer的機器人控制模型RT-2,其決策速度受到計算需求的制約,SARA-RT通過一種新的微調(diào)方法,將Transformer的二次復(fù)雜度降低到線性復(fù)雜度,大幅減少了計算量,使機器人的決策速度提高14%,同時準(zhǔn)確率還提高10%。
這種可擴展的注意力機制,為將Transformer應(yīng)用到更大規(guī)模的機器人中提供了可能。結(jié)合數(shù)十億參數(shù)量的大型機器人模型,SARA-RT可以實現(xiàn)更快決策和更好性能。
(3)RT-Trajectory:提高機器人動作泛化能力
RT-Trajectory則在提高機器人泛化能力上有重要進展。對人類來說,擦桌子等動作簡單直觀,但機器人需要把抽象指令轉(zhuǎn)化為具體運動。
RT-Trajectory通過解釋機器人的具體動作,來幫助其深入理解如何完成一個任務(wù),而不僅是簡單匹配指令和動作。它會自動為訓(xùn)練視頻中的機器人運動添加2D輪廓,作為視覺提示,輔助模型學(xué)習(xí)。
測試結(jié)果表明,在未見訓(xùn)練數(shù)據(jù)的41項新任務(wù)中,RT-Trajectory控制的機械臂任務(wù)成功率達到63%,較先進的RT-2模型提高一倍以上。這表明機器人的泛化能力得到顯著提升。
起草首部機器人憲法,機器人也有價值底線
在推出一系列重要系統(tǒng)進展的同時,谷歌DeepMind團隊還起草了世界上第一部面向智能機器人的憲法。
這部機器人憲法的靈感來源于科幻小說家阿西莫夫的“機器人三定律”,主要核心是確保機器人不傷害人類。DeepMind將這一機器人憲法集成到AutoRT系統(tǒng)中,成為保障人類安全的關(guān)鍵組成部分。
具體來看,機器人憲法為LLM模型設(shè)置了護欄,確保其生成的任務(wù)建議不涉及人類、動物、尖銳物品等不安全內(nèi)容,同時編程限制了機器人關(guān)節(jié)的力,并添加了人類控制的物理開關(guān)。
這無疑是科技發(fā)展史上的一個里程碑事件
之前圍繞著AI倫理的討論多集中在算法本身是否存在偏見等問題上,很少涉及AI尤其是具有物理形態(tài)的智能機器人應(yīng)該遵循哪些道德規(guī)范。
首部機器人憲法體現(xiàn)了技術(shù)應(yīng)該為人類服務(wù)的理念,而非單純追求功能、效率,同時它也為未來機器人大規(guī)模應(yīng)用時如何規(guī)避風(fēng)險,保障人類安全和權(quán)益提供了寶貴借鑒。
當(dāng)然,作為第一步的嘗試,這部機器人憲法還較為簡單和原則,如何使其擁有更嚴(yán)密的邏輯體系,覆蓋機器人可能的各種情形和倫理難題,還需要廣泛討論和不斷完善。但第一步已經(jīng)邁出,其影響力絕不會限于技術(shù)層面,也將推動人類思考我們應(yīng)該如何與智能機器人共處。
人類文明進步史,是一個不斷學(xué)習(xí)、探索、犯錯、修正的過程,當(dāng)我們站在技術(shù)發(fā)展的新階段,應(yīng)當(dāng)以積極、審慎的態(tài)度繼續(xù)探索新可能。人與機器人的未來如何,你怎么看?