以人形機器人為代表具身智能正加速進入到工業(yè)場景。
10月16日,波士頓動力公司與豐田研究院(TRI)宣布合作,計劃將基于人工智能的機器人智能引入電動版Atlas人形機器人。此次合作將充分利用豐田研究院在大型行為模型(LBMs)方面的研究成果,這類模型的運行原理與用于ChatGPT等平臺的大型語言模型(LLMs)類似。
人形機器人
今年4月,波士頓動力宣布放棄液壓驅(qū)動,轉(zhuǎn)而采用全電動路線,并將電動版Atlas的試點部署在現(xiàn)代工廠,重點探索機器人在“實驗室、工廠和日常生活”中的應(yīng)用場景。此后就有消息傳出,波士頓動力將與豐田汽車探討投資計劃,后者有意愿將公司的機器人用在汽車生產(chǎn)線上。
其實早在2013年首次亮相以來,波士頓動力Atlas機器人以其卓越的運動能力和精細(xì)操作能力著稱,此能力工業(yè)場景有極大應(yīng)用潛力。TRI積極推動機器人AI開源模型和數(shù)據(jù)集的開發(fā),致力于通過結(jié)合計算機視覺和大規(guī)模語言模型的訓(xùn)練,開發(fā)出能夠適應(yīng)多任務(wù)、多條件的靈巧操作基礎(chǔ)模型,此次合作也是TRI首次將生成式AI應(yīng)用于提升機器人的靈巧操作能力。
波士頓動力Atlas機器人
波士頓動力公司首席執(zhí)行官Robert Playter在聲明中表示:“我們期待與TRI合作,加快通用人形機器人的開發(fā)。這次合作展示了兩家擁有強大研發(fā)基礎(chǔ)的公司攜手解決復(fù)雜挑戰(zhàn),共同打造能夠應(yīng)對現(xiàn)實世界問題的有用機器人”。人形機器人是具身智能的標(biāo)志性產(chǎn)品,是把智能從軟件到硬件的物化過程,如果人形機器人實現(xiàn)突破,將為工業(yè)領(lǐng)域帶來革命性變革。北京機械工程學(xué)會常務(wù)理事、常務(wù)副秘書長李海濤日前在2024數(shù)字開物大會上表示。
但是人形機器人想要在工業(yè)場景有效落地,需要進化到具身智能階段。
清華大學(xué)計算機系長聘教授、清華大學(xué)人工智能研究院視覺智能研究中心主任鄧志東教授向數(shù)字開物表示:“要通過學(xué)習(xí)的方法而不是基于傳統(tǒng)的規(guī)則的方法來解決人形機器人的一切問題,多模態(tài)的交互式學(xué)習(xí)可以獲得通用性和泛化能力,交互式多模態(tài)智能體助力人形機器人發(fā)展,走到了具身智能階段才真正與真實物理空間進行作用”。
與此同時,更多擁有人形機器人的公司正在加速融合AI大模型,推動人形機器人進入具身智能階段,并積極布局來解決現(xiàn)實世界尤其是工業(yè)場景的各種問題。Figure AI與OpenAI達成戰(zhàn)略合作,接入OpenAI大模型,目前Figure AI二代人形機器人Figure 02能夠在現(xiàn)實世界中完全自主地執(zhí)行任務(wù)并進入寶馬工廠實訓(xùn),如搬運、安置、質(zhì)檢等。此前谷歌透露旗下的DeepMind團隊正在使用Gemini訓(xùn)練其機器人,讓其能夠完成更復(fù)雜的任務(wù),且能在復(fù)雜的環(huán)境下自由穿梭。此外,特斯拉在其最新發(fā)布會上展示了人形機器人Optimus的強大交互能力。
隨著AI大模型和先進硬件技術(shù)的融合,走到了具身智能階段的人形機器人在工業(yè)領(lǐng)域展現(xiàn)出其強大的應(yīng)用潛力。今年3月,梅賽德斯—奔馳宣布,和通用仿人機器人開發(fā)商Apptronik達成協(xié)議,奔馳將啟動試點項目,在汽車制造過程中,測試Apptronik公司的Apollo仿人機器人執(zhí)行各種任務(wù)的能力,例如向生產(chǎn)線運送組裝套件、檢查零部件等等。10月14日,優(yōu)必選宣布推出全新一代工業(yè)人形機器人Walker S1,并稱Walker S1已進入汽車工廠實訓(xùn),與L4級無人物流車、無人叉車、工業(yè)移動機器人和智能制造管理系統(tǒng)協(xié)同作業(yè),實現(xiàn)全球范圍內(nèi)首個人形機器人與無人物流車等協(xié)同作業(yè)。
不過,李海濤也指出:“人形機器人要想完全發(fā)展到像人一樣的智能,目前來講還有很遙遠的距離,它可以替代一些基本的操作,但是人的智能要想讓機器替代難度是非常大的。”未來工業(yè)場景是人機融合的格局而非簡單的機器替代人類。相較于無人工廠,未來是人、人形機器人和智能設(shè)備協(xié)同的新范式。