DeepMind機(jī)器人團(tuán)隊(duì)近日公布了三項(xiàng)新進(jìn)展,旨在幫助機(jī)器人在實(shí)驗(yàn)室外做出更快、更好、更安全的決策。其中之一是通過“機(jī)器人守則”系統(tǒng)來收集訓(xùn)練數(shù)據(jù),以確保機(jī)器人辦公室助理在為人們?nèi)?a href="http://www.22a6.cn/app/25363.html" target="_blank">打印紙時(shí)不會攻擊擋道的同事。
谷歌的數(shù)據(jù)收集系統(tǒng)AutoRT采用視覺語言模型(VLM)和大型語言模型(LLM)的協(xié)同工作,以了解環(huán)境、適應(yīng)陌生情境,并決定適當(dāng)?shù)娜蝿?wù)。這個(gè)“機(jī)器人守則”靈感來自于阿西莫夫的《機(jī)器人三定律》,被描述為一套“以安全為中心的提示”,指導(dǎo)機(jī)器人的AI在選擇任務(wù)時(shí)避免涉及人類、動物、尖銳物體甚至電器。
為了提高安全性,DeepMind對機(jī)器人進(jìn)行了編程,當(dāng)機(jī)器人關(guān)節(jié)上的力超過一定閾值時(shí),會自動停止。機(jī)器人還配備了一個(gè)實(shí)體的終止開關(guān),人類操作員可以使用它來立即關(guān)閉機(jī)器人。在過去的七個(gè)月里,谷歌在四棟不同的辦公樓中部署了由53臺AutoRT機(jī)器人組成的車隊(duì),并進(jìn)行了77000多次試驗(yàn)。其中一些機(jī)器人由人類操作員遠(yuǎn)程控制,而另一些機(jī)器人則完全自主地根據(jù)腳本或使用谷歌的機(jī)器人變壓器(RT-2)AI學(xué)習(xí)模型進(jìn)行操作。
這些實(shí)驗(yàn)中使用的機(jī)器人主要以實(shí)用性為導(dǎo)向,只配備了攝像頭、機(jī)械臂和移動底座。每個(gè)機(jī)器人都使用VLM(AI視覺語言模組)來了解環(huán)境和視線內(nèi)的物體。接下來,LLM(AI大型語言模組)會提供一系列創(chuàng)造性任務(wù)的建議,例如“將零食放在臺面上”,并扮演決策者的角色,為機(jī)器人選擇合適的任務(wù)執(zhí)行。