據(jù)18日《自然·機(jī)器智能》雜志報(bào)道,為了解動(dòng)物如何學(xué)會(huì)走路和從絆倒中學(xué)習(xí),德國(guó)馬克斯·普朗克智能系統(tǒng)研究所(MPI-IS)研究人員建造了一個(gè)四足機(jī)器狗“莫蒂”,它僅僅用了一小時(shí)就學(xué)會(huì)了走路。
莫蒂充分利用了復(fù)雜的腿部力學(xué),通過(guò)貝葉斯優(yōu)化算法指導(dǎo)學(xué)習(xí):其足部傳感器信息與機(jī)器狗中運(yùn)行的建模虛擬脊髓的目標(biāo)數(shù)據(jù)相匹配。機(jī)器狗通過(guò)不斷比較發(fā)送的和預(yù)期的傳感器信息、運(yùn)行反射循環(huán)以及調(diào)整其電機(jī)控制模式來(lái)學(xué)習(xí)行走。
在人類和動(dòng)物中,中央模式發(fā)生器(CPG)是脊髓中的神經(jīng)元網(wǎng)絡(luò),可在沒(méi)有大腦輸入的情況下產(chǎn)生周期性的肌肉收縮。其有助于生成有節(jié)奏的任務(wù),例如步行、眨眼或消化。機(jī)器狗莫蒂在大約一小時(shí)內(nèi)比動(dòng)物更快地優(yōu)化其運(yùn)動(dòng)模式。
在機(jī)器狗平穩(wěn)行走期間,來(lái)自其腳部的傳感器數(shù)據(jù)不斷與機(jī)器狗CPG預(yù)測(cè)的預(yù)期著陸進(jìn)行比較。如果機(jī)器狗絆倒,學(xué)習(xí)算法會(huì)改變腿來(lái)回?cái)[動(dòng)的距離、腿擺動(dòng)的速度以及腿在地面上的長(zhǎng)度。調(diào)整后的運(yùn)動(dòng)也會(huì)影響機(jī)器狗利用其腿部力學(xué)的能力。
在學(xué)習(xí)過(guò)程中,CPG發(fā)送經(jīng)過(guò)調(diào)整的電機(jī)信號(hào),以便機(jī)器狗從此減少絆倒并優(yōu)化其行走。
論文第一作者、MPI-IS動(dòng)態(tài)運(yùn)動(dòng)研究小組的前博士生菲利克斯·魯珀特表示:“我們的機(jī)器狗實(shí)際上是‘天生’的,CPG類似于大自然提供的內(nèi)置自動(dòng)行走智能,我們已將其轉(zhuǎn)移給機(jī)器狗。當(dāng)數(shù)據(jù)從傳感器流回虛擬脊髓,與CPG數(shù)據(jù)進(jìn)行比較,如果傳感器數(shù)據(jù)與預(yù)期數(shù)據(jù)不匹配,則學(xué)習(xí)算法會(huì)改變行走方式,直到機(jī)器狗行走良好且不會(huì)絆倒。”(張夢(mèng)然)
(責(zé)任編輯:蔡文斌)