盡管機(jī)器狗的能力很強(qiáng),但它們往往無法與真實(shí)的動物相媲美。這部分原因在于,要直接從狗狗身上學(xué)習(xí)如何像它們一樣走路是很難的--但來自谷歌人工智能實(shí)驗室的這項研究卻讓它變得簡單得多。谷歌團(tuán)隊與加州大學(xué)伯克利分校合作,目的是找到一種方法,使四足機(jī)器狗能夠像真正的狗狗一樣進(jìn)行輕盈小跑等"敏捷行為"。正如研究人員在博文中指出,既定的訓(xùn)練過程往往"需要大量的專家洞察力,而且往往需要對每一個期望的技能進(jìn)行冗長的獎勵調(diào)整過程。"
狗狗的動作方式可能與機(jī)器狗的動作方式并不完全一致,導(dǎo)致后者倒下、鎖定或其他方面的失敗。而谷歌的AI項目就解決了這個問題,在正常的秩序中加入了一點(diǎn)可控的混亂。通常情況下,狗的動作會被捕捉到,并對腳和關(guān)節(jié)等關(guān)鍵點(diǎn)進(jìn)行仔細(xì)追蹤。在數(shù)字模擬中,這些點(diǎn)會被模擬成機(jī)器狗的樣子,虛擬版的機(jī)器狗會嘗試用自己的動作模仿狗的動作,邊學(xué)邊做。
盡管研究人員取得了不錯的效果,但當(dāng)試圖用模擬的結(jié)果來控制一個實(shí)際的機(jī)器狗時仍會出現(xiàn)問題。真實(shí)世界不是一個二維平面,沒有理想化的摩擦力規(guī)則之類的東西。不幸的是,這意味著未經(jīng)修正的模擬步態(tài)往往會讓機(jī)器狗直接摔到地面上。
為了防止這種情況的發(fā)生,研究人員在模擬中使用的物理參數(shù)中引入了隨機(jī)性元素,使虛擬機(jī)器狗的重量更重,或者電機(jī)更弱,或者與地面的摩擦力更大。這使得描述如何行走的機(jī)器學(xué)習(xí)模型必須考慮到各種小的變異,以及如何抵消它們。
通過學(xué)習(xí)來適應(yīng)這種隨機(jī)性,使得學(xué)習(xí)后的行走方法在現(xiàn)實(shí)世界中更加穩(wěn)健,從而可以通過模仿目標(biāo)狗的行走方式,甚至可以模仿出更復(fù)雜的動作,比如轉(zhuǎn)彎和旋轉(zhuǎn),而不需要任何人工干預(yù),只需要進(jìn)行一點(diǎn)額外的虛擬訓(xùn)練。當(dāng)然,如果需要的話,還可以加入手動調(diào)整,但就目前的情況來看,這比起以前完全自動完成的動作,還是有很大的進(jìn)步。
在同一篇文章中描述的另一個研究項目中,另一組研究人員描述了一個機(jī)器狗可以自行行走,但被植入了避免在指定區(qū)域外行走,并在跌倒時自行爬起的能力。有了這些基本技能的烘托,機(jī)器狗能夠在沒有人類干預(yù)的情況下,在訓(xùn)練區(qū)域內(nèi)不斷地在完善,學(xué)習(xí)到了相當(dāng)令人印象深刻的運(yùn)動技能。