在機(jī)器人領(lǐng)域,若想讓機(jī)器人保持站立姿態(tài),并維持平穩(wěn)運(yùn)動一直是個(gè)難題,因?yàn)檫@需要超高的專業(yè)知識和設(shè)計(jì)功力。盡管一些傳統(tǒng)機(jī)器人能在人工控制的情況下進(jìn)行,但活動范圍仍有各種局限。
為解決這個(gè)問題,谷歌(Google) 近日與喬治亞理工學(xué)院及加州大學(xué)柏克萊分校的研究人員聯(lián)合發(fā)表論文,詳細(xì)介紹如何透過AI(人工智能)構(gòu)建自學(xué)走路的機(jī)器人,同時(shí)他們給這臺小機(jī)器人命名“Rainbow Dash”。
根據(jù)世界紀(jì)錄,嬰兒從爬行到學(xué)會走路的最快時(shí)間是6個(gè)月,而Rainbow Dash平均只需約3.5小時(shí)。具體來說,機(jī)器人使用深度強(qiáng)化學(xué)習(xí),即結(jié)合深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)兩種不同類型的AI技術(shù),透過深度學(xué)習(xí),系統(tǒng)可處理和評估來自身處環(huán)境的原始輸入數(shù)據(jù);透過強(qiáng)化學(xué)習(xí),演算法可反復(fù)試驗(yàn),以學(xué)習(xí)如何執(zhí)行任務(wù),并根據(jù)完成程度獲得獎(jiǎng)勵(lì)和懲罰。
以往此類實(shí)驗(yàn),研究人員都會讓機(jī)器透過模擬學(xué)習(xí)真實(shí)世界環(huán)境。根據(jù)香港IDC新天域互聯(lián)的獲悉,在仿真環(huán)境中,機(jī)器人的虛擬體首先與虛擬環(huán)境互動,然后再利用演算法接收虛擬數(shù)據(jù),直到系統(tǒng)有能力應(yīng)付自如。不過,環(huán)境雖然容易建模,但通常耗時(shí)長,且現(xiàn)實(shí)充滿各種意想不到的情況。
而此次,谷歌研究團(tuán)隊(duì)直接在真實(shí)環(huán)境下訓(xùn)練Rainbow Dash,讓其較快適應(yīng)所處環(huán)境,也能適應(yīng)相似環(huán)境。Google負(fù)責(zé)人Jan Tan表示:“我們有興趣讓機(jī)器人在各種復(fù)雜的現(xiàn)實(shí)世界環(huán)境運(yùn)動。不過,要設(shè)計(jì)出能靈活處理多樣性和復(fù)雜性的運(yùn)動控制器十分困難。”
接下來,研究人員希望演算法能適用于不同種類的機(jī)器人,或適用多個(gè)機(jī)器人在同一個(gè)環(huán)境同時(shí)學(xué)習(xí),以釋放機(jī)器人更多的運(yùn)動能力,這也將解鎖機(jī)器人更多的能力。
編輯:hfy
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28714瀏覽量
208730 -
谷歌
+關(guān)注
關(guān)注
27文章
6203瀏覽量
106101 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5519瀏覽量
121617 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1298瀏覽量
24505
發(fā)布評論請先 登錄
相關(guān)推薦
評論