游戲和模擬從一開始就是DeepMind研究計(jì)劃的核心部分,這種方法已經(jīng)在人工智能研究上取得了重大突破。作為一名前視頻游戲設(shè)計(jì)師,我對于和Unity達(dá)成合作,創(chuàng)建虛擬環(huán)境以開發(fā)、測試用于解決實(shí)際問題的智能、靈活算法感到興奮。——DeepMind聯(lián)合創(chuàng)始人兼CEO Demis Hassabis
近日,Unity在幾位“游戲設(shè)計(jì)師”的幫助下徹底火了。
先是登頂steam熱銷榜的國產(chǎn)武俠游戲《太吾繪卷》,由于代碼遭泄露,只有一個main(x)、上萬個if、全用字符串……這些非常規(guī)操作讓一眾網(wǎng)友把游戲內(nèi)核“蛐蛐”吹成了新一代錦鯉。之后,熟悉Unity的玩家開始陸續(xù)辟謠,指出主創(chuàng)寫游戲用的引擎是Unity,之所以全是字符串,是因?yàn)槠渲袃?nèi)置的PlayMaker可以調(diào)整變量數(shù)據(jù)類型。
無論是游戲營銷還是無心造謠,這個事件凸顯了Unity在游戲制作上的專業(yè)和易上手。事實(shí)上,Unity是現(xiàn)在受眾最廣的實(shí)時開發(fā)平臺,從市場規(guī)模上看,它占全球AR/VR內(nèi)容創(chuàng)作的60%,在移動游戲創(chuàng)作上也占了全球的50%。
而除去簡單易用這個特征,Unity的最著名的靈活性也使開發(fā)人員能夠針對25個平臺定位和優(yōu)化他們的創(chuàng)作,包括Xbox One、PlayStation 4、Gameroom(Facebook)、SteamVR(PC和Mac)、Oculus、PSVR、Gear VR、HoloLens、ARKit(Apple)、ARCore(谷歌)等。
另一個“游戲設(shè)計(jì)師”是DeepMind的哈薩比斯。26日,DeepMind宣布和Unity達(dá)成合作,由前者的研究人員使用Unity創(chuàng)建虛擬環(huán)境,進(jìn)一步開展基礎(chǔ)AI研究,而后者能利用這些成果,為游戲開發(fā)者提供最新的機(jī)器學(xué)習(xí)技術(shù)。
說起DeepMind,相信國內(nèi)讀者對這個名字不會陌生。無論是2014年被谷歌天價收購,還是2016年用深度強(qiáng)化學(xué)習(xí)系統(tǒng)AlphaGo擊敗韓國棋手李世石,還是2017年AlphaGo擊敗中國棋手柯潔,這家受神經(jīng)科學(xué)啟發(fā)的人工智能公司一直走在科技前沿。自2010年在倫敦成立以來,DeepMind已經(jīng)共計(jì)發(fā)表了兩百余篇同行評審論文,其中有6篇被刊登在《Nature》等頂級科學(xué)期刊上,這是計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室的一個史無前例的記錄。
截至目前,雙方還沒有透露有關(guān)合作內(nèi)容和資金往來的信息,但有資料顯示,早在今年6月,Unity就已將開始向DeepMind的兄弟部門——谷歌云上的網(wǎng)絡(luò)游戲開發(fā)商提供服務(wù)。
合作的意義
智能設(shè)計(jì)和進(jìn)化不僅是人類世界觀的一個分支,它也是人工智能社區(qū)的一個分支。直到幾年前,學(xué)界研究的AI還僅限于編碼智能算法,比如銀行欺詐檢測和玩獨(dú)立小游戲。但是對于大型復(fù)雜環(huán)境,比起人為硬編碼,“直覺”算法更能提升機(jī)器學(xué)習(xí)AI的整體表現(xiàn)。因此在現(xiàn)實(shí)場景中模擬智能是AI研究下一階段的重要目標(biāo),作為基礎(chǔ),極度逼真的房屋、高速公路等3D環(huán)境是必要的。
“游戲有很多種形式……它們比人們想象的更接近自然?!盪nity的機(jī)器學(xué)習(xí)和人工智能副總裁Danny Lange在接受采訪時表示,“在游戲中,你能得到視覺上的、物理上的、認(rèn)知層面上的,以及社交方面的互動。這些都給算法帶來了進(jìn)化壓力,就像大自然對生物一樣?!?/p>
演示一
上圖是游戲如何訓(xùn)練AI的一個例子,這個小人沒有任何關(guān)于行走的知識,但它一直在生理學(xué)和物理定律范圍內(nèi)探索,一旦它發(fā)生了類似行走的行為,系統(tǒng)就會觸發(fā)數(shù)字獎勵,激勵它不斷學(xué)習(xí)這種行為。經(jīng)過嘗試,這個小人最終學(xué)會了走路——盡管它的動作還是很笨拙,
這項(xiàng)技術(shù)本身不是新的,很多公司和實(shí)驗(yàn)室早幾年就已經(jīng)開始在游戲引擎里訓(xùn)練AI,其中最知名的是Nvidia的Isaac虛擬機(jī)器人訓(xùn)練系統(tǒng)。此外,自動駕駛汽車算法也高度依賴逼真的虛擬道路環(huán)境,而Danny Lange本人之前也是Uber機(jī)器學(xué)習(xí)平臺的建立者。
如果說物理模擬能讓AI進(jìn)行更宏大的實(shí)驗(yàn),幫人類鎖定實(shí)際測試范圍,那么游戲作為開放世界,除了物理學(xué),它能模擬的還有色彩之間的相互作用、社交行為等。
“社會動態(tài)建模,這是一個新興領(lǐng)域,”Danny Lange介紹道:“你模擬了多個智能體,他們會互相交流,甚至發(fā)明對話使用的語言。這可以深入了解人群的行為方式,舉一個實(shí)際的例子,假設(shè)我們模擬了兩個知名投資分析師,他們中的一個說股票明天會跌,一個說會漲,那我們就能通過模擬來觀察他們的言論是怎么影響到其他人的認(rèn)知的?!?/p>
演示二
就好比在自然界中,動物在學(xué)會走路、跑步前必須先學(xué)會爬行,我們要分析股票這個問題也要先把它分解成一個個簡單問題。強(qiáng)化學(xué)習(xí)遵循的正是這種逐步漸進(jìn)的學(xué)習(xí)方法,“你認(rèn)為自己已經(jīng)解決了一個難題,然后把‘經(jīng)驗(yàn)’丟給機(jī)器,這其實(shí)并沒有多大意義。算法必須先掌握一個挑戰(zhàn),并把它所學(xué)到的知識用來掌握下一個挑戰(zhàn),這是我們所說的‘課程學(xué)習(xí)’。”
“和DeepMind的交易不僅僅是出售軟件許可證,這是合作。當(dāng)你構(gòu)建一個游戲引擎時,它也許可以在iOS、Android、Xbox上快速運(yùn)行。但DeepMind要做的是在數(shù)千甚至數(shù)萬臺服務(wù)器上運(yùn)行Unity以推動深度學(xué)習(xí),這是一項(xiàng)完全不同的任務(wù),意味著我們要針對這些需求調(diào)整和配置Unity?!?/p>
只有大規(guī)模的深度學(xué)習(xí)才能帶來發(fā)展回報。訓(xùn)練一只狗只需5分鐘,如果只是這樣的任務(wù),DeepMind絕不會選擇Unity,但是,如果他們的目標(biāo)是以10,000 FPS訓(xùn)練1000只狗24小時,觀察這些狗的詭異動作,然后從中找出很快學(xué)會如何跨欄的狗,那么這樣的合作是必須的。
無論是DeepMind還是Unity,這樣的合作都是共贏。
-
人工智能
+關(guān)注
關(guān)注
1796文章
47814瀏覽量
240593 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8447瀏覽量
133131 -
Unity
+關(guān)注
關(guān)注
1文章
127瀏覽量
21906
原文標(biāo)題:Unity和DeepMind達(dá)成合作,利用虛擬世界推進(jìn)AI研究
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論