為特定任務(wù)尋找最合適的優(yōu)化機(jī)器學(xué)習(xí)算法是一件耗時(shí)費(fèi)力的工作,因?yàn)闆]有一種算法能適用于所有任務(wù)。IBM的研究人員提出“神經(jīng)突變”進(jìn)化算法,可以為機(jī)器學(xué)習(xí)任務(wù)自動(dòng)選擇最合適的算法,選擇速度提升了50000倍,錯(cuò)誤率僅上升0.6%.
機(jī)器學(xué)習(xí)系統(tǒng)并非是“生而平等”的。沒有一種算法能應(yīng)對(duì)所有的機(jī)器學(xué)習(xí)任務(wù),這就讓尋找最優(yōu)的機(jī)器學(xué)習(xí)算法成為一項(xiàng)艱巨又耗時(shí)的工作。不過這個(gè)問題現(xiàn)在有希望解決了,最近IBM的研究人員開發(fā)了一套能夠自動(dòng)選擇AI優(yōu)化算法的系統(tǒng)。
IBM愛爾蘭研究院的數(shù)據(jù)科學(xué)家Martin Wistuba,在其近日發(fā)表的博客文章中介紹了自己開發(fā)的這套系統(tǒng)。他聲稱,該系統(tǒng)將自動(dòng)選擇優(yōu)化AI算法的速度提升了5萬倍,錯(cuò)誤率僅上升了0.6%。
Wistuba表示,這套進(jìn)化算法系統(tǒng)能將選擇適當(dāng)?shù)臋C(jī)器學(xué)習(xí)架構(gòu)的時(shí)間縮減至幾個(gè)小時(shí),讓每個(gè)人都能有條件對(duì)深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)進(jìn)行優(yōu)化。
面向機(jī)器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)突變算法
該方法將卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)視為神經(jīng)細(xì)胞序列,然后應(yīng)用一系列突變,以找到一種結(jié)構(gòu),可以提升給定數(shù)據(jù)集和機(jī)器學(xué)習(xí)任務(wù)的神經(jīng)網(wǎng)絡(luò)的性能。
這種方法大大縮短了網(wǎng)絡(luò)訓(xùn)練時(shí)間。這些突變會(huì)改變網(wǎng)絡(luò)結(jié)構(gòu),但不會(huì)改變網(wǎng)絡(luò)的預(yù)測(cè),網(wǎng)絡(luò)的結(jié)構(gòu)變化可能包括添加新的層、添加新連接或擴(kuò)展內(nèi)核或現(xiàn)有層。
保留原函數(shù)的神經(jīng)網(wǎng)絡(luò)突變示例。右側(cè)的體系結(jié)構(gòu)是突變后的網(wǎng)絡(luò),但與左側(cè)的體系結(jié)構(gòu)具有相同的預(yù)測(cè)結(jié)果(由相同顏色表示)
實(shí)驗(yàn)評(píng)估:速度提升5萬倍,錯(cuò)誤率僅上升0.6%
實(shí)驗(yàn)中,研究人員將新神經(jīng)進(jìn)化方法與CIFAR-10和CIFAR-100數(shù)據(jù)集上的圖像分類任務(wù)的其他幾種方法進(jìn)行了比較。這些數(shù)據(jù)集通常用于訓(xùn)練機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺算法的圖像集。
與最先進(jìn)的人工設(shè)計(jì)架構(gòu)、基于強(qiáng)化學(xué)習(xí)的架構(gòu)搜索方法、以及基于進(jìn)化算法的其他自動(dòng)化方法的結(jié)果相比,結(jié)構(gòu)突變算法在分類錯(cuò)誤上稍高出前幾種方法,但耗時(shí)要少得多,比其他方法快了50000倍,錯(cuò)誤率最多僅比基準(zhǔn)數(shù)據(jù)集CIFAR-10上的最有力競(jìng)爭對(duì)手高出0.6%。
下圖所示為算法的優(yōu)化過程。在圖2中,每個(gè)點(diǎn)代表不同的結(jié)構(gòu),連接線代表突變。不同顏色所示為每個(gè)結(jié)構(gòu)的精度,x軸表示時(shí)間??梢钥吹?,準(zhǔn)確率在前10個(gè)小時(shí)內(nèi)迅速上升,之后緩慢上升、最后趨于穩(wěn)定。
深度學(xué)習(xí)網(wǎng)絡(luò)設(shè)計(jì)的進(jìn)化算法優(yōu)化
圖示為隨時(shí)間推移,進(jìn)化算法的優(yōu)化過程
下圖所示為隨著時(shí)間的推移,深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的演變情況。
網(wǎng)絡(luò)結(jié)構(gòu)隨時(shí)間的演變,圖中某些中間狀態(tài)未顯示
實(shí)際上,自動(dòng)算法選擇并不新鮮。谷歌在智能手機(jī)面部識(shí)別和目標(biāo)檢測(cè)上也在使用這類方法,如果IBM這一的系統(tǒng)性能確實(shí)如其所言,它可能代表著該領(lǐng)域內(nèi)的一次重大進(jìn)步。
將來,研究人員希望將這種優(yōu)化集成到IBM的云服務(wù)中,并將其提供給客戶。此外還計(jì)劃將其擴(kuò)展到更大的數(shù)據(jù)集上,如ImageNet和其他類型的數(shù)據(jù),如時(shí)間序列和文本、自然語言處理任務(wù)等。
Wistuba將于9月在愛爾蘭都柏林舉行的歐洲機(jī)器學(xué)習(xí)和數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)會(huì)議(ECML-PKDD)會(huì)議上介紹這種方法。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4783瀏覽量
101239 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8446瀏覽量
133127 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1209瀏覽量
24850
原文標(biāo)題:神經(jīng)網(wǎng)絡(luò)突變自動(dòng)選擇AI優(yōu)化算法,速度提升50000倍!
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
神經(jīng)網(wǎng)絡(luò)教程(李亞非)
分享機(jī)器學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的工作流程和相關(guān)操作
機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)參數(shù)的代價(jià)函數(shù)
【案例分享】基于BP算法的前饋神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)簡介:什么是機(jī)器學(xué)習(xí)?
BP神經(jīng)網(wǎng)絡(luò)模型與學(xué)習(xí)算法
![BP<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>模型與<b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>算法</b>](https://file.elecfans.com/web2/M00/49/B1/pYYBAGKhvE-ACfJzAAA0VYTgwdI454.png)
為什么使用機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)以及需要了解的八種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
![為什么使用<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>以及需要了解的八種<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>結(jié)構(gòu)](https://file1.elecfans.com//web2/M00/A7/26/wKgZomUMQq2ALvp3AAARCmxDMXE723.png)
評(píng)論