一般認(rèn)為,大腦對可視目標(biāo)的識別過程分為兩部分:視覺屬性和語義屬性,即目標(biāo)“像什么“和”是什么“。過去人們對這兩部分一般是分開研究的,現(xiàn)在,劍橋大學(xué)的研究人員利用計算機視覺的標(biāo)準(zhǔn)深度神經(jīng)網(wǎng)絡(luò)AlexNet,可以將二者結(jié)合起來研究,并探尋它們之間的信息交互和映射關(guān)系究竟是怎樣的。
劍橋大學(xué)的神經(jīng)科學(xué)研究人員將計算機視覺與語義相結(jié)合,開發(fā)出一種新模型,可以更清晰地理解大腦對視覺目標(biāo)的處理方式。
人類識別目標(biāo)的能力分為兩個主要過程,對目標(biāo)的快速視覺分析,以及對整個生命過程中獲得的語義知識的激活。大多數(shù)過去的研究一般是對這兩個過程進(jìn)行分別研究。因此,這兩個過程之間的相互作用目前仍然很不清楚。
新的DNN目標(biāo)識別模型: 同時關(guān)注“像什么”和“是什么”
劍橋大學(xué)的研究人員團(tuán)隊使用一種新方法研究了大腦對目標(biāo)的識別過程,該方法結(jié)合了深度神經(jīng)網(wǎng)絡(luò)與吸引子網(wǎng)絡(luò)語義模型。與之前的大多數(shù)研究相比,這一識別技術(shù)既考慮了視覺信息,也考慮了關(guān)于被識別目標(biāo)的概念知識。
劍橋大學(xué)的研究人員表示:“我們之前曾對健康人和腦損傷患者進(jìn)行了大量研究,以更好地了解大腦中對識別目標(biāo)的處理方式。這項工作的主要貢獻(xiàn)之一是,它表明了大腦在理解‘目標(biāo)是什么’這個問題時,涉及到視覺輸入隨著時間的推移,迅速轉(zhuǎn)變?yōu)橛幸饬x的表現(xiàn)形式,這種轉(zhuǎn)變過程是沿著腹側(cè)顳葉完成的?!?/p>
研究人員堅信,對語義記憶的訪問是理解“目標(biāo)是什么”的關(guān)鍵,因此僅關(guān)注與視覺相關(guān)的屬性的理論并不能完全捕捉到這個復(fù)雜的過程。
該集成模型的體系結(jié)構(gòu),可以看到,會有越來越復(fù)雜的視覺信息映射到語義信息上。
來源:Lorraine Tyler等。
“就是這個問題催生出了我們目前的研究,我們希望能夠完全理解低級視覺輸入是如何映射到對象意義的語義表示上的。”研究人員解釋說。為此,他們使用了一個專門用于計算機視覺的標(biāo)準(zhǔn)深度神經(jīng)網(wǎng)絡(luò),稱為AlexNet。
他們解釋說:“這個模型以及其他類似模型可以非常精確地識別圖像中的對象,但模型中不包含任何關(guān)于對象語義屬性的明確知識。例如,香蕉和獼猴桃的外觀(不同的顏色,形狀,質(zhì)地等)有很大不同,但是,我們能夠正確地理解它們都是水果。計算機視覺的模型可以區(qū)分香蕉和獼猴桃,但這些模型并不是對更抽象的知識進(jìn)行編碼,即:它們都是水果?!?/p>
研究人員認(rèn)識到神經(jīng)網(wǎng)絡(luò)在計算機視覺應(yīng)用方面的局限性,將AlexNet視覺算法與神經(jīng)網(wǎng)絡(luò)相結(jié)合,將概念性的意義(包括語義知識)納入到對方程的分析中。
“像什么”和“是什么”的關(guān)系如何,信息如何交互和映射?
研究人員表示:“在這個組合模型中,會將視覺處理映射至語義處理,并激活我們關(guān)于概念的語義知識,”這個新技術(shù)已經(jīng)在16名志愿者的神經(jīng)影像數(shù)據(jù)上進(jìn)行了測試,志愿者被要求在接受功能性核磁共振(fMRI)掃描的同時說出測試圖片中目標(biāo)的名字。與傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)(DNN)視覺模型相比,新方法能夠識別與視覺和語義處理相關(guān)的不同腦區(qū)。
圖為視覺深度神經(jīng)網(wǎng)絡(luò)(紫色)和語義吸引網(wǎng)絡(luò)(紅色-黃色)的不同層如何映射到大腦的不同區(qū)域。
來源:Lorraine Tyler等。
“這項研究最關(guān)鍵的發(fā)現(xiàn)是,通過考慮物體的視覺和語義屬性,可以更好地模擬物體識別過程中的大腦活動,這可以通過計算建模方法捕獲,”研究人員解釋說。
研究人員設(shè)計的方法對大腦中語義激活的階段進(jìn)行了預(yù)測,預(yù)測結(jié)果與先前對目標(biāo)的處理結(jié)果是一致的,其中粒度更粗的語義處理被更精細(xì)的處理所取代。研究人員還發(fā)現(xiàn),該模型在不同階段預(yù)測了大腦不同區(qū)域的對象處理方式的激活。
“最終,關(guān)于如何有意義地處理視覺目標(biāo)的更優(yōu)秀的模型可能具有重要的臨床意義。例如,語義性癡呆癥的患者就失去了對象概念意義的知識,這項研究的發(fā)現(xiàn)對于該病的治療是很有幫助的?!毖芯咳藛T說。
劍橋大學(xué)的這項研究是對神經(jīng)科學(xué)領(lǐng)域的重要貢獻(xiàn),因為它展示了大腦的不同區(qū)域是如何推進(jìn)對目標(biāo)的視覺處理和語義處理的。該研究最近發(fā)表在《Scientific Reports》上。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4782瀏覽量
101225 -
計算機視覺
+關(guān)注
關(guān)注
8文章
1701瀏覽量
46144
原文標(biāo)題:劍橋構(gòu)建視覺“語義大腦”:兼顧視覺信息和語義表示
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
開發(fā)者手機 AI - 目標(biāo)識別 demo
RCS目標(biāo)識別
基于樣本正交子空間的SAR目標(biāo)識別方法
運動目標(biāo)識別與跟蹤系統(tǒng)的研究
基于顏色和區(qū)域的運動目標(biāo)識別
![基于顏色和區(qū)域的運動<b class='flag-5'>目標(biāo)識別</b>](https://file.elecfans.com/web2/M00/49/01/pYYBAGKhtDKAQt0MAAAUnWxwmyE861.jpg)
基于MVDR參數(shù)譜在艦船目標(biāo)識別中的應(yīng)用
基于SIFT視覺詞匯的目標(biāo)識別算法
![基于SIFT視覺詞匯的<b class='flag-5'>目標(biāo)識別</b>算法](https://file.elecfans.com/web2/M00/49/54/poYBAGKhwKGASHufAAAa_XcURCM333.jpg)
基于改進(jìn)KD樹與RANSC算法的目標(biāo)識別算法
基于擴(kuò)展字典稀疏表示分類的遙感目標(biāo)識別
![基于擴(kuò)展字典稀疏表示分類的遙感<b class='flag-5'>目標(biāo)識別</b>](https://file.elecfans.com/web2/M00/49/5D/poYBAGKhwKeAU4OCAAASdLT-OZ4348.jpg)
評論