商湯的優(yōu)勢還是在于AI人才的儲備和算法優(yōu)勢。目前在城市級萬路規(guī)模的視頻監(jiān)控項目,AI尚未普及,一旦達(dá)到一定規(guī)模,對平臺端算法和算力的需求將會極高。
集微網(wǎng)消息,近年來,隨著安防體系的日漸壯大、監(jiān)控點(diǎn)的不斷擴(kuò)張和高清監(jiān)控設(shè)備的普及,監(jiān)控獲得的圖像視頻信息呈現(xiàn)爆炸式的增長。傳統(tǒng)視頻監(jiān)控系統(tǒng)的存儲和檢索等面臨著巨大的挑戰(zhàn),如何快速、高效地從海量圖像視頻中提取出有用的信息至關(guān)重要。
為此,人們把人臉識別技術(shù)引入了視頻監(jiān)控系統(tǒng)中,人臉識別技術(shù)很大程度上依賴于卷積神經(jīng)網(wǎng)絡(luò)的支持,而卷積神經(jīng)網(wǎng)絡(luò)需要龐大的計算量。
同時,現(xiàn)有的視頻監(jiān)控系統(tǒng)中,人臉檢測識別都是在后端服務(wù)器實現(xiàn)的,前端只負(fù)責(zé)圖像數(shù)據(jù)的采集編碼及傳輸。這種前后端結(jié)合操作的模式,需要較大網(wǎng)絡(luò)帶寬;同時,由于傳輸?shù)囊曨l流數(shù)據(jù)中大部分都是無用的信息,大大降低了后端服務(wù)器對有效數(shù)據(jù)提取的效率。因此一種能夠直接應(yīng)用在前端拍攝裝置上的人臉識別方法顯得尤為重要。
基于這些問題,商湯科技在17年8月31日申請了一項名為“人臉圖像檢索方法和系統(tǒng)、拍攝裝置、計算機(jī)存儲介質(zhì)”的發(fā)明專利(申請?zhí)枺?01710774389.9),申請人為深圳市商湯科技有限公司。
根據(jù)目前公開的專利資料,讓我們一起來了解一下這項人臉識別技術(shù)吧。
如上圖所示為人臉圖像檢索方法的流程示意圖,這樣的方法將直接應(yīng)用于拍攝裝置上。首先通過卷積神經(jīng)網(wǎng)絡(luò)獲得待檢索圖像對應(yīng)的待檢索人臉信息。卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過處理器配置對應(yīng)的卷積計算配置信息,卷積神經(jīng)網(wǎng)絡(luò)包括至少一個卷積層,我們知道卷積層的層數(shù)越多,一般檢測效果也會越好,并且這個卷積神經(jīng)網(wǎng)絡(luò)是可以預(yù)先訓(xùn)練好的。同時,這個步驟通過卷積神經(jīng)網(wǎng)絡(luò)處理獲得對應(yīng)的待檢索人臉信息,將后續(xù)檢索中的圖像檢索轉(zhuǎn)換為人臉信息檢索,使檢索更快捷,無需后續(xù)轉(zhuǎn)換。
其次,基于待檢索人臉信息從數(shù)據(jù)庫中查找匹配的預(yù)設(shè)人臉圖像信息,數(shù)據(jù)庫中保存有預(yù)設(shè)人臉圖像信息。通過設(shè)置數(shù)據(jù)庫在拍攝裝置中實現(xiàn)了人臉的檢測與識別工作,大大降低了網(wǎng)絡(luò)帶寬的要求,提高了數(shù)據(jù)傳輸效率。
最后,輸出待檢索人臉信息匹配的預(yù)設(shè)人臉圖像信息。通過這樣的方案,卷積神經(jīng)網(wǎng)絡(luò)獲得待檢索圖像對應(yīng)的待檢索人臉信息,卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過處理器配置對應(yīng)的卷積計算配置信息。由于卷積神經(jīng)網(wǎng)絡(luò)設(shè)置了卷積計算配置信息,輸入到卷積神經(jīng)網(wǎng)絡(luò)中各卷積層中的圖像的位寬都與卷積層相對應(yīng),提高了卷積層的處理效率,并輸入的待檢索圖像可以快速準(zhǔn)確的得到待檢索人臉信息,既解決了定點(diǎn)運(yùn)算計算精度低及影響計算結(jié)果準(zhǔn)確度的問題,同時也提高了卷積神經(jīng)網(wǎng)絡(luò)的運(yùn)算精度。
在了解了系統(tǒng)的整體方案之后,接下來我們再來看看該方法的硬件實施方案吧。
如上圖所示為該拍攝裝置中的組成硬件結(jié)構(gòu)示意圖,其中包括圖像采集模塊、ISP處理模塊、存儲模塊、FPGA SoC模塊、中央處理器、通信模塊以及供電系統(tǒng)。
圖像采集模塊,用于采集視頻流,并基于每個出現(xiàn)在視頻流中的人臉圖像在采集的視頻流中篩選得到至少一個圖像;ISP處理模塊,用于對所有圖像進(jìn)行質(zhì)量篩選,得到至少一個人臉圖像質(zhì)量達(dá)到設(shè)定閾值的第一圖像;存儲模塊,用于存儲對應(yīng)第一圖像的預(yù)設(shè)人臉圖像信息。
FPGA SoC模塊包括硬件監(jiān)測和中央處理,硬件監(jiān)測實現(xiàn)通過卷積神經(jīng)網(wǎng)絡(luò)獲得待檢索圖像對應(yīng)的待檢索人臉信息;中央處理用于為卷積神經(jīng)網(wǎng)絡(luò)配置對應(yīng)的卷積計算配置信息;通信模塊,通過通信模塊可將得到的匹配的預(yù)設(shè)人臉圖像信息發(fā)送出去,同時還可以根據(jù)該預(yù)設(shè)人臉圖像信息屬于白名單或黑名單發(fā)出相應(yīng)的信息到預(yù)設(shè)的客戶端中。
以上就是商湯基于神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識別的方案,通過在拍攝裝置設(shè)置的數(shù)據(jù)庫中檢索匹配的預(yù)設(shè)人臉圖像信息,實現(xiàn)了實時人臉檢索的效果,提高了檢索效率,不僅解決了現(xiàn)有方法中都在后端進(jìn)行處理的某些局限弊端,同時也實現(xiàn)了將檢測裝置布置在前端時代價高昂的問題。人臉識別技術(shù)在我們的生活中也非常的常見,而商湯的這項技術(shù)無疑會使得我們的生活得到更多的便利。
-
AI
+關(guān)注
關(guān)注
87文章
31745瀏覽量
270529 -
人臉識別
+關(guān)注
關(guān)注
76文章
4021瀏覽量
82389 -
商湯科技
+關(guān)注
關(guān)注
8文章
520瀏覽量
36187
發(fā)布評論請先 登錄
相關(guān)推薦
評論