人臉識(shí)別的理解:人臉識(shí)別(Face Recognition)是一種依據(jù)人的面部特征(如統(tǒng)計(jì)或幾何特征等),自動(dòng)進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù),又稱(chēng)為面像識(shí)別、人像識(shí)別、相貌識(shí)別、面孔識(shí)別、面部識(shí)別等。通常我們所說(shuō)的人臉識(shí)別是基于光學(xué)人臉圖像的身份識(shí)別與驗(yàn)證的簡(jiǎn)稱(chēng)。
一、發(fā)展與市場(chǎng)
??
1、人臉識(shí)別的發(fā)展簡(jiǎn)史:
第一階段(1950s—1980s)初級(jí)階段:
人臉識(shí)別被當(dāng)作一個(gè)一般性的模式識(shí)別問(wèn)題,主流技術(shù)基于人臉的幾何結(jié)構(gòu)特征。這集中體現(xiàn)在人們對(duì)于剪影(Profile)的研究上,人們對(duì)面部剪影曲線的結(jié)構(gòu)特征提取與分析方面進(jìn)行了大量研究。人工神經(jīng)網(wǎng)絡(luò)也一度曾經(jīng)被研究人員用于人臉識(shí)別問(wèn)題中。較早從事 AFR 研究的研究人員除了布萊索(Bledsoe)外還有戈登斯泰因(Goldstein)、哈蒙(Harmon)以及金出武雄(Kanade Takeo)等。總體而言,這一階段是人臉識(shí)別研究的初級(jí)階段,非常重要的成果不是很多,也基本沒(méi)有獲得實(shí)際應(yīng)用。
第二階段(1990s)高潮階段:
這一階段盡管時(shí)間相對(duì)短暫,但人臉識(shí)別卻發(fā)展迅速,不但出現(xiàn)了很多經(jīng)典的方法,例如Eigen Face, Fisher Face和彈性圖匹配;并出現(xiàn)了若干商業(yè)化運(yùn)作的人臉識(shí)別系統(tǒng),比如最為著名的 Visionics(現(xiàn)為 Identix)的 FaceIt 系統(tǒng)。 從技術(shù)方案上看, 2D人臉圖像線性子空間判別分析、統(tǒng)計(jì)表觀模型、統(tǒng)計(jì)模式識(shí)別方法是這一階段內(nèi)的主流技術(shù)。
第三階段(1990s末~現(xiàn)在)
人臉識(shí)別的研究不斷深入,研究者開(kāi)始關(guān)注面向真實(shí)條件的人臉識(shí)別問(wèn)題,主要包括以下四個(gè)方面的研究:1)提出不同的人臉空間模型,包括以線性判別分析為代表的線性建模方法,以Kernel方法為代表的非線性建模方法和基于3D信息的3D人臉識(shí)別方法。2)深入分析和研究影響人臉識(shí)別的因素,包括光照不變?nèi)四樧R(shí)別、姿態(tài)不變?nèi)四樧R(shí)別和表情不變?nèi)四樧R(shí)別等。3)利用新的特征表示,包括局部描述子(Gabor Face, LBP Face等)和深度學(xué)習(xí)方法。4)利用新的數(shù)據(jù)源,例如基于視頻的人臉識(shí)別和基于素描、近紅外圖像的人臉識(shí)別。
二、市場(chǎng)研究
1、全球人臉識(shí)別市場(chǎng)
前瞻根據(jù)人臉識(shí)別行業(yè)發(fā)展現(xiàn)狀;到2016年,全球生物識(shí)別市場(chǎng)規(guī)模在127.13億美元左右,其中人臉識(shí)別規(guī)模約26.53億美元,占比在20%左右。預(yù)計(jì)到2021年,全球人臉識(shí)別市場(chǎng)預(yù)計(jì)將達(dá)到63.7億美元,按預(yù)計(jì)期間的復(fù)合增長(zhǎng)率達(dá)17.83%。
2、中國(guó)人臉識(shí)別市場(chǎng)
前瞻根據(jù)人臉識(shí)別行業(yè)發(fā)展現(xiàn)狀,估算我國(guó)人臉識(shí)別市場(chǎng)規(guī)模約占全球市場(chǎng)的10%左右。2010-2016年,我國(guó)人臉識(shí)別市場(chǎng)規(guī)模逐年增長(zhǎng),年均復(fù)合增長(zhǎng)率達(dá)27%。2016年,我國(guó)人臉識(shí)別行業(yè)市場(chǎng)規(guī)模約為17.25億元,同比增長(zhǎng)27.97%,增速較上年上升4.64個(gè)百分點(diǎn)。
3、國(guó)內(nèi)主要玩家分布
1)中國(guó)部分人臉識(shí)別公司(排名不分先后)
2) 四大獨(dú)角獸介紹及對(duì)比細(xì)分領(lǐng)域
(1)曠視科技:
2014年,獲阿里巴巴旗下螞蟻金服投資,主攻金融和監(jiān)控兩大行業(yè),有子公司曠視智安;團(tuán)隊(duì)成員除了幾名來(lái)自清華校友外,還有來(lái)自美國(guó)哥倫比亞大學(xué)、英國(guó)牛津大學(xué)和美國(guó)南加州大學(xué)的科研及開(kāi)發(fā)人員,截至目前核心員工僅有百余人。
在金融、安防、零售領(lǐng)域分別開(kāi)始了商業(yè)化探索成功發(fā)育出Face++Financial,F(xiàn)ace++Security,F(xiàn)ace++BI等垂直人臉驗(yàn)證解決方案,主要將人臉識(shí)別應(yīng)用在互聯(lián)網(wǎng)產(chǎn)品上,自己做研發(fā),在美圖秀秀、淘寶等互聯(lián)網(wǎng)領(lǐng)域得到良好的應(yīng)用,在金融領(lǐng)域的市場(chǎng)一直占據(jù)沙發(fā)前排陣營(yíng);2017年獲得33億元C+輪融資,最后選擇通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)與NLP技術(shù)的結(jié)合,制造出能“識(shí)別萬(wàn)物”的智能機(jī)器人,提供硬件模組,里面內(nèi)置他們家的算法。目前正在準(zhǔn)備啟動(dòng)IPO的步伐,VIE架構(gòu)讓他們得以繞過(guò)A股,不用達(dá)到連續(xù)三年盈利的標(biāo)準(zhǔn)實(shí)現(xiàn)快速上市。
(2)商湯科技:
SenseTime(商湯科技),獲IDG資本投資,主攻金融、移動(dòng)互聯(lián)網(wǎng)、安防監(jiān)控三大行業(yè);由香港中文大學(xué)的湯曉歐院士創(chuàng)建,“商湯”中的湯指的就是湯曉歐本人,湯曉鷗及其研究團(tuán)隊(duì)所開(kāi)發(fā)的DeepID算法率先將深度學(xué)習(xí)應(yīng)用到人臉識(shí)別上,在技術(shù)指標(biāo)上實(shí)現(xiàn)了新的突破。主要案例是圍繞各個(gè)美化軟件與直播平臺(tái)制作人臉貼圖,重點(diǎn)強(qiáng)化了人臉識(shí)別的關(guān)鍵點(diǎn)檢測(cè)及跟蹤技術(shù)。
團(tuán)隊(duì)有300多號(hào),也從當(dāng)初toC轉(zhuǎn)向toB領(lǐng)域;成立于2014年的商湯科技選擇另辟蹊徑,選擇用“四大美女”這個(gè)話題讓人們?cè)陝?dòng)起來(lái),到最后四大美女走了三個(gè);商湯的網(wǎng)絡(luò)都是自己設(shè)計(jì)的,這樣對(duì)于深度學(xué)習(xí)網(wǎng)絡(luò)的掌控力就會(huì)更強(qiáng),提供SaaS服務(wù)的同時(shí),可以通過(guò)SaaS把背后的數(shù)據(jù)拿到,再進(jìn)行更多更細(xì)致的分析再次提升服務(wù)質(zhì)量。
(3)云從科技:
2015年4月,周曦拿到戰(zhàn)略投資成立云從科技,同年針對(duì)金融和銀行業(yè)推出了40多種解決方案,包含從算法、產(chǎn)品、銷(xiāo)售、售后的全產(chǎn)業(yè)鏈打造,針對(duì)農(nóng)行、建行、交行、中行及多地公安提供定制化服務(wù)。團(tuán)隊(duì)成員除了來(lái)自中科大的校友外,還來(lái)自中國(guó)科學(xué)院各大研究所、UIUC、IBM、NEC、MicroSoft等全球頂尖學(xué)府及研究機(jī)構(gòu)。
截止2016年11月,成立一年半,研發(fā)團(tuán)隊(duì)擴(kuò)展為200余名,核心產(chǎn)品是人臉識(shí)別系統(tǒng)及IBIS集成生物識(shí)別平臺(tái),還具備3D模型、紅外活體、靜默活體等技術(shù),可根據(jù)場(chǎng)景需求自由調(diào)節(jié)。選擇連接硬件、開(kāi)發(fā)與技術(shù),屬于全產(chǎn)業(yè)鏈模式,因?yàn)槿四樧R(shí)別系統(tǒng)多數(shù)情況下需要深度定制,只有這樣,才能在客戶提出需求的情況下迅速反饋,修改,統(tǒng)一用戶體驗(yàn)。
(4)依圖科技:
2012 年九月,朱瓏與他的好友林晨曦在創(chuàng)立依圖科技,這家從事人工智能創(chuàng)新性研究的創(chuàng)企從圖像識(shí)別入手,首先與全國(guó)省市級(jí)公安系統(tǒng)合作,對(duì)車(chē)輛品牌、型號(hào)等進(jìn)行精準(zhǔn)識(shí)別,隨后擴(kuò)展到人像識(shí)別,通過(guò)靜態(tài)人像比對(duì)技術(shù)和動(dòng)態(tài)人像比對(duì)技術(shù),協(xié)助公安系統(tǒng)進(jìn)行人員身份核查、追逃、監(jiān)控、關(guān)系挖掘等。
發(fā)展近 6年,依圖科技的產(chǎn)品已經(jīng)應(yīng)用到全國(guó)二十多個(gè)省市地區(qū)的安防領(lǐng)域,安防領(lǐng)域之外,依圖也進(jìn)入智慧城市領(lǐng)域和健康醫(yī)療領(lǐng)域,它要協(xié)助政府構(gòu)建"城市大腦",也希望將醫(yī)療領(lǐng)域的巨大知識(shí)鴻溝縮小,改善醫(yī)患體驗(yàn)。
(5)細(xì)分領(lǐng)域?qū)Ρ缺?/p>
(6)主要客戶對(duì)比
4、商業(yè)模式
1)人臉識(shí)別商業(yè)模式設(shè)計(jì)步驟
2)人臉識(shí)別盈利模式
三、人臉識(shí)別的流程及主要技術(shù)
1、人臉識(shí)別系統(tǒng)組成
2、人臉識(shí)別的一般流程:
1)人臉采集:
(1)簡(jiǎn)介:
不同的人臉圖像通過(guò)攝像鏡頭采集得到,比如靜態(tài)圖像、動(dòng)態(tài)圖像、不同的位置、不同表情等,當(dāng)采集對(duì)象在設(shè)備的拍攝范圍內(nèi)時(shí),采集設(shè)備會(huì)自動(dòng)搜索并拍攝人臉圖像。
(2)人臉采集的主要影響因素:
圖像大?。喝四槇D像過(guò)小會(huì)影響識(shí)別效果,人臉圖像過(guò)大會(huì)影響識(shí)別速度。非專(zhuān)業(yè)人臉識(shí)別攝像頭常見(jiàn)規(guī)定的最小識(shí)別人臉像素為60*60或100*100以上。在規(guī)定的圖像大小內(nèi),算法更容易提升準(zhǔn)確率和召回率。圖像大小反映在實(shí)際應(yīng)用場(chǎng)景就是人臉離攝像頭的距離。
圖像分辨率:越低的圖像分辨率越難識(shí)別。圖像大小綜合圖像分辨率,直接影響攝像頭識(shí)別距離?,F(xiàn)4K攝像頭看清人臉的最遠(yuǎn)距離是10米,7K攝像頭是20米。
光照環(huán)境:過(guò)曝或過(guò)暗的光照環(huán)境都會(huì)影響人臉識(shí)別效果??梢詮臄z像頭自帶的功能補(bǔ)光或?yàn)V光平衡光照影響,也可以利用算法模型優(yōu)化圖像光線。
模糊程度:實(shí)際場(chǎng)景主要著力解決運(yùn)動(dòng)模糊,人臉相對(duì)于攝像頭的移動(dòng)經(jīng)常會(huì)產(chǎn)生運(yùn)動(dòng)模糊。部分?jǐn)z像頭有抗模糊的功能,而在成本有限的情況下,考慮通過(guò)算法模型優(yōu)化此問(wèn)題。
遮擋程度:五官無(wú)遮擋、臉部邊緣清晰的圖像為最佳。而在實(shí)際場(chǎng)景中,很多人臉都會(huì)被帽子、眼鏡、口罩等遮擋物遮擋,這部分?jǐn)?shù)據(jù)需要根據(jù)算法要求決定是否留用訓(xùn)練。
采集角度:人臉相對(duì)于攝像頭角度為正臉最佳。但實(shí)際場(chǎng)景中往往很難抓拍正臉。因此算法模型需訓(xùn)練包含左右側(cè)人臉、上下側(cè)人臉的數(shù)據(jù)。工業(yè)施工上攝像頭安置的角度,需滿足人臉與攝像頭構(gòu)成的角度在算法識(shí)別范圍內(nèi)的要求。
2)人臉檢測(cè):
(1)簡(jiǎn)介:
在圖像中準(zhǔn)確標(biāo)定出人臉的位置和大小,并把其中有用的信息挑出來(lái)(如直方圖特征、顏色特征、模板特征、結(jié)構(gòu)特征及Haar特征等),然后利用信息來(lái)達(dá)到人臉檢測(cè)的目的。
(2)人臉關(guān)鍵點(diǎn)檢測(cè)(人臉對(duì)齊):
自動(dòng)估計(jì)人臉圖片上臉部特征點(diǎn)的坐標(biāo)。
(3)主流方法:
基于檢測(cè)出的特征采用Adaboost學(xué)習(xí)算法(一種用來(lái)分類(lèi)的方法,它把一些比較弱的分類(lèi)方法合在一起,組合出新的很強(qiáng)的分類(lèi)方法)挑選出一些最能代表人臉的矩形特征(弱分類(lèi)器),按照加權(quán)投票的方式將弱分類(lèi)器構(gòu)造為一個(gè)強(qiáng)分類(lèi)器,再將訓(xùn)練得到的若干強(qiáng)分類(lèi)器串聯(lián)組成一個(gè)級(jí)聯(lián)結(jié)構(gòu)的層疊分類(lèi)器,有效地提高分類(lèi)器的檢測(cè)速度。
最近人臉檢測(cè)算法模型的流派包括三類(lèi)及其之間的組合:viola-jones框架(性能一般速度尚可,適合移動(dòng)端、嵌入式上使用),dpm(速度較慢),cnn(性能不錯(cuò))。
3)人臉圖像預(yù)處理:
(1)簡(jiǎn)介:
基于人臉檢測(cè)結(jié)果,對(duì)圖像進(jìn)行處理并最終服務(wù)于特征提取的過(guò)程。
(2)原因:
系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機(jī)干擾,往往不能直接使用,必須在圖像處理 的早期階段對(duì)它進(jìn)行灰度矯正、噪聲過(guò)濾等圖像預(yù)處理。
(3)主要預(yù)處理過(guò)程:
人臉對(duì)準(zhǔn)(得到人臉位置端正的圖像),人臉圖像的光線補(bǔ)償,灰度變換、直方圖均衡化、歸一 化(取得尺寸一致,灰度取值范圍相同的標(biāo)準(zhǔn)化人臉圖像),幾何校正、中值濾波(圖片的平滑操作以消除噪聲)以及銳化等。
4)人臉特征提?。?/p>
(1)簡(jiǎn)介:
人臉識(shí)別系統(tǒng)可使用的特征通常分為視覺(jué)特征、像素統(tǒng)計(jì)特征、人臉圖像變換系數(shù)特征、人臉圖像代數(shù)特征等。人臉特征提取就是針對(duì)人臉的某些特征進(jìn)行的,也稱(chēng)人臉表征,它是對(duì)人臉進(jìn)行特征建模的過(guò)程
(2)人臉特征提取的方法:
1、基于知識(shí)的表征方法(主要包括基于幾何特征法和模板匹配法):
根據(jù)人臉器官的形狀描述以及它們之間的距離特性來(lái)獲得有助于人臉?lè)诸?lèi)的特征數(shù)據(jù),其特征分量通常包括特征點(diǎn)間的歐氏距離、曲率、和角度等。人臉由眼睛、鼻子、嘴、下巴等局部構(gòu)成,對(duì)這些局部和他們之間結(jié)構(gòu)關(guān)系的幾何描述,可作為識(shí)別人臉的重要特征,這些特征被稱(chēng)為幾何特征。
2、基于代數(shù)特征或統(tǒng)計(jì)學(xué)習(xí)的表征方法:
基于代數(shù)特征方法的基本思想是將人臉在空域內(nèi)的高維描述轉(zhuǎn)化為頻域或者其他空間內(nèi)的低維描述,其表征方法為線性投影表征方法和非線性投影表征方法。
基于線性投影的方法主要有主成分分析法或稱(chēng)K-L變化、獨(dú)立成分分析法和Fisher線性判別分析法。非線性特征提取方法有兩個(gè)重要的分支:基于核的特征提取技術(shù)和以流形學(xué)習(xí)為主導(dǎo)的特征提取技術(shù)。
5)匹配與識(shí)別:
提取的人臉特征值數(shù)據(jù)與數(shù)據(jù)庫(kù)中存貯的特征模板進(jìn)行搜索匹配,通過(guò)設(shè)定一個(gè)閾值,將相似度與這一閾值進(jìn)行比較,來(lái)對(duì)人臉的身份信息進(jìn)行判斷。
3、人臉識(shí)別的主要方法
1)Eigen Face(特征臉)
MIT實(shí)驗(yàn)室的特克(Turk)和潘特(Pentland)提出的“特征臉”方法無(wú)疑是這一時(shí)期內(nèi)最負(fù)盛名的 人臉識(shí)別方法。其后的很多人臉識(shí)別技術(shù)都或多或少與特征臉有關(guān)系,現(xiàn)在特征臉已經(jīng)與歸一化的協(xié)相關(guān) 量(Normalized Correlation)方法一道成為人臉識(shí)別的性能測(cè)試基準(zhǔn)算法。
blog.csdn.net/zizi7/art(人臉識(shí)別特征臉?biāo)惴ㄎ臋n)
2)Fisher Face(漁夫臉):
貝爾胡米爾(Belhumeur)等提出的 Fisherface 人臉識(shí)別方法是這一時(shí)期的另一重要成果。該方法 首先采用主成分分析(PCA)對(duì)圖像表觀特征進(jìn)行降維。在此基礎(chǔ)上,采用線性判別分析(LDA)的方法 變換降維后的主成分以期獲得“盡量大的類(lèi)間散度和盡量小的類(lèi)內(nèi)散度”。該方法目前仍然是主流的人臉 識(shí)別方法之一,產(chǎn)生了很多不同的變種,比如零空間法、子空間判別模型、增強(qiáng)判別模型、直接的 LDA 判 別方法以及近期的一些基于核學(xué)習(xí)的改進(jìn)策略。
https://blog.csdn.net/zizi7/article/details/52999432(Fisher Face算法文檔)
3)EGM(彈性圖匹配)
其基本思想是用一個(gè)屬性圖來(lái)描述人臉:屬性圖的頂點(diǎn)代表面部關(guān)鍵特征點(diǎn),其屬性為相應(yīng)特征點(diǎn)處 的多分辨率、多方向局部特征——Gabor變換12特征,稱(chēng)為Jet;邊的屬性則為不同特征點(diǎn)之間的幾何 關(guān)系。對(duì)任意輸入人臉圖像,彈性圖匹配通過(guò)一種優(yōu)化搜索策略來(lái)定位預(yù)先定義的若干面部關(guān)鍵特征點(diǎn), 同時(shí)提取它們的Jet特征,得到輸入圖像的屬性圖。最后通過(guò)計(jì)算其與已知人臉屬性圖的相似度來(lái)完成識(shí) 別過(guò)程。該方法的優(yōu)點(diǎn)是既保留了面部的全局結(jié)構(gòu)特征,也對(duì)人臉的關(guān)鍵局部特征進(jìn)行了建模。
blog.csdn.net/real_myth(彈性圖匹配算法文檔)
4)基于幾何特征的方法
幾何特征可以是眼、鼻、嘴等的形狀和它們之間的幾何關(guān)系(如相互之間的距離)。這些算法識(shí)別速 度快,需要的內(nèi)存小,但識(shí)別率較低。
5)基于神經(jīng)網(wǎng)絡(luò)的方法
神經(jīng)網(wǎng)絡(luò)的輸入可以是降低分辨率的人臉圖像、局部區(qū)域的自相關(guān)函數(shù)、局部紋理的二階矩等。這類(lèi)方法同樣需要較多的樣本進(jìn)行訓(xùn)練,而在許多應(yīng)用中,樣本數(shù)量是很有限的。
6)基于線段Hausdorff 距離(LHD) 的方法
心理學(xué)的研究表明,人類(lèi)在識(shí)別輪廓圖(比如漫畫(huà))的速度和準(zhǔn)確度上絲毫不比識(shí)別灰度圖差。LHD是基于從人臉灰度圖像中提取出來(lái)的線段圖的,它定義的是兩個(gè)線段集之間的距離,與眾不同的是,LHD并不建立不同線段集之間線段的一一對(duì)應(yīng)關(guān)系,因此它更能適應(yīng)線段圖之間的微小變化。實(shí)驗(yàn)結(jié)果表明,LHD在不同光照條件下和不同姿態(tài)情況下都有非常出色的表現(xiàn),但是它在大表情的情況下識(shí)別效果不好。
7)基于支持向量機(jī)(SVM) 的方法
近年來(lái),支持向量機(jī)是統(tǒng)計(jì)模式識(shí)別領(lǐng)域的一個(gè)新的熱點(diǎn),它試圖使得學(xué)習(xí)機(jī)在經(jīng)驗(yàn)風(fēng)險(xiǎn)和泛化能力上達(dá)到一種妥協(xié),從而提高學(xué)習(xí)機(jī)的性能。支持向量機(jī)主要解決的是一個(gè)2分類(lèi)問(wèn)題,它的基本思想是試圖把一個(gè)低維的線性不可分的問(wèn)題轉(zhuǎn)化成一個(gè)高維的線性可分的問(wèn)題。通常的實(shí)驗(yàn)結(jié)果表明SVM有較好的識(shí)別率,但是它需要大量的訓(xùn)練樣本(每類(lèi)300個(gè)),這在實(shí)際應(yīng)用中往往是不現(xiàn)實(shí)的。而且支持向量機(jī)訓(xùn)練時(shí)間長(zhǎng),方法實(shí)現(xiàn)復(fù)雜,該函數(shù)的取法沒(méi)有統(tǒng)一的理論。
4、技術(shù)發(fā)展方向
1)結(jié)合三維信息:二維和三維信息融合使特征更加魯棒
2)多特征融合:?jiǎn)我惶卣麟y以應(yīng)對(duì)復(fù)雜的光照和姿態(tài)變化
3)大規(guī)模人臉比對(duì):面向海量數(shù)據(jù)的人臉比對(duì)與搜索
4)深度學(xué)習(xí):在大數(shù)據(jù)條件下充分發(fā)揮深度神經(jīng)網(wǎng)絡(luò)強(qiáng)大的學(xué)習(xí)能力
5、人臉識(shí)別數(shù)據(jù)庫(kù)
1)Yale人臉數(shù)據(jù)庫(kù)
2)ORL人臉數(shù)據(jù)庫(kù)
3)CMU PIE人臉數(shù)據(jù)庫(kù)
4)FERET人臉數(shù)據(jù)庫(kù)
5)MIT數(shù)據(jù)庫(kù)
6)BANCA人臉數(shù)據(jù)庫(kù)
7)CAS-PEAL人臉數(shù)據(jù)庫(kù)
8)JAFE表情數(shù)據(jù)庫(kù)
9)Cohn-Kanade表情數(shù)據(jù)庫(kù)
10)MMI表情數(shù)據(jù)庫(kù)
6、技術(shù)指標(biāo)
1)人臉檢測(cè)中的關(guān)鍵指標(biāo):
例子:在攝像頭某張抓拍圖像中,一共有100張人臉,算法檢測(cè)出80張人臉,其中75張是真實(shí)人臉,5 張是把路標(biāo)誤識(shí)為人臉。
1、檢測(cè)率:識(shí)別正確的人臉/圖中所有的人臉。檢測(cè)率越高,代表檢測(cè)模型效果越好。
2、誤檢率:識(shí)別錯(cuò)誤的人臉/識(shí)別出來(lái)的人臉。誤檢率越低,代表檢測(cè)模型效果越好。
3、漏檢率:未識(shí)別出來(lái)的人臉/圖中所有的人臉。漏檢率越低,代表檢測(cè)模型效果越好。
4、速度:從采集圖像完成到人臉檢測(cè)完成的時(shí)間。時(shí)間約短,檢測(cè)模型效果越好。
在這個(gè)實(shí)際案例中:檢測(cè)率=75/100 誤檢率=5/80 漏檢率=(100-75)/100
2)人臉識(shí)別中的關(guān)鍵指標(biāo):
1000張樣本圖片里,共600張正樣本。相似度為0.9的圖片一共100張,其中正樣本為99張。雖然0.9閾值的正確率很高,為99/100;但是0.9閾值正確輸出的數(shù)量確很少,只有99/600。這樣很容易發(fā)生漏識(shí)的情況。
1、精確率(precision):識(shí)別為正確的樣本數(shù)/識(shí)別出來(lái)的樣本數(shù)=99/100
2、召回率(recall):識(shí)別為正確的樣本數(shù)/所有樣本中正確的數(shù)=99/600
3、錯(cuò)誤接受率/認(rèn)假率/誤識(shí)率(FARFalse Accept Rate):
1、定義:指將身份不同的兩張照片,判別為相同身份,越低越好
2、FAR = NFA / NIRA
3、式中 NIRA 代表的是類(lèi)間測(cè)試次數(shù),既不同類(lèi)別間的測(cè)試次數(shù),打比方如果有1000個(gè)識(shí)別 模型,有1000個(gè)人要識(shí)別,而且每人只提供一個(gè)待識(shí)別的素材,那 NIRA=1000*(1000-1) 。NFA是錯(cuò)誤接受次數(shù)。
4、FAR決定了系統(tǒng)的安全性,F(xiàn)RR決定了系統(tǒng)的易用程度,在實(shí)際中,F(xiàn)AR對(duì)應(yīng)的風(fēng)險(xiǎn)遠(yuǎn)遠(yuǎn)高于FRR,因此,生物識(shí)別系統(tǒng)中,會(huì)將FAR設(shè)置為一個(gè)非常低的范圍,如萬(wàn)分之一甚至百萬(wàn)分之一,在FAR固定的條件下,F(xiàn)RR低于5%,這樣的系統(tǒng)才有實(shí)用價(jià)值。
4、錯(cuò)誤拒絕率/拒真率/拒識(shí)率(FRR False Reject Rate):
1、定義:指將身份相同的兩張照片,判別為不同身份,越低越好
2、FRR = NFR / NGRA
3、上式中NFR是類(lèi)內(nèi)測(cè)試次數(shù),既同類(lèi)別內(nèi)的測(cè)試次數(shù),打比方如果有1000個(gè)識(shí)別模型, 有1000個(gè)人要識(shí)別, 而且每人只提供一個(gè)待識(shí)別的素 材,那 NIRA=1000,如果每個(gè)人提供N張圖片,那么 NIRA=N*1000 。NFR是錯(cuò)誤拒絕次數(shù)。
四、行業(yè)應(yīng)用
1、人臉識(shí)別(FR)+其他行業(yè)
1)FR+金融:
(1)實(shí)名認(rèn)證:
金融機(jī)構(gòu)傳統(tǒng)上使用人工肉眼判斷、短信驗(yàn)證、綁定銀行卡等手段進(jìn)行實(shí)名認(rèn)證。這些傳統(tǒng)手段存在準(zhǔn)確率不高、客戶體驗(yàn)較差、成本高等問(wèn)題,對(duì)金融企業(yè)業(yè)務(wù)發(fā)展造成了巨大的困擾?;谌四樧R(shí)別的實(shí)名認(rèn)證方式具有準(zhǔn)確率高(一億人中才存在兩人長(zhǎng)相相同)、客戶體驗(yàn)好(認(rèn)證速度快、客戶操作少)、成本低(相較于傳統(tǒng)認(rèn)證方式)的優(yōu)點(diǎn),已被眾多領(lǐng)先金融企業(yè)所采用。
(2)人臉識(shí)別在銀行遠(yuǎn)程開(kāi)戶上的應(yīng)用:
在遠(yuǎn)程開(kāi)戶時(shí),金融機(jī)構(gòu)可以通過(guò)智能終端在線上進(jìn)行身份鑒權(quán)驗(yàn)證,使用人臉識(shí)別技術(shù)開(kāi)戶可以極大提升業(yè)務(wù)辦理的安全性、時(shí)效性,并節(jié)省大量人力;
(3)刷臉取款:
在這方面人臉取代了銀行卡,只需要人臉+密碼即可完成取款。在前兩個(gè)方面,人臉識(shí)別技術(shù)已經(jīng)被國(guó)內(nèi)各大銀行廣泛采用,刷臉取款方面,農(nóng)行和招行搶先一步在ATM上線了刷臉取款功能。
2)FR+醫(yī)療:
(1)重點(diǎn)應(yīng)用:
1、打擊涉醫(yī)犯罪,確保就診安全。
建立有針對(duì)性的涉醫(yī)犯罪人員布控庫(kù),與屬地公安部門(mén)配合,進(jìn)行實(shí)時(shí)布控。
2、管控職務(wù)犯罪,控制不當(dāng)競(jìng)爭(zhēng)。
對(duì)進(jìn)入醫(yī)院診療區(qū)域的醫(yī)藥代表進(jìn)行管控,協(xié)助解決藥品流通領(lǐng)域經(jīng)營(yíng)不規(guī)范、競(jìng)爭(zhēng)失序等問(wèn)題。
3、杜絕職業(yè)醫(yī)鬧,保護(hù)人身安全。
打擊頻繁出現(xiàn)的職業(yè)醫(yī)鬧,提高事件的響應(yīng)速度,從被動(dòng)響應(yīng)變?yōu)橹鲃?dòng)預(yù)防。
4、規(guī)范就診流程,和諧醫(yī)患關(guān)系。
重點(diǎn)防范黃牛、醫(yī)托等干擾正常就診秩序的特殊人群。
5、加強(qiáng)監(jiān)管力度,維護(hù)醫(yī)?;稹?/p>
實(shí)現(xiàn)就診病人與醫(yī)保信息庫(kù)中身份證照的比對(duì),杜絕冒用醫(yī)保卡的現(xiàn)象。
6、易肇事肇禍嚴(yán)重精神障礙患者管控。
結(jié)合“雪亮工程”,確保嚴(yán)重精神障礙患者流入地、流出地發(fā)現(xiàn)管控到位。
(2)人臉識(shí)別在醫(yī)療行業(yè)的應(yīng)用突破基于三點(diǎn):
1、獲取到目標(biāo)對(duì)象的信息:
因?yàn)樾姓w系不同,醫(yī)療行業(yè)想獲取到目標(biāo)對(duì)象信息存在較大困難,需相關(guān)行政單位進(jìn)行關(guān)鍵的協(xié)調(diào)工作。目標(biāo)對(duì)象信息包含但不局限于:人臉照片、人像照片、人員基本信息、人員動(dòng)態(tài)等。
2、人臉識(shí)別的算法進(jìn)一步提升:
目前的人臉識(shí)別算法的精度已經(jīng)達(dá)到了相當(dāng)高的水準(zhǔn),誤報(bào)、漏報(bào)均已控制在可接受范圍;更近一步的算法,可以從非結(jié)構(gòu)化的視頻/圖片中獲取更多的價(jià)值信息,從更多地維度來(lái)實(shí)現(xiàn)不同的應(yīng)用。
3、管理者思維和水平的提升:
人工智能、人臉識(shí)別是革命性顛覆性的技術(shù),可以給醫(yī)療行業(yè)帶來(lái)巨大的提升。如何將人臉識(shí)別真正應(yīng)用到醫(yī)療行業(yè)的各方各面需要管理者與技術(shù)提供方一起拓展思維、共同努力。
(3)人臉識(shí)別在醫(yī)療行業(yè)的前景:
1、對(duì)接公安視頻監(jiān)控、醫(yī)警聯(lián)動(dòng)平臺(tái):
系統(tǒng)滿足公安現(xiàn)有標(biāo)準(zhǔn)要求,后續(xù)可與公安機(jī)關(guān)視頻監(jiān)控、醫(yī)警聯(lián)動(dòng)等平臺(tái)進(jìn)行無(wú)縫對(duì)接,將報(bào)警信息及關(guān)聯(lián)的視頻、圖片推送給轄區(qū)派出所,實(shí)現(xiàn)聯(lián)動(dòng)。
2、人臉身份查證:
輸入目標(biāo)人員照片,即可知道此人身份及其是否屬于重點(diǎn)管控人員,是否曾經(jīng)來(lái)過(guò)醫(yī)院,及其出現(xiàn)時(shí)間、頻次??捎糜诤Y查可疑人員,找到其活動(dòng)規(guī)律。
3、人員軌跡回放:
輸入目標(biāo)人員照片,即可查詢此人是否來(lái)過(guò)醫(yī)院,到過(guò)哪些地方。此功能可還原特定人員的行動(dòng)軌跡,用于嫌疑人行為研判和事后取證。
4、對(duì)接門(mén)禁系統(tǒng):
與門(mén)禁系統(tǒng)對(duì)接,預(yù)留刷臉開(kāi)門(mén)、人臉考勤等高級(jí)功能,方便辦公區(qū)、手術(shù)室、藥品庫(kù)、住院部等區(qū)域的出入管理。
5、對(duì)接刷卡系統(tǒng):
與二代證、醫(yī)??ǖ人⒖ㄏ到y(tǒng)對(duì)接,將采集的人臉照片與證件上存儲(chǔ)的照片進(jìn)行比對(duì),驗(yàn)證刷卡人的真實(shí)身份。
3)FR+新零售:
(1)應(yīng)用人臉識(shí)別的優(yōu)勢(shì)
1、為重點(diǎn)客戶畫(huà)像:
幫助賣(mài)家獲得顧客和潛在顧客更精準(zhǔn)的信息,構(gòu)建用戶畫(huà)像。可以安裝在超市、商場(chǎng)、門(mén)店等入口,統(tǒng)計(jì)每天進(jìn)入門(mén)店的人數(shù)、大致年齡和性別等;另一種可以安裝在貨架上,分析客戶的關(guān)注點(diǎn)和消費(fèi)習(xí)慣等。通過(guò)大數(shù)據(jù)分析挖掘回頭客,提升客戶提袋率和VIP轉(zhuǎn)化率;
2、為零售商降本增益:
以智能化系統(tǒng)來(lái)代替人工,以人臉識(shí)別系統(tǒng)連接支付端來(lái)代替收銀員,能跟快實(shí)現(xiàn)零售店的導(dǎo)流和商品人流分析等。
3、減少突發(fā)事件的產(chǎn)生:
門(mén)店遇到商品失竊的突發(fā)事件,通過(guò)對(duì)所獲數(shù)據(jù)的分析,也可以將不良客戶拉入“黑名單”或是降低其信用水平。
4、完美連接線上線下:
識(shí)別系統(tǒng)獲得的用戶偏好還能反哺線上,將所得數(shù)據(jù)通過(guò)線上反饋給廠商,助力于廠商更全面地了解消費(fèi)者需求,進(jìn)而精準(zhǔn)地研發(fā)產(chǎn)品,設(shè)計(jì)營(yíng)銷(xiāo)策略。這些都是完美實(shí)現(xiàn)新零售“打通線上線下”內(nèi)在要求的極佳方式。
(2)人臉識(shí)別的安全隱患:
1、人臉特征容易被復(fù)制:
眾所周知,破解密碼的最常用手段是復(fù)制,通過(guò)竊取數(shù)字密碼以及套取指紋來(lái)解密的案例己經(jīng)不勝枚舉。與記錄在大腦中或其他介質(zhì)上面的數(shù)字密碼相比,暴露在外面的人臉更容易被復(fù)制。通過(guò)拍照完全可以獲得一個(gè)人的臉部特征并進(jìn)行復(fù)制,利用整容技術(shù)或者用照片識(shí)別等欺詐的方法可以騙過(guò)人臉支付系統(tǒng)。
2、個(gè)人信息泄露問(wèn)題。
在科技發(fā)達(dá)的今天,人們似乎很輕易就可以通過(guò)無(wú)孔不入的渠道查到消費(fèi)者的各種信息。而對(duì)于刷臉支付來(lái)講,像人臉特征這種人體密碼一旦交給別人保管,個(gè)人信息的安全系數(shù)將如何確保?獲取用戶的面部特征是否會(huì)涉及到個(gè)人隱私?基于面部掃描系統(tǒng)的支付在普遍應(yīng)用之后會(huì)不會(huì)帶來(lái)基于位置服務(wù)造成的個(gè)人行蹤泄露?
4)FR+安防:
(1)智慧城市的基礎(chǔ)
1、視頻分析:
基于視頻中的人臉照片進(jìn)行遠(yuǎn)距離、快速、無(wú)接觸式的重點(diǎn)人員布控預(yù)警。讓?xiě)?yīng)用于車(chē)站、機(jī)場(chǎng)、地鐵等重點(diǎn)場(chǎng)所和大型商場(chǎng)超市等人群密集的公共場(chǎng)所視頻監(jiān)控系統(tǒng)能夠?qū)σ曨l圖像進(jìn)行采集、自動(dòng)分析、抓取人臉實(shí)時(shí)比對(duì),主動(dòng)在監(jiān)控場(chǎng)景中識(shí)別重點(diǎn)關(guān)注人員,實(shí)現(xiàn)重點(diǎn)人員的布控和識(shí)別。
2、重要場(chǎng)所的布控:
對(duì)機(jī)場(chǎng)、車(chē)站、港口、地鐵重點(diǎn)場(chǎng)所和大型商超等人群密集公共場(chǎng)所進(jìn)行布控,以達(dá)到對(duì)一些重點(diǎn)人員的排查,抓捕逃犯等目的。
3、靜態(tài)庫(kù)或身份庫(kù)的檢索:
對(duì)常住人口、暫住人口的人臉圖片進(jìn)行預(yù)先建庫(kù),通過(guò)輸入各種渠道采集的人臉圖片,能夠進(jìn)行比對(duì)和按照相似度排序,進(jìn)而獲悉輸入人員的身份或者其他關(guān)聯(lián)信息,此類(lèi)應(yīng)用存在兩種擴(kuò)展形式,單一身份庫(kù)自動(dòng)批量比對(duì)并發(fā)現(xiàn)疑似的一個(gè)人員具有兩個(gè)或以上身份信息的靜態(tài)庫(kù)查重,兩個(gè)身份庫(kù)之間自動(dòng)交叉比對(duì)發(fā)現(xiàn)交集數(shù)據(jù)的靜態(tài)庫(kù)碰撞。
4、動(dòng)態(tài)庫(kù)或抓拍庫(kù)的檢索:
對(duì)持續(xù)采集的各攝像頭點(diǎn)位的抓拍圖片建庫(kù),通過(guò)輸入一張指定人員的人臉圖片,獲得其在指定時(shí)間范圍和指定攝像頭點(diǎn)位出現(xiàn)的所有抓拍記錄,方便快速瀏覽,當(dāng)攝像頭點(diǎn)位關(guān)聯(lián)GIS系統(tǒng),則可以進(jìn)一步的按照時(shí)間順序排列檢索得到的抓拍記錄,并繪制到GIS上,得到人員運(yùn)動(dòng)的軌跡。
(2)反恐行動(dòng)的助力
現(xiàn)在新疆、西藏等城市都將人臉識(shí)別作為基礎(chǔ)設(shè)施建設(shè)領(lǐng)域的投資重點(diǎn),由于人員復(fù)雜、居住人口相對(duì)混亂等因素,這些城市成為了恐怖襲擊等違法犯罪行為的高發(fā)場(chǎng)所。而人臉識(shí)別技術(shù)采用人臉檢測(cè)算法、人臉跟蹤算法、人臉質(zhì)量評(píng)分算法以及人臉識(shí)別算法。實(shí)現(xiàn)城市居住人員人臉的抓拍采集、建模存儲(chǔ),實(shí)時(shí)黑名單比對(duì)報(bào)警和人臉后檢索等功能。能及時(shí)在危險(xiǎn)發(fā)生之前制止。
(3)兒童安全的保鏢
近年來(lái)兒童拐賣(mài)活動(dòng)越來(lái)越猖獗,為了更好的保護(hù)兒童安全,有些幼兒園、小學(xué)在門(mén)口已經(jīng)安裝上了面部識(shí)別系統(tǒng)。系統(tǒng)采用人臉識(shí)別加IC/ID卡(非接觸式智能卡) 雙重認(rèn)證:每一位幼兒在入學(xué)注冊(cè)時(shí)進(jìn)行相關(guān)登記:資料、面像、IC/ID卡號(hào)、接送者、接送者面像。
每次入園時(shí)刷卡進(jìn)行報(bào)道,放學(xué)時(shí)刷卡并進(jìn)行接送家長(zhǎng)人臉認(rèn)證,如果認(rèn)證失敗拍照后即報(bào)警通知管理員,如果認(rèn)證成功即拍照放行。不論識(shí)別成功與否,系統(tǒng)都會(huì)記錄下被識(shí)別者圖像。每一次接送都有詳細(xì)的時(shí)間、接送人員的照片可供查詢。另外系統(tǒng)提供短信提示的擴(kuò)展功能,家長(zhǎng)可在手機(jī)上看到人臉識(shí)別認(rèn)證時(shí)所拍的照片,從而監(jiān)控到接送這個(gè)過(guò)程,從其中一個(gè)重要源頭杜絕了兒童被拐的可能性。
(4)智慧酒店的管理
以前開(kāi)房登記流程是:接待人員問(wèn)詢——身份證掃描確認(rèn)——支付押金——選房層發(fā)房卡——打印紙質(zhì)票據(jù),這些流程非常繁雜,尤其是身份認(rèn)證耗時(shí)最長(zhǎng),若遇到團(tuán)隊(duì)入住情況則更為復(fù)雜,身份證識(shí)別設(shè)備可能會(huì)因高頻使用出現(xiàn)故障,而急于進(jìn)房間休息的顧客卻只能在前臺(tái)等待手續(xù)完成,客戶體驗(yàn)非常糟糕。
人臉識(shí)別技術(shù)就能很好的解決這一難題,幫助酒店實(shí)現(xiàn)系統(tǒng)化業(yè)務(wù)管理和一站式共享解決方案。智慧酒店的安防系統(tǒng)利用人臉識(shí)別技術(shù),當(dāng)顧客走到前臺(tái)時(shí)系統(tǒng)已經(jīng)自動(dòng)根據(jù)顧客被攝像頭捕捉到的影像調(diào)取顧客身份核對(duì)。整個(gè)驗(yàn)證核對(duì)過(guò)程簡(jiǎn)單、快速且實(shí)現(xiàn)了自動(dòng)化,更大幅降低了人工識(shí)別造成的誤差。而且,針對(duì)酒店VIP客人,系統(tǒng)可實(shí)時(shí)對(duì)比酒店大堂的攝像頭影像和登記在酒店基礎(chǔ)系統(tǒng)中的VIP面部數(shù)據(jù),當(dāng)VIP客人到達(dá)時(shí),酒店可第一時(shí)間提供個(gè)性化周到服務(wù),提高客戶的滿意度。
5)FR+公安
(1)尋人尋親:
對(duì)老百姓或其他業(yè)務(wù)部門(mén)提供的照片,直接送入系統(tǒng)進(jìn)行比對(duì)、檢索、篩選,最后人工確認(rèn)。
(2)派出所擋獲違法人員:
對(duì)派出所擋獲的人員,登記筆錄,對(duì)于其中一些少數(shù)民族、聾啞人或保持沉默者等無(wú)法查證身份的人員,可拍攝照片送入各種照片庫(kù)中比對(duì),排查涉及大案要案人員,以免漏網(wǎng);或查證其前科,累計(jì)處理。
(3)查證無(wú)名尸源:
需要查證無(wú)名尸源時(shí),先拍攝正面照片,送入計(jì)算機(jī),如果照片閉眼、破損或變形,可用人像合成系統(tǒng)或人工繪制一幅標(biāo)準(zhǔn)照,送入比對(duì)系統(tǒng)比對(duì)查證。
(4)目擊者描述排查:
獲得現(xiàn)場(chǎng)目擊者對(duì)嫌疑人的形象描述后,可用人像合成系統(tǒng)進(jìn)行排查。
(5)視頻監(jiān)控照片:
一般監(jiān)控系統(tǒng)針對(duì)場(chǎng)景,得到的涉案嫌疑人的圖像都有模糊、偏轉(zhuǎn)、逆?zhèn)裙獾荣|(zhì)量不佳問(wèn)題,這時(shí)需要根據(jù)圖像用人像合成系統(tǒng)或人工繪制一幅標(biāo)準(zhǔn)照,送入照片比對(duì)系統(tǒng)比對(duì)查證。
(6)公共場(chǎng)所集會(huì):
在政府、球場(chǎng)等公共場(chǎng)所,時(shí)常會(huì)有人員滋事,此時(shí)公安民警不便直接帶人處理,可以采用長(zhǎng)焦攝像機(jī)拍攝特寫(xiě)鏡頭,如果效果不夠好可以用人像合成系統(tǒng)修正,送入比對(duì)系統(tǒng)比對(duì)查證。
(7)一代/二代居民身份證識(shí)別:
根據(jù)犯罪人員的身份證照片信息,與系統(tǒng)照片庫(kù)中的信息資料進(jìn)行比對(duì),提取出與證件上照片相似的人員信息,能充分利用現(xiàn)有的二代身份證照片資源,為公安部門(mén)的工作提供高效有利的幫助。
(8)其他應(yīng)用:
常住人口的比對(duì)查詢、暫住人口的比對(duì)查詢、重點(diǎn)人口的比對(duì)查詢、CCIC在逃人員的比對(duì)查詢等。
6)FR+商業(yè)場(chǎng)景:
(1)訪客登記:訪客到訪公司,于平板電腦進(jìn)行訪客信息登記,由攝像頭自動(dòng)抓取人臉,通過(guò)系統(tǒng)打印出 訪客貼紙;
(2)識(shí)別迎賓:公司員工,貴賓進(jìn)入公司入口,攝像頭能識(shí)別到訪人員,實(shí)現(xiàn)門(mén)禁功能管理;
(3)人臉識(shí)別考勤:通過(guò)入口處的前臺(tái)平板電腦進(jìn)行人臉識(shí)別考勤,也可通過(guò)手機(jī)端進(jìn)行人臉識(shí)別考;
(4)智能生活:較多的園區(qū)、樓宇需要人臉門(mén)禁系統(tǒng),人員進(jìn)出快速通行,便于管理住戶、訪客的進(jìn)出記 錄;
(5)智慧教育:為嚴(yán)防替考事件的發(fā)生,確保考試安全,人臉識(shí)別可加強(qiáng)考試入場(chǎng)環(huán)節(jié)的考生身份認(rèn)證, 并有效實(shí)現(xiàn)智能視頻監(jiān)考、作弊防控等;
(6)智慧商場(chǎng):利用人臉識(shí)別技術(shù)追蹤并分析商場(chǎng)內(nèi)的人流屬性,人群分布等。
2、FR的部分應(yīng)用
1)人臉檢測(cè)跟蹤
1、應(yīng)用:
商場(chǎng)客流跟蹤分析,地鐵、火車(chē)站、會(huì)場(chǎng)、機(jī)場(chǎng)等場(chǎng)所的可疑人員的跟蹤檢測(cè),體育賽事的現(xiàn)場(chǎng)監(jiān)控等。
2、難點(diǎn):
多人臉跟蹤、遠(yuǎn)場(chǎng)識(shí)別人臉、背景復(fù)雜、低質(zhì)量圖片人臉識(shí)別(算法預(yù)處理),還有側(cè)臉(3D重建人物全面),遮擋,模糊,表情變化、強(qiáng)弱光(多特征融合增強(qiáng)抗干擾力)等各種實(shí)際環(huán) 境。
3、建議:遠(yuǎn)場(chǎng)識(shí)別(可依據(jù)距離識(shí)別)、背景復(fù)雜(可虛化無(wú)關(guān)場(chǎng)景,凸顯主角)。
2)人臉關(guān)鍵點(diǎn)定位
1、應(yīng)用:
可用于圖片的合成、動(dòng)態(tài)圖片的分析(直播行業(yè)鑒黃、鑒暴),通過(guò)關(guān)鍵點(diǎn)分析人臉表情情緒。
2、難點(diǎn):大角度側(cè)臉,表情變化、遮擋、模糊、明暗等,動(dòng)靜態(tài)關(guān)鍵點(diǎn)捕捉。
3、建議:對(duì)模糊部位可進(jìn)行平滑處理,根據(jù)眼睛、嘴的特點(diǎn)建立不同的區(qū)域塊等。
3)人臉身份認(rèn)證
1、應(yīng)用:
關(guān)鍵性應(yīng)用(金融身份認(rèn)證、海關(guān)檢查、火車(chē)站和機(jī)場(chǎng)等進(jìn)站),非關(guān)鍵性應(yīng)用(智慧小區(qū)居民進(jìn)出、辦公大樓進(jìn)出、公司單位上班打卡等)
2、難點(diǎn):
年輕時(shí)的證件照和本人識(shí)別匹配、戴眼鏡和未戴眼鏡、側(cè)臉和正臉、表情、背景干擾、整容后、雙胞胎及長(zhǎng)相類(lèi)似等。
3、建議:
可基于三維人像分析避免認(rèn)證時(shí)的假冒,動(dòng)作分析等。(曠視的難以區(qū)分蠟像、海報(bào)和真人)
4)人臉屬性(性別、年齡、種族、表情、飾品、胡須、面部動(dòng)作狀態(tài)
(1)人臉表情識(shí)別(Face expression recognition 簡(jiǎn)稱(chēng)FER)
1、普遍認(rèn)為人類(lèi)主要有六種基本情感:
憤怒(anger)、高興(happiness)、悲傷(sadness)、驚訝(surprise)、厭惡(disgust)、恐懼(fear)。而大多數(shù)表情識(shí)別是基于這六種情感及其拓展情緒實(shí)現(xiàn)的
2、主要困難點(diǎn)是:
a)表情的精細(xì)化程度劃分:每種情緒最微弱的表現(xiàn)是否需要被分類(lèi)。分類(lèi)的界限需要產(chǎn)品給出評(píng)估規(guī)則。
b)表情類(lèi)別的多樣化:是否還需要補(bǔ)充其他類(lèi)別的情緒,六種情緒在一些場(chǎng)景下遠(yuǎn)不能變現(xiàn)人類(lèi)的真實(shí) 情緒。因此除了基本表情識(shí)別外,還有精細(xì)表情識(shí)別、混合表情識(shí)別、非基本表情識(shí)別等細(xì)致領(lǐng)域的研究。
c)缺少魯棒性
(2)人臉性別識(shí)別
性別分類(lèi)是一個(gè)典型的二類(lèi)問(wèn)題,人臉性別分類(lèi)問(wèn)題需要解決的兩個(gè)關(guān)鍵問(wèn)題是人臉特征提取和分類(lèi)器的選擇。人臉性別識(shí)別其實(shí)僅能識(shí)別到人臉外貌更偏向于女性還是男性,很難對(duì)女生男相、男生女相進(jìn)行正確判斷。
(3)人臉年齡識(shí)別
1、難點(diǎn):
單人的不同年齡段識(shí)別和多人的不同年齡段識(shí)別,人臉年齡識(shí)別常和人臉識(shí)別進(jìn)行組合識(shí)別,能更正確的判斷在一定年限內(nèi)“是否是一個(gè)人”的問(wèn)題;除了以上內(nèi)容,還有是否戴眼鏡、頭發(fā)長(zhǎng)度、膚色等。
2、建議:
識(shí)別年齡無(wú)變化的人臉用分類(lèi)即可,而對(duì)年齡變化的人臉識(shí)別方法是通過(guò)年齡模擬,將測(cè)試圖像和查詢庫(kù)中的圖像變換到某一共同的年年齡,從而去除年齡不同的影響,使識(shí)別在年齡相同的人臉圖像進(jìn)行。
(4)人臉屬性的應(yīng)用:
根據(jù)物理屬性(性別、年齡、種族、眼鏡顏值等)可用于廣告定向投放、個(gè)性化智能推薦、顧客分析、婚戀交友等;化學(xué)屬性(面部動(dòng)作、情緒等)可用于即時(shí)視頻社交、圖片合成、圖片美化等。
(5)識(shí)別建議:人臉屬性分析時(shí),可利用K-近鄰算法匹配云端庫(kù)里的類(lèi)似照片后再對(duì)相似屬性進(jìn)行分析。
5)人臉聚類(lèi)
(1)應(yīng)用:個(gè)性化相冊(cè)管理、照片分享社交、婚戀交友相似臉型匹配推薦興趣社交等。
(2)難點(diǎn):角度、光線、發(fā)型、相似臉型等干擾分類(lèi)。
(3)建議:可基于一張正臉照片,將其他照片進(jìn)行依次比對(duì)分析后再分類(lèi)等(智能相冊(cè)、婚戀社交)。
6)真人檢測(cè)
(1)應(yīng)用:銀行開(kāi)戶驗(yàn)證、車(chē)站、機(jī)場(chǎng)、公司打卡等。
(2)難點(diǎn):2D和3D的識(shí)別檢測(cè)、真人與蠟像、硅膠假冒人臉識(shí)別、照片和真人識(shí)別檢測(cè)驗(yàn)證等。
(3)建議:可基于三維人像分析避免認(rèn)證時(shí)的假冒等,動(dòng)態(tài)識(shí)別驗(yàn)證以區(qū)分假象(曠視的難以區(qū)分蠟像、海報(bào)和真人)。
7)人像美顏/美妝
(1)應(yīng)用:興趣社交、婚戀交友、圖像合成、個(gè)性化用品推薦和廣告投放等。
(2)難點(diǎn):美顏與一般濾鏡效果的區(qū)別、美顏后的自然效果等。
(3)建議:基于數(shù)據(jù)集的算法更新迭代。
8)人體關(guān)鍵點(diǎn)(CPM、DeeperCut)
(1)應(yīng)用:關(guān)鍵動(dòng)作抓拍、人體姿態(tài)估計(jì)、舞蹈難度評(píng)定。
(2)難點(diǎn):多目標(biāo)關(guān)鍵點(diǎn)定位、關(guān)鍵點(diǎn)遮擋、光線強(qiáng)弱等。
(3)建議:關(guān)鍵點(diǎn)遮擋(分塊處理、三維構(gòu)建找尋關(guān)鍵點(diǎn))
3、FR的商業(yè)化
1)從時(shí)間上看商業(yè)化的不同階段
2)從業(yè)務(wù)場(chǎng)景上看
(1)場(chǎng)景關(guān)鍵點(diǎn)
1、盤(pán)子夠大,支撐公司發(fā)展
2、數(shù)據(jù)回流,為公司所用
3、高頻使用,需求占比高
4、可在行業(yè)中復(fù)制
3)垂直行業(yè)人臉解決方案(地產(chǎn)行業(yè)為例)
(1)地產(chǎn)行業(yè)分布
1、商業(yè)地產(chǎn):辦公樓宇+園區(qū)廠區(qū)+商業(yè)零售+酒店
2、住宅地產(chǎn):生活小區(qū)+公寓
(2)地產(chǎn)行業(yè)的市場(chǎng)規(guī)模
(3)演變方向及客戶痛點(diǎn)
1、視頻監(jiān)控:
傳統(tǒng)視頻監(jiān)控廠家正在進(jìn)行智能化轉(zhuǎn)型,從原先的“監(jiān)控”視頻,到現(xiàn)在的“讀懂”視頻當(dāng)中的人、 車(chē)、物、事;
2、門(mén)禁控制:
傳統(tǒng)門(mén)禁控制領(lǐng)域價(jià)值鏈低,所有廠家正在尋求新的方式來(lái)轉(zhuǎn)型,絕大部分都在生物識(shí)別方式上進(jìn)行 摸索;
人臉識(shí)別面板機(jī)、閘機(jī)及其它通行道閘雨后春筍般出現(xiàn);
3、樓宇對(duì)講:
普通樓宇對(duì)講功能已無(wú)法滿足使用要求,結(jié)合人臉識(shí)別功能的門(mén)禁系統(tǒng)需求越來(lái)越多;
4、防盜告警:
通過(guò)智能化手段,達(dá)到降本增效目的,已成為防盜告警、巡更檢查等功能的重點(diǎn)迭代方向;
5、可視化系統(tǒng):
降低非專(zhuān)業(yè)人士的使用難度,使得多方數(shù)據(jù)為“我”所用,為多種決策提供依據(jù);
信息孤島問(wèn)題亟待解決,萬(wàn)物互聯(lián)已是所有廠家達(dá)成的共識(shí)。
6、信息孤島問(wèn)題(痛點(diǎn)):
(1) 智能化系統(tǒng)種類(lèi)繁多,系統(tǒng)之間無(wú)法實(shí)現(xiàn)無(wú)縫連接,綜合管理難度大,效率低;
(2) 智能化子系統(tǒng)數(shù)據(jù)采集離散,標(biāo)準(zhǔn)不一,數(shù)據(jù)價(jià)值大打折扣,無(wú)法為管理提供決策依據(jù)和幫助;
(3) 各子系統(tǒng)依靠人工管理,人員配備要求高、勞動(dòng)強(qiáng)度大,人工成本居高不??;
(4) 絕大多數(shù)B端客戶不懂具體業(yè)務(wù)或細(xì)節(jié),需要具象化、可視化系統(tǒng)呈現(xiàn)。
(4)建設(shè)步驟及架構(gòu)
1、步驟:
第一步:人員通信管理
基于人員通行管理的平臺(tái)系統(tǒng)(功能性產(chǎn)品+后臺(tái)系統(tǒng)管理)
員工、VIP、訪客、陌生人、黑名單等人員權(quán)限管理;
第二步:傳感網(wǎng)絡(luò)融合
CCTV、車(chē)輛等;
基于“人員”、“車(chē)”、“監(jiān)控”的三位一體智慧建筑場(chǎng)景應(yīng)用;
其他子系統(tǒng)模塊鏈接,形成整體傳感網(wǎng)絡(luò),智能物聯(lián);
第三步:商業(yè)地產(chǎn)+新零售
人員、車(chē)輛、CCTV三功能在工作+消費(fèi)場(chǎng)景融合;
構(gòu)建以人為核心的商業(yè)綜合體運(yùn)營(yíng)方案
2、整體IoT架構(gòu)
(5)影響因素與優(yōu)化方案
1、決定監(jiān)控系統(tǒng)性能的幾個(gè)主要因素:
1)模板庫(kù)的人數(shù):不宜大,包含關(guān)鍵人物即可;
2)經(jīng)過(guò)攝像頭的人數(shù):同時(shí)出現(xiàn)在攝像頭的人數(shù)決定了單位時(shí)間里的比對(duì)次數(shù);
3)報(bào)警反饋時(shí)間:實(shí)時(shí)性越強(qiáng),對(duì)系統(tǒng)性能要求越高;
4)攝像頭采集幀數(shù):幀數(shù)越高,人員經(jīng)過(guò)攝像頭前采集的次數(shù)越多,比對(duì)的次數(shù)也越多。
2、實(shí)戰(zhàn)中的優(yōu)化方案:
1)使用更先進(jìn)的高清攝像頭(3-5百萬(wàn));
2)室內(nèi)均勻光線,或室外白天,無(wú)側(cè)光和折射光;
3)人群面向同樣的方向,朝向相機(jī)的方向運(yùn)動(dòng);
4)恰當(dāng)?shù)谋O(jiān)控點(diǎn),如走廊、巷子或安檢門(mén)/閘機(jī)口等(不要一群人同時(shí)出現(xiàn));
5)相機(jī)與人臉的角度小于20度。
4)頂尖公司的應(yīng)用舉例
(1)Google:2011年07月 谷歌收購(gòu)人臉識(shí)別軟件公司PittPatt
(2)Facebook:2012年6月 Facebook收購(gòu)以色列臉部識(shí)別公司Face.com
(3) 微軟:2012年6月 微軟亞洲研究院發(fā)布人臉檢測(cè)算法,面部識(shí)別系統(tǒng)
(4)網(wǎng)易:2012年5月,網(wǎng)易人臉識(shí)別系統(tǒng)全國(guó)公測(cè),用于郵箱登陸
(5)百度:2012年12月 百度推出人臉識(shí)別,基于圖像的全網(wǎng)人臉?biāo)阉?/p>
(6)阿里:2015年11月,在推出支付寶刷臉認(rèn)證付款
(7)騰訊:2012年下半年,成立優(yōu)圖項(xiàng)目組
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28673瀏覽量
208595 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4781瀏覽量
101215 -
人臉識(shí)別
+關(guān)注
關(guān)注
76文章
4021瀏覽量
82364
原文標(biāo)題:人臉識(shí)別長(zhǎng)篇研究 | (一)發(fā)展與市場(chǎng)(二)技術(shù)與流程(三)行業(yè)應(yīng)用
文章出處:【微信號(hào):lccrunfly,微信公眾號(hào):Python機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論