深度學(xué)習(xí)在很多學(xué)術(shù)領(lǐng)域,比非深度學(xué)習(xí)算法往往有20-30%成績(jī)的提高。很多大公司也逐漸開(kāi)始出手投資這種算法,并成立自己的深度學(xué)習(xí)團(tuán)隊(duì),其中投入最大的就是谷歌,2008年6月披露了谷歌腦項(xiàng)目。2014年1月谷歌收購(gòu)DeepMind,然后2016年3月其開(kāi)發(fā)的Alphago算法在圍棋挑戰(zhàn)賽中,戰(zhàn)勝了韓國(guó)九段棋手李世石,證明深度學(xué)習(xí)設(shè)計(jì)出的算法可以戰(zhàn)勝這個(gè)世界上最強(qiáng)的選手。
在硬件方面,Nvidia最開(kāi)始做顯示芯片,但從2006及2007年開(kāi)始主推用GPU芯片進(jìn)行通用計(jì)算,它特別適合深度學(xué)習(xí)中大量簡(jiǎn)單重復(fù)的計(jì)算量。目前很多人選擇Nvidia的CUDA工具包進(jìn)行深度學(xué)習(xí)軟件的開(kāi)發(fā)。
微軟從2012年開(kāi)始,利用深度學(xué)習(xí)進(jìn)行機(jī)器翻譯和中文語(yǔ)音合成工作,其人工智能小娜背后就是一套自然語(yǔ)言處理和語(yǔ)音識(shí)別的數(shù)據(jù)算法。
百度在2013年宣布成立百度研究院,其中最重要的就是百度深度學(xué)習(xí)研究所,當(dāng)時(shí)招募了著名科學(xué)家余凱博士。不過(guò)后來(lái)余凱離開(kāi)百度,創(chuàng)立了另一家從事深度學(xué)習(xí)算法開(kāi)發(fā)的公司地平線(xiàn)。
Facebook和Twitter也都各自進(jìn)行了深度學(xué)習(xí)研究,其中前者攜手紐約大學(xué)教授Yann Lecun,建立了自己的深度學(xué)習(xí)算法實(shí)驗(yàn)室;2015年10月,F(xiàn)acebook宣布開(kāi)源其深度學(xué)習(xí)算法框架,即Torch框架。Twitter在2014年7月收購(gòu)了Madbits,為用戶(hù)提供高精度的圖像檢索服務(wù)。
前深度學(xué)習(xí)時(shí)代:計(jì)算機(jī)視覺(jué)
互聯(lián)網(wǎng)巨頭看重深度學(xué)習(xí)當(dāng)然不是為了學(xué)術(shù),主要是它能帶來(lái)巨大的市場(chǎng)。那為什么在深度學(xué)習(xí)出來(lái)之前,傳統(tǒng)算法為什么沒(méi)有達(dá)到深度學(xué)習(xí)的精度?
在深度學(xué)習(xí)算法出來(lái)之前,對(duì)于視覺(jué)算法來(lái)說(shuō),大致可以分為以下5個(gè)步驟:特征感知,圖像預(yù)處理,特征提取,特征篩選,推理預(yù)測(cè)與識(shí)別。早期的機(jī)器學(xué)習(xí)中,占優(yōu)勢(shì)的統(tǒng)計(jì)機(jī)器學(xué)習(xí)群體中,對(duì)特征是不大關(guān)心的。
我認(rèn)為,計(jì)算機(jī)視覺(jué)可以說(shuō)是機(jī)器學(xué)習(xí)在視覺(jué)領(lǐng)域的應(yīng)用,所以計(jì)算機(jī)視覺(jué)在采用這些機(jī)器學(xué)習(xí)方法的時(shí)候,不得不自己設(shè)計(jì)前面4個(gè)部分。
但對(duì)任何人來(lái)說(shuō)這都是一個(gè)比較難的任務(wù)。傳統(tǒng)的計(jì)算機(jī)識(shí)別方法把特征提取和分類(lèi)器設(shè)計(jì)分開(kāi)來(lái)做,然后在應(yīng)用時(shí)再合在一起,比如如果輸入是一個(gè)摩托車(chē)圖像的話(huà),首先要有一個(gè)特征表達(dá)或者特征提取的過(guò)程,然后把表達(dá)出來(lái)的特征放到學(xué)習(xí)算法中進(jìn)行分類(lèi)的學(xué)習(xí)。
過(guò)去20年中出現(xiàn)了不少優(yōu)秀的特征算子,比如最著名的SIFT算子,即所謂的對(duì)尺度旋轉(zhuǎn)保持不變的算子。它被廣泛地應(yīng)用在圖像比對(duì),特別是所謂的structure from motion這些應(yīng)用中,有一些成功的應(yīng)用例子。另一個(gè)是HoG算子,它可以提取物體,比較魯棒的物體邊緣,在物體檢測(cè)中扮演著重要的角色。
這些算子還包括Textons,Spin image,RIFT和GLOH,都是在深度學(xué)習(xí)誕生之前或者深度學(xué)習(xí)真正的流行起來(lái)之前,占領(lǐng)視覺(jué)算法的主流。
幾個(gè)(半)成功例子
這些特征和一些特定的分類(lèi)器組合取得了一些成功或半成功的例子,基本達(dá)到了商業(yè)化的要求但還沒(méi)有完全商業(yè)化。
一是八九十年代的指紋識(shí)別算法,它已經(jīng)非常成熟,一般是在指紋的圖案上面去尋找一些關(guān)鍵點(diǎn),尋找具有特殊幾何特征的點(diǎn),然后把兩個(gè)指紋的關(guān)鍵點(diǎn)進(jìn)行比對(duì),判斷是否匹配。
然后是2001年基于Haar的人臉檢測(cè)算法,在當(dāng)時(shí)的硬件條件下已經(jīng)能夠達(dá)到實(shí)時(shí)人臉檢測(cè),我們現(xiàn)在所有手機(jī)相機(jī)里的人臉檢測(cè),都是基于它或者它的變種。
第三個(gè)是基于HoG特征的物體檢測(cè),它和所對(duì)應(yīng)的SVM分類(lèi)器組合起來(lái)的就是著名的DPM算法。DPM算法在物體檢測(cè)上超過(guò)了所有的算法,取得了比較不錯(cuò)的成績(jī)。
但這種成功例子太少了,因?yàn)槭止ぴO(shè)計(jì)特征需要大量的經(jīng)驗(yàn),需要你對(duì)這個(gè)領(lǐng)域和數(shù)據(jù)特別了解,然后設(shè)計(jì)出來(lái)特征還需要大量的調(diào)試工作。說(shuō)白了就是需要一點(diǎn)運(yùn)氣。
另一個(gè)難點(diǎn)在于,你不只需要手工設(shè)計(jì)特征,還要在此基礎(chǔ)上有一個(gè)比較合適的分類(lèi)器算法。同時(shí)設(shè)計(jì)特征然后選擇一個(gè)分類(lèi)器,這兩者合并達(dá)到最優(yōu)的效果,幾乎是不可能完成的任務(wù)。
仿生學(xué)角度看深度學(xué)習(xí)
如果不手動(dòng)設(shè)計(jì)特征,不挑選分類(lèi)器,有沒(méi)有別的方案呢?能不能同時(shí)學(xué)習(xí)特征和分類(lèi)器?即輸入某一個(gè)模型的時(shí)候,輸入只是圖片,輸出就是它自己的標(biāo)簽。比如輸入一個(gè)明星的頭像,出來(lái)的標(biāo)簽就是一個(gè)50維的向量(如果要在50個(gè)人里識(shí)別的話(huà)),其中對(duì)應(yīng)明星的向量是1,其他的位置是0。
這種設(shè)定符合人類(lèi)腦科學(xué)的研究成果。
1981年諾貝爾醫(yī)學(xué)生理學(xué)獎(jiǎng)?lì)C發(fā)給了David Hubel,一位神經(jīng)生物學(xué)家。他的主要研究成果是發(fā)現(xiàn)了視覺(jué)系統(tǒng)信息處理機(jī)制,證明大腦的可視皮層是分級(jí)的。他的貢獻(xiàn)主要有兩個(gè),一是他認(rèn)為人的視覺(jué)功能一個(gè)是抽象,一個(gè)是迭代。抽象就是把非常具體的形象的元素,即原始的光線(xiàn)像素等信息,抽象出來(lái)形成有意義的概念。這些有意義的概念又會(huì)往上迭代,變成更加抽象,人可以感知到的抽象概念。
像素是沒(méi)有抽象意義的,但人腦可以把這些像素連接成邊緣,邊緣相對(duì)像素來(lái)說(shuō)就變成了比較抽象的概念;邊緣進(jìn)而形成球形,球形然后到氣球,又是一個(gè)抽象的過(guò)程,大腦最終就知道看到的是一個(gè)氣球。
模擬人腦識(shí)別人臉,也是抽象迭代的過(guò)程,從最開(kāi)始的像素到第二層的邊緣,再到人臉的部分,然后到整張人臉,是一個(gè)抽象迭代的過(guò)程。
再比如看到圖片中的摩托車(chē),我們可能在腦子里就幾微秒的時(shí)間,但是經(jīng)過(guò)了大量的神經(jīng)元抽象迭代。對(duì)計(jì)算機(jī)來(lái)說(shuō)最開(kāi)始看到的根本也不是摩托車(chē),而是RGB圖像三個(gè)通道上不同的數(shù)字。
所謂的特征或者視覺(jué)特征,就是把這些數(shù)值給綜合起來(lái)用統(tǒng)計(jì)或非統(tǒng)計(jì)的形式,把摩托車(chē)的部件或者整輛摩托車(chē)表現(xiàn)出來(lái)。深度學(xué)習(xí)的流行之前,大部分的設(shè)計(jì)圖像特征就是基于此,即把一個(gè)區(qū)域內(nèi)的像素級(jí)別的信息綜合表現(xiàn)出來(lái),利于后面的分類(lèi)學(xué)習(xí)。
如果要完全模擬人腦,我們也要模擬抽象和遞歸迭代的過(guò)程,把信息從最細(xì)瑣的像素級(jí)別,抽象到“種類(lèi)”的概念,讓人能夠接受。
深度學(xué)習(xí)工業(yè)應(yīng)用:缺陷檢測(cè)
1. 應(yīng)用背景
隨著機(jī)器視覺(jué),工業(yè)自動(dòng)化的快速發(fā)展,工業(yè)4.0的概念已經(jīng)被提上日程。傳統(tǒng)很多需要人工來(lái)手動(dòng)操作的工作,漸漸的被機(jī)器所替代。這當(dāng)然也是人類(lèi)科技進(jìn)步和發(fā)展的必然趨勢(shì),工業(yè)的進(jìn)步到頭來(lái)還是服務(wù)于人類(lèi),給人類(lèi)帶來(lái)高質(zhì)量的生活體驗(yàn),而不是整天做著乏味無(wú)趣的工作。
這里我要討論的話(huà)題是關(guān)于缺陷檢測(cè)機(jī)器自動(dòng)化方面,先說(shuō)下現(xiàn)狀吧,在富士康,伯恩光學(xué),藍(lán)思,信利等國(guó)內(nèi)幾大知名半導(dǎo)體制造廠(chǎng)商的朋友肯定看到過(guò)下面的畫(huà)面。
近幾年隨著智能手機(jī),平板,各種觸摸設(shè)備的火速發(fā)展,促進(jìn)了玻璃半導(dǎo)體行業(yè)的巨大需求。不乏看看周邊的朋友,平均每個(gè)人都至少有2部移動(dòng)設(shè)備吧,一部手機(jī),一部平板。但是使用者有沒(méi)有思考過(guò)這些電子產(chǎn)品的構(gòu)成。我們就拿屏幕和內(nèi)部芯片來(lái)舉個(gè)例子。
每一臺(tái)智能觸摸設(shè)備都會(huì)佩戴一塊屏幕,其中就有蓋板玻璃。蓋板玻璃在安裝在觸摸設(shè)備之前,在車(chē)間中經(jīng)過(guò)了好幾道檢測(cè)工序, 其中很關(guān)鍵的一道工序就需要無(wú)數(shù)QC質(zhì)檢的火眼金睛幫我們剔除掉有缺陷的玻璃, 最終來(lái)到我們用戶(hù)手中的玻璃是沒(méi)有缺陷,或者說(shuō)基本沒(méi)有缺陷的。當(dāng)我們看到車(chē)間的情景,是否想用如今的高科技來(lái)解救一下他們繁瑣無(wú)趣的工作。
2. 傳統(tǒng)視覺(jué)檢測(cè)
在機(jī)器學(xué)習(xí),深度學(xué)習(xí)還沒(méi)有發(fā)展的這么火熱之前, 國(guó)外幾款做的幾款非常好的視覺(jué)軟件業(yè)內(nèi)人士應(yīng)該都很清楚。比如:NIVISION,Halcon, Visionpro, Cognix, MIL等等都是業(yè)內(nèi)用的比較多,而且比較成功的視覺(jué)軟件。其中很多模塊都有定位,測(cè)量,檢測(cè)等功能。
但是這些傳統(tǒng)的方法來(lái)做缺陷檢測(cè)大多都是靠人來(lái)特征工程,從形狀,顏色, 長(zhǎng)度,寬度,長(zhǎng)寬比來(lái)確定被檢測(cè)的目標(biāo)是否符合標(biāo)準(zhǔn),最終定義出一系列的規(guī)則來(lái)進(jìn)行缺陷檢測(cè)。這樣的方法當(dāng)然在一些簡(jiǎn)單的case中已經(jīng)應(yīng)用的很好, 唯一的缺點(diǎn)是隨著被檢測(cè)物體的變動(dòng),所有的規(guī)則和算法都要重新設(shè)計(jì)和開(kāi)發(fā),即使是同樣的產(chǎn)品,不同批次的變化都會(huì)造成不能重用的現(xiàn)實(shí)。
總結(jié):傳統(tǒng)機(jī)器視覺(jué)算法通常處理容易提取,容易量化的特征:顏色、面積、圓度、角度、長(zhǎng)度等。
3. 深度學(xué)習(xí)檢測(cè)
隨著機(jī)器學(xué)習(xí), 深度學(xué)習(xí)的發(fā)展,很多人眼很難去直接量化的特征, 深度學(xué)習(xí)可以搞定, 這就是深度學(xué)習(xí)帶給我們的優(yōu)點(diǎn)和前所未有的吸引力。很多特征我們通過(guò)傳統(tǒng)算法無(wú)法量化,或者說(shuō)很難去做到的, 深度學(xué)習(xí)可以搞定。特別是在圖像分類(lèi), 目標(biāo)檢測(cè)這些問(wèn)題上取得了顯著的提升。下圖是近幾年來(lái)深度學(xué)習(xí)在圖像分類(lèi)問(wèn)題上取得的成績(jī)。
下圖是近幾年來(lái)深度學(xué)習(xí)算法在目標(biāo)檢測(cè)問(wèn)題上的發(fā)展。
之所以提出上面的算法, 是因?yàn)檫@些算法給其他領(lǐng)域提供了很多參考和借鑒意義。比如本文討論的缺陷檢測(cè), 上面的很多網(wǎng)絡(luò)的特點(diǎn),以及方法都給了我們很多的啟發(fā),我們?cè)谠O(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu)的時(shí)候,配合自己在產(chǎn)線(xiàn)部署的硬件性能,設(shè)計(jì)適合項(xiàng)目的網(wǎng)絡(luò)結(jié)構(gòu)。
當(dāng)然,深度學(xué)習(xí)的方法用來(lái)檢測(cè),也有自己的很多缺點(diǎn)。例如:數(shù)據(jù)量要求大,工業(yè)數(shù)據(jù)收集成本高。但是隨著數(shù)據(jù)增強(qiáng)技術(shù),無(wú)監(jiān)督學(xué)習(xí)的不斷進(jìn)步,在某些應(yīng)用場(chǎng)景上,這些缺點(diǎn)漸漸被隱藏了。例如學(xué)術(shù)界正在研究的,自動(dòng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì),自動(dòng)數(shù)據(jù)標(biāo)注等等。所以作者認(rèn)為隨著技術(shù)的發(fā)展,這個(gè)領(lǐng)域?qū)?huì)得到很大的提升,人工檢測(cè)終將會(huì)被機(jī)器檢測(cè)替代。然后你看到的無(wú)人工廠(chǎng)更加會(huì)無(wú)人化。
深度學(xué)習(xí)在缺陷檢測(cè)中的意義
隨著自動(dòng)化技術(shù)的快速發(fā)展,在工業(yè)生產(chǎn)中很多需要人工操作的環(huán)節(jié)逐漸轉(zhuǎn)由機(jī)器完成,工業(yè)生產(chǎn)自動(dòng)化也將越來(lái)越多的工人們從枯燥乏味的工作中解放出來(lái),讓他們?nèi)グl(fā)揮更大的價(jià)值。
產(chǎn)品表面缺陷檢測(cè)是工業(yè)生產(chǎn)中的重要環(huán)節(jié),是產(chǎn)品質(zhì)量把控的關(guān)鍵步驟,借助缺陷檢測(cè)技術(shù)可以有效的提高生產(chǎn)質(zhì)量和效率。但是由于設(shè)備及工藝等因素的影響,產(chǎn)品表面的缺陷類(lèi)型往往五花八門(mén),比如織物生產(chǎn)中方出現(xiàn)的污點(diǎn)、破損,金屬產(chǎn)品上的劃痕、裂紋、凹凸不平等各種不同類(lèi)型的缺陷,如下圖所示:
單張圖片中的缺陷多樣且不同缺陷表現(xiàn)形式的也不相同,給缺陷的自動(dòng)化檢測(cè)帶來(lái)了困難。
下面,我們?cè)僦v一下傳統(tǒng)算法。
傳統(tǒng)的表面缺陷檢測(cè)算法結(jié)構(gòu)通過(guò)圖像預(yù)處理得到便于檢測(cè)的圖像,隨后借助統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法來(lái)提取圖像特征,進(jìn)而實(shí)現(xiàn)缺陷檢測(cè)的目標(biāo)。
圖像預(yù)處理通常包括直方圖均衡化、濾波去噪、灰度二值化、再次濾波幾部分,以得到前后景分離的簡(jiǎn)單化圖像信息;隨后利用數(shù)學(xué)形態(tài)學(xué)、傅里葉變換、Gabor 變換等算法以及機(jī)器學(xué)習(xí)模型完成缺陷的標(biāo)記與檢測(cè)。
上述傳統(tǒng)算法在某些特定的應(yīng)用中已經(jīng)取得了較好的效果,但仍然存在許多不足。例如:圖像預(yù)處理步驟繁多且具有強(qiáng)烈的針對(duì)性,魯棒性差;多種算法計(jì)算量驚人且無(wú)法精確的檢測(cè)缺陷的大小和形狀。而深度學(xué)習(xí)可以直接通過(guò)學(xué)習(xí)數(shù)據(jù)更新參數(shù),避免了人工設(shè)計(jì)復(fù)雜的算法流程,并且有著極高的魯棒性和精度。
基于深度學(xué)習(xí)檢測(cè)的案例及實(shí)現(xiàn)
目前,基于深度學(xué)習(xí)的缺陷檢測(cè)已經(jīng)應(yīng)用于金屬固件、布匹絲織物、建筑裂紋、鋼筋裂紋等多個(gè)領(lǐng)域,并取得了不錯(cuò)的成果。下面將結(jié)合具體案例介紹其實(shí)現(xiàn)方法。
1. 裂紋缺陷檢測(cè)
建筑材料(如磁瓦等)的外觀(guān)變化(如裂紋或腐蝕等)與其建筑結(jié)構(gòu)的安全性密不可分,而依靠檢察員視覺(jué)檢查的效果局限性大,相比之下,基于計(jì)算機(jī)視覺(jué)的結(jié)構(gòu)損傷檢測(cè)更為可靠便捷。
Fast RCNN的作用為對(duì)圖像中的缺陷位置進(jìn)行定位和分類(lèi),其結(jié)構(gòu)流程如上圖所示。
從輸入圖像中提取特征圖并獲得感興趣區(qū)域(ROI);在ROI池中,預(yù)先計(jì)算的興趣區(qū)域覆蓋在特征圖上,提取固定大小的特征向量;將所得向量輸入全連接層,計(jì)算邊界框的位置并對(duì)框內(nèi)對(duì)象進(jìn)行分類(lèi)。
2. 破損缺陷檢測(cè)
在電氣化鐵路等工業(yè)中,有許多關(guān)系著安全的重要固件,這些固件的缺陷檢測(cè)十分重要。
利用深度卷積神經(jīng)網(wǎng)絡(luò)SSD等網(wǎng)絡(luò)方法構(gòu)建了一個(gè)從粗到細(xì)的級(jí)聯(lián)檢測(cè)網(wǎng)絡(luò),包括固件的定位、缺陷檢測(cè)與分類(lèi),其實(shí)現(xiàn)流程如下圖所示:
(1)緊固件提取
借助在速度和精度方面都表現(xiàn)良好的SSD框架,對(duì)圖像中的懸臂節(jié)點(diǎn)進(jìn)行定位;
(2)固件缺陷檢測(cè)與分類(lèi)
根據(jù)第二階段對(duì)緊固件的檢測(cè)來(lái)判斷缺陷;具有良好的魯棒性和自適應(yīng)性,有利于檢測(cè)的快速進(jìn)行,因此本方法在緊固件的缺陷檢測(cè)和分類(lèi)中具有良好的應(yīng)用前景。
3. 斑點(diǎn)缺陷檢測(cè)
斑點(diǎn)缺陷檢測(cè)在紡織、木材、瓷磚等許多行業(yè)中都很常見(jiàn),通常利用其紋理的一致性實(shí)現(xiàn)檢測(cè)的目的。近年來(lái),利用深度學(xué)習(xí)視覺(jué)檢測(cè)技術(shù)對(duì)相關(guān)產(chǎn)業(yè)的表面缺陷檢測(cè)引起了廣泛關(guān)注。
4. 劃痕缺陷檢測(cè)
劃痕缺陷檢測(cè)通常用于金屬類(lèi)產(chǎn)品的表面缺陷檢測(cè)中,隨著生活質(zhì)量的提高,人們對(duì)產(chǎn)品的外觀(guān)完整性與美觀(guān)程度的要求也越來(lái)越高,因此精準(zhǔn)地檢測(cè)到產(chǎn)品外觀(guān)的劃痕等缺陷在生產(chǎn)環(huán)節(jié)十分重要。
總的來(lái)說(shuō),使用基于深度學(xué)習(xí)的算法可快速準(zhǔn)確地實(shí)現(xiàn)的缺陷檢測(cè),且適用范圍廣能夠靈活地應(yīng)用于建筑、金屬固件以及布匹絲織物等眾多行業(yè)的生產(chǎn)過(guò)程中。
機(jī)器視覺(jué)的行業(yè)發(fā)展現(xiàn)狀
(1)就業(yè)人員及人才市場(chǎng)現(xiàn)狀
目前,深度學(xué)習(xí)從業(yè)人員薪資處于高位,且屬于人才緊缺的行業(yè),就業(yè)前景廣闊?;旧险莆丈疃葘W(xué)習(xí)的視覺(jué)工程師,月起薪至少3W元起,縱觀(guān)近幾年,還有逐步上升的趨勢(shì)。
(2)國(guó)家政策扶持,刺激AI行業(yè)經(jīng)濟(jì)
2017兩會(huì)“人工智能”首次被列入政府工作報(bào)告,隨之而來(lái)的是人工智能板塊領(lǐng)跑大盤(pán)漲勢(shì),無(wú)疑這一切將刺激人工智能在多個(gè)領(lǐng)域的全面發(fā)展。
2016年,國(guó)內(nèi)人工智能企業(yè)約284家獲投,獲投企業(yè)中,A輪(Pre-A、A、A+)企業(yè)占比最高,111家企業(yè)獲得融資,匯頂科技完成IPO上市,募資8.74億人民幣。
(3)技術(shù)及企業(yè)應(yīng)用爆發(fā),獲得快速發(fā)展
目前,我國(guó)人工智能企業(yè)在圖像和語(yǔ)音識(shí)別兩個(gè)類(lèi)別企業(yè)占比相對(duì)較高,人臉識(shí)別技術(shù)水平處于領(lǐng)先地位,各創(chuàng)業(yè)公司也從一開(kāi)始專(zhuān)注研究逐步發(fā)展至探索合適的商業(yè)模式,從“互聯(lián)網(wǎng)+”向“人工智能+”過(guò)渡。
人工智能爆發(fā)的兩個(gè)重要時(shí)間節(jié)點(diǎn):
2011年基于深度學(xué)習(xí)的人工智能技術(shù)陸續(xù)在微軟、Facebook、百度等頂尖互聯(lián)網(wǎng)公司獲得廣泛應(yīng)用,微軟和百度使用的FPGA,基于海量數(shù)據(jù)訓(xùn)練出的深度學(xué)習(xí)系統(tǒng)能夠完成更快、更精準(zhǔn)的判斷,同年蘋(píng)果公司發(fā)布語(yǔ)音助手Siri 。
2016年4月,谷歌(Google)首席執(zhí)行官桑德?tīng)枴てげ?Sundar Pichai)在一封致股東信中,把機(jī)器學(xué)習(xí)譽(yù)為人工智能和計(jì)算的真正未來(lái)。
這一切,似乎印證了2011年和2016年AI崛起和爆發(fā)式增長(zhǎng)的原因所在,行業(yè)巨頭的全面布局同時(shí)也帶動(dòng)了國(guó)內(nèi)AI創(chuàng)業(yè)型公司的快速發(fā)展。
傳統(tǒng)視覺(jué)及深度學(xué)習(xí)檢測(cè),存在哪些問(wèn)題?
編者大概匯總了一下,現(xiàn)階段的機(jī)器視覺(jué)缺陷檢測(cè),仍然存在以下幾大行業(yè)發(fā)展問(wèn)題,具體如下:
(1)受環(huán)境、光照、生產(chǎn)工藝和噪聲等多重因素影響,檢測(cè)系統(tǒng)的信噪比一般較低,微弱信號(hào)難以檢出或不能與噪聲有效區(qū)分。如何構(gòu)建穩(wěn)定、可靠、魯棒的檢測(cè)系統(tǒng),以適應(yīng)光照變化、噪聲以及其他外界不良環(huán)境的干擾,是要解決的問(wèn)題之一。
(2)由于檢測(cè)對(duì)象多樣、表面缺陷種類(lèi)繁多、形態(tài)多樣、復(fù)雜背景,對(duì)于眾多缺陷類(lèi)型產(chǎn)生的機(jī)理以及其外在表現(xiàn)形式之間的關(guān)系尚不明確,致使對(duì)缺陷的描述不充分,缺陷的特征提取有效性不高,缺陷目標(biāo)分割困難;同時(shí),很難找到“標(biāo)準(zhǔn)”圖像作為參照,這給缺陷的檢測(cè)和分類(lèi)帶來(lái)困難,造成識(shí)別率尚有待提高。
(3)機(jī)器視覺(jué)表面缺陷檢測(cè),特別是在線(xiàn)檢測(cè),其特點(diǎn)是數(shù)據(jù)量龐大、冗余信息多、特征空間維度高,同時(shí)考慮到真正的機(jī)器視覺(jué)面對(duì)的對(duì)象和問(wèn)題的多樣性,從海量數(shù)據(jù)中提取有限缺陷信息的算法能力不足,實(shí)時(shí)性不高。
(4)與機(jī)器視覺(jué)表面檢測(cè)密切相關(guān)的人工智能理論雖然得到了很大的發(fā)展,但如何模擬人類(lèi)大腦的信息處理功能去構(gòu)建智能機(jī)器視覺(jué)系統(tǒng)還需要理論上的進(jìn)一步研究,如何更好的基于生物視覺(jué)認(rèn)識(shí)、指導(dǎo)機(jī)器視覺(jué)得檢測(cè)也是研究人員的難點(diǎn)之一。
(5)從機(jī)器視覺(jué)表面檢測(cè)的準(zhǔn)確性方面來(lái)看,盡管一系列優(yōu)秀的算法不斷出現(xiàn),但在實(shí)際應(yīng)用中準(zhǔn)確率仍然與滿(mǎn)足實(shí)際應(yīng)用的需求尚有一定差距,如何解決準(zhǔn)確識(shí)別與模糊特征之間、實(shí)時(shí)性與準(zhǔn)確性之間的矛盾仍然是目前的難點(diǎn)。
傳統(tǒng)算法在某些特定的應(yīng)用中已經(jīng)取得了較好的效果,但仍然存在許多不足。例如:圖像預(yù)處理步驟繁多且具有強(qiáng)烈的針對(duì)性,魯棒性差;多種算法計(jì)算量驚人且無(wú)法精確的檢測(cè)缺陷的大小和形狀。而深度學(xué)習(xí)可以直接通過(guò)學(xué)習(xí)數(shù)據(jù)更新參數(shù),避免了人工設(shè)計(jì)復(fù)雜的算法流程,并且有著極高的魯棒性和精度。
國(guó)內(nèi)知名企業(yè)是如何解決的?
康耐視:一家大型視覺(jué)系統(tǒng)供應(yīng)商,2017年收購(gòu)了ViDi系統(tǒng)公司,該公司是一家瑞士制造深度學(xué)習(xí)機(jī)器視覺(jué)軟件,該軟件市場(chǎng)售價(jià)15萬(wàn)/套。
德國(guó)MVTec公司:Halcon視覺(jué)軟件,自2018年加入了深度學(xué)習(xí)模塊,可以使用CPU進(jìn)行缺陷檢測(cè)。
美國(guó)NI公司:自2018年在視覺(jué)模塊中加入深度學(xué)習(xí)模塊,支持TensorFlow相關(guān)版本的模型調(diào)用。
而由于LabVIEW具備圖形化編程、易學(xué)、易用的特點(diǎn),在自動(dòng)化行業(yè)內(nèi)廣受歡迎,而且其TensorFlow模型推理庫(kù)經(jīng)過(guò)CPU優(yōu)化編譯,能滿(mǎn)足工業(yè)缺陷檢測(cè)實(shí)際需求。
原文標(biāo)題:一文追溯機(jī)器視覺(jué)發(fā)展史,深度學(xué)習(xí)是如何融入產(chǎn)品檢測(cè)的
文章出處:【微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
芯片
+關(guān)注
關(guān)注
456文章
51283瀏覽量
427798 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5518瀏覽量
121608
原文標(biāo)題:一文追溯機(jī)器視覺(jué)發(fā)展史,深度學(xué)習(xí)是如何融入產(chǎn)品檢測(cè)的
文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
NPU在深度學(xué)習(xí)中的應(yīng)用
GPU深度學(xué)習(xí)應(yīng)用案例
AI大模型與深度學(xué)習(xí)的關(guān)系
FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?
深度學(xué)習(xí)中的時(shí)間序列分類(lèi)方法
深度學(xué)習(xí)在工業(yè)機(jī)器視覺(jué)檢測(cè)中的應(yīng)用
基于深度學(xué)習(xí)的無(wú)人機(jī)檢測(cè)與識(shí)別技術(shù)
基于AI深度學(xué)習(xí)的缺陷檢測(cè)系統(tǒng)
深度學(xué)習(xí)在視覺(jué)檢測(cè)中的應(yīng)用
深度學(xué)習(xí)與nlp的區(qū)別在哪
基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)
易華錄產(chǎn)品檢測(cè)中心順利通過(guò)CNAS資質(zhì)監(jiān)督評(píng)審
![易華錄<b class='flag-5'>產(chǎn)品檢測(cè)</b>中心順利通過(guò)CNAS資質(zhì)監(jiān)督評(píng)審](https://file1.elecfans.com/web2/M00/E6/B4/wKgaomZEgBWAa0HHAABqpXlUoHM015.png)
深度解析深度學(xué)習(xí)下的語(yǔ)義SLAM
![<b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>下的語(yǔ)義SLAM](https://file1.elecfans.com/web2/M00/D6/82/wKgZomYnfe-ARm_pAAAcYiwkMFk951.png)
深度學(xué)習(xí)檢測(cè)小目標(biāo)常用方法
![<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>檢測(cè)</b>小目標(biāo)常用方法](https://file1.elecfans.com/web2/M00/C5/9B/wKgaomX3oTGALGvNAAAoApYTBgA580.png)
為什么深度學(xué)習(xí)的效果更好?
![為什么<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的效果更好?](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
評(píng)論