計(jì)算機(jī)視覺研究方向有哪些
1、圖像分類
圖像分類是計(jì)算機(jī)視覺中最基礎(chǔ)的一個(gè)任務(wù),也是幾乎所有的基準(zhǔn)模型進(jìn)行比較的任務(wù),從最開始比較簡單的10分類的灰度圖像手寫數(shù)字識(shí)別mnist,到后來更大一點(diǎn)的10分類的cifar10和100分類的cifar100,到后來的imagenet,圖像分類任務(wù)伴隨著數(shù)據(jù)庫的增長,一步一步提升到了今天的水平。圖像分類,顧名思義,就是一個(gè)模式分類問題,它的目標(biāo)是將不同的圖像,劃分到不同的類別,實(shí)現(xiàn)最小的分類誤差。
2、目標(biāo)檢測
分類任務(wù)給出的是整張圖片的內(nèi)容描述,而目標(biāo)檢測任務(wù)則關(guān)注圖片中特定的目標(biāo)。檢測任務(wù)包含兩個(gè)子任務(wù),其一是這一目標(biāo)的類別信息和概率,它是一個(gè)分類任務(wù)。其二是目標(biāo)的具體位置信息,這是一個(gè)定位任務(wù)。與計(jì)算機(jī)視覺領(lǐng)域里大部分的算法一樣,目標(biāo)檢測也經(jīng)歷了從傳統(tǒng)的人工設(shè)計(jì)特征和淺層分類器的思路(以),到大數(shù)據(jù)時(shí)代使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行特征學(xué)習(xí)的思路。
3、 圖像分割
圖像分割屬于圖像處理領(lǐng)域最高層次的圖像理解范疇。所謂圖像分割就是把圖像分割成具有相似的顏色或紋理特性的若干子區(qū)域,并使它們對(duì)應(yīng)不同的物體或物體的不同部分的技術(shù)。這些子區(qū)域,組成圖像的完備子集,又相互之間不重疊。在圖像處理中,研究者往往只對(duì)圖像中的某些區(qū)域感興趣,在此基礎(chǔ)上才有可能對(duì)目標(biāo)進(jìn)行更深層次的處理與分析,包括對(duì)象的數(shù)學(xué)模型表示、幾何形狀參數(shù)提取、統(tǒng)計(jì)特征提取、目標(biāo)識(shí)別等。
4、目標(biāo)跟蹤
目標(biāo)跟蹤,指的其實(shí)就是視頻中運(yùn)動(dòng)目標(biāo)的跟蹤,跟蹤的結(jié)果通常就是一個(gè)框。目標(biāo)跟蹤是視頻監(jiān)控系統(tǒng)中不可缺少的環(huán)節(jié)。 根據(jù)目標(biāo)跟蹤方法建模方式的不同,可以分為生成式模型方法與判別式模型方法。
生成式模型跟蹤算法以均值漂移目標(biāo)跟蹤方法和粒子濾波目標(biāo)跟蹤方法為代表,判別式模型跟蹤算法以相關(guān)濾波目標(biāo)跟蹤方法和深度學(xué)習(xí)目標(biāo)跟蹤方法為代表。
5、 圖像濾波與降噪
現(xiàn)實(shí)中的數(shù)字圖像在數(shù)字化和傳輸過程中常受到成像設(shè)備與外部環(huán)境噪聲干擾等影響,稱為含噪圖像或噪聲圖像。減少數(shù)字圖像中噪聲的過程稱為圖像降噪,有時(shí)候又稱為圖像去噪。 降噪可以應(yīng)用于圖像增強(qiáng)和美顏等領(lǐng)域。
6、圖像增強(qiáng)
圖像增強(qiáng),即增強(qiáng)圖像中的有用信息,改善圖像的視覺效果。圖像增強(qiáng)實(shí)際上包含了很多的內(nèi)容,上面的降噪也屬于其中,只是因?yàn)榻翟攵嗔嗣李佭@一個(gè)應(yīng)用單獨(dú)拿出來說一下。
7、 風(fēng)格化
圖像風(fēng)格化之所以引起我們的注意,完全是因?yàn)?015年的一個(gè)研究,可以將任意的圖像轉(zhuǎn)換為梵高的畫作風(fēng)格。?也是得益于深度學(xué)習(xí)技術(shù)的發(fā)展,傳統(tǒng)的方法做不到這么好的效果。而隨著美圖秀秀,天天P圖等app層出不窮的濾鏡,風(fēng)格化已經(jīng)成為了單獨(dú)的一個(gè)研究領(lǐng)域。?圖像風(fēng)格化是一個(gè)綜述性的技術(shù)應(yīng)用,為了簡單起見,就理解為藝術(shù)類濾鏡把,它指通過算法,將數(shù)碼相機(jī)拍攝的照片,變成繪畫、素描等藝術(shù)類的非數(shù)碼相機(jī)效果,是后期程度最深的操作,將徹底改變相片的風(fēng)格。
8、 三維重建
三維重建廣義上來說,是建立真實(shí)世界的三維模型。隨著軟硬件的成熟,在電影,游戲,安防,地圖等領(lǐng)域,三維重建技術(shù)的應(yīng)用越來越多。目前獲取三維模型的方法主要包括三種,手工建模,儀器采集與基于圖像的建模。
9、 圖像檢索
圖像檢索的研究從20世紀(jì)70年代就已經(jīng)開始,在早期是基于文本的圖像檢索技術(shù)(簡稱TBIR),利用文本來描述圖像的特征,如繪畫作品的作者、年代、流派、尺寸等。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,90年代開始出現(xiàn)了對(duì)圖像的內(nèi)容語義,如圖像的顏色、紋理、布局等進(jìn)行分析和檢索的圖像檢索技術(shù),也就是基于內(nèi)容的圖像檢索(簡稱CBIR)技術(shù),本小節(jié)的圖像檢索就特指基于內(nèi)容的圖像檢索。
10、 GAN
GAN被譽(yù)為新的深度學(xué)習(xí),涉及的研究非常多,可以單列為一個(gè)方向。GAN的原理很簡單,它包括兩個(gè)網(wǎng)絡(luò),一個(gè)生成網(wǎng)絡(luò),不斷生成數(shù)據(jù)分布。一個(gè)判別網(wǎng)絡(luò),判斷生成的數(shù)據(jù)是否為真實(shí)數(shù)據(jù)。
-
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1701瀏覽量
46159
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)
機(jī)器視覺和計(jì)算機(jī)視覺有什么區(qū)別
計(jì)算機(jī)視覺的五大技術(shù)
計(jì)算機(jī)視覺的工作原理和應(yīng)用
機(jī)器人視覺與計(jì)算機(jī)視覺的區(qū)別與聯(lián)系
計(jì)算機(jī)視覺與人工智能的關(guān)系是什么
計(jì)算機(jī)視覺與智能感知是干嘛的
計(jì)算機(jī)視覺和機(jī)器視覺區(qū)別在哪
計(jì)算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系
計(jì)算機(jī)視覺在人工智能領(lǐng)域有哪些主要應(yīng)用?
計(jì)算機(jī)視覺屬于人工智能嗎
深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用
機(jī)器視覺與計(jì)算機(jī)視覺的區(qū)別
計(jì)算機(jī)視覺的主要研究方向
計(jì)算機(jī)視覺的十大算法
![<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的十大算法](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
評(píng)論