欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分享一種基于深度圖像梯度的線特征提取算法download

jf_pmFSk4VX ? 來(lái)源:GiantPandaCV ? 2023-01-08 14:29 ? 次閱讀

0. 筆者個(gè)人體會(huì)

在低紋理區(qū)域,傳統(tǒng)的基于特征點(diǎn)的SfM/SLAM/三維重建算法很容易失敗。因此很多算法會(huì)嘗試去提取線特征來(lái)提高點(diǎn)特征的魯棒性,典型操作就是LSD

但在一些帶噪聲的低光照環(huán)境下,LSD很容易失效。而且線特征檢測(cè)的難點(diǎn)在于,由于遮擋,線端點(diǎn)的精確定位很難獲得。

它使用深度學(xué)習(xí)來(lái)處理圖像并丟棄不必要的細(xì)節(jié),然后使用手工方法來(lái)檢測(cè)線段。

因此,DeepLSD不僅對(duì)光照和噪聲具有更強(qiáng)魯棒性,同時(shí)保留了經(jīng)典方法的準(zhǔn)確性。整篇文章的推導(dǎo)和實(shí)驗(yàn)非常詳實(shí),重要的是算法已經(jīng)開(kāi)源!

2. 摘要

線段在我們的人造世界中無(wú)處不在,并且越來(lái)越多地用于視覺(jué)任務(wù)中。由于它們提供的空間范圍和結(jié)構(gòu)信息,它們是特征點(diǎn)的補(bǔ)充。

基于圖像梯度的傳統(tǒng)線檢測(cè)器非??焖俸蜏?zhǔn)確,但是在噪聲圖像和挑戰(zhàn)性條件下缺乏魯棒性。他們有經(jīng)驗(yàn)的同行更具可重復(fù)性,可以處理具有挑戰(zhàn)性的圖像,但代價(jià)是精確度較低,偏向線框線。

我們建議將傳統(tǒng)方法和學(xué)習(xí)方法結(jié)合起來(lái),以獲得兩個(gè)世界的最佳效果:一個(gè)準(zhǔn)確而魯棒的線檢測(cè)器,可以在沒(méi)有真值線的情況下在野外訓(xùn)練。

我們的新型線段檢測(cè)器DeepLSD使用深度網(wǎng)絡(luò)處理圖像,以生成線吸引力場(chǎng),然后將其轉(zhuǎn)換為替代圖像梯度幅度和角度,再饋入任何現(xiàn)有的手工線檢測(cè)器。

此外,我們提出了一個(gè)新的優(yōu)化工具,以完善基于吸引力場(chǎng)和消失點(diǎn)的線段。

這種改進(jìn)大大提高了當(dāng)前深度探測(cè)器的精度。我們展示了我們的方法在低級(jí)線檢測(cè)度量上的性能,以及在使用多挑戰(zhàn)數(shù)據(jù)集的幾個(gè)下游任務(wù)上的性能。

3. 算法解讀

作者將深度網(wǎng)絡(luò)的魯棒性與手工制作的線特征檢測(cè)器的準(zhǔn)確性結(jié)合起來(lái)。具體來(lái)說(shuō),有如下四步:

(1) 通過(guò)引導(dǎo)LSD生成真實(shí)線距離和角度場(chǎng)(DF/AF)。

(2) 訓(xùn)練深度網(wǎng)絡(luò)以預(yù)測(cè)線吸引場(chǎng)DF/AF,然后將其轉(zhuǎn)換為替代圖像梯度。

(3) 利用手工LSD提取線段。

(4) 基于吸引場(chǎng)DF/AF進(jìn)行細(xì)化。

8c1a4daa-8e4d-11ed-bfe3-dac502259ad0.png

圖1 方法概述

作者所做主要貢獻(xiàn)如下:

(1) 提出了一種自舉當(dāng)前檢測(cè)器的方法來(lái)在任意圖像上創(chuàng)建真實(shí)線吸引場(chǎng)。

(2) 引入了一個(gè)優(yōu)化過(guò)程,可以同時(shí)優(yōu)化線段和消失點(diǎn)。這種優(yōu)化可以作為一種獨(dú)立的細(xì)化來(lái)提高任何現(xiàn)有的深度線檢測(cè)器的精度。

(3) 在多個(gè)需要線特征的下游任務(wù)中,通過(guò)結(jié)合深度學(xué)習(xí)方法的魯棒性和手工方法在單個(gè)pipeline中的精度,創(chuàng)造了新的記錄。

3.1 線吸引場(chǎng)

最早通過(guò)吸引場(chǎng)表示線段的方法是AFM,為圖像的每個(gè)像素回歸一個(gè)2D向量場(chǎng),來(lái)表示直線上最近點(diǎn)的相對(duì)位置。

該方法允許將離散量(線段)表示為適合深度學(xué)習(xí)的平滑2通道圖像。然而,這種表示方法并不是獲得精確線段的最佳方法。

如圖2所示,比如HAWP那樣直接預(yù)測(cè)端點(diǎn)的位置需要很大的感受野,以便能夠從遙遠(yuǎn)的端點(diǎn)獲取信息。

8c27bb5c-8e4d-11ed-bfe3-dac502259ad0.png

圖2 吸引場(chǎng)參數(shù)化。(a)對(duì)二維向量進(jìn)行參數(shù)化可能會(huì)對(duì)小向量模產(chǎn)生噪聲角。(b) 向端點(diǎn)添加偏移量需要長(zhǎng)程信息且對(duì)噪聲端點(diǎn)不具有魯棒性。作者提出將距離場(chǎng)(c)和線角度場(chǎng)(d)解耦。

而DeepLSD這項(xiàng)工作的巧妙之處在于,作者提出將網(wǎng)絡(luò)限制在一個(gè)較小的感受野,并使用傳統(tǒng)的啟發(fā)式方法來(lái)確定端點(diǎn)。

DeepLSD采用和HAWP類(lèi)似的吸引場(chǎng),但沒(méi)有額外的兩個(gè)指向端點(diǎn)的角度,只保留線距離場(chǎng)(DF)和線角度場(chǎng)(AF)。其中線距離場(chǎng)DF給出當(dāng)前像素到直線上最近點(diǎn)的距離,線角度場(chǎng)AF返回最近直線的方向:

8c35c1fc-8e4d-11ed-bfe3-dac502259ad0.png

3.2 真值生成

為了學(xué)習(xí)線吸引場(chǎng),需要ground truth。AFM和HAWP都是使用線框數(shù)據(jù)集的真值來(lái)監(jiān)督。但DeepLSD的作者探索了一種新的方法,即通過(guò)引導(dǎo)先前的線檢測(cè)器來(lái)獲取真值。

具體來(lái)說(shuō),就是通過(guò)單應(yīng)性自適應(yīng)生成真值吸引場(chǎng)。給定單幅輸入圖像I,將其與N個(gè)隨機(jī)單應(yīng)矩陣Hi進(jìn)行wrap,在所有wrap后的圖像Ii中使用LSD檢測(cè)直線段,然后將其wrap回到I來(lái)得到線集合Li。

下一步是將所有的線聚合在一起,這一部分是個(gè)難點(diǎn)。作者的做法是將線條集合Li轉(zhuǎn)換為距離場(chǎng)Di和角度場(chǎng)Ai,并通過(guò)取所有圖像中每個(gè)像素(u, v)的中值來(lái)聚合:

8c42bede-8e4d-11ed-bfe3-dac502259ad0.png

通過(guò)取中值,可以去除僅在少數(shù)圖像中檢測(cè)到的噪聲,結(jié)果如圖3所示。

8c60f9b2-8e4d-11ed-bfe3-dac502259ad0.png

圖3 偽GT可視化

3.3 學(xué)習(xí)線吸引場(chǎng)

為了回歸距離場(chǎng)和角度場(chǎng),DeepLSD使用了UNet架構(gòu),尺寸為HxW的輸入圖像經(jīng)多個(gè)卷積層處理,并通過(guò)連續(xù)3次平均池化操作逐步降采樣至8倍。

然后通過(guò)另一系列卷積層和雙線性插值將特征放大回原始分辨率。得到的深度特征被分成兩個(gè)分支,一個(gè)輸出距離場(chǎng),一個(gè)輸出角度場(chǎng)。最后距離場(chǎng)通過(guò)反歸一化得到:

8c6eafbc-8e4d-11ed-bfe3-dac502259ad0.png

其中r是像素中的一個(gè)參數(shù),它定義了每條線周?chē)膮^(qū)域。由于手工方法主要需要線段附近的梯度信息,因此DeepLSD只對(duì)距離線段小于r個(gè)像素的像素進(jìn)行監(jiān)督。

總損失為距離場(chǎng)和角度場(chǎng)的損失之和:

8c7dc056-8e4d-11ed-bfe3-dac502259ad0.png

這里就沒(méi)啥可說(shuō)的了,LD為歸一化距離場(chǎng)之間的L1損失,LA為L(zhǎng)2角度損失:

8c8acb7a-8e4d-11ed-bfe3-dac502259ad0.png

3.4.提取線段

由于LSD是基于圖像梯度的,因此需要將距離場(chǎng)和角度場(chǎng)轉(zhuǎn)換為替代圖像梯度幅度和角度:

8c9c3c70-8e4d-11ed-bfe3-dac502259ad0.png

AFM和LSD方法的一個(gè)重要區(qū)別是梯度方向。對(duì)于黑暗與明亮區(qū)域分離的邊緣,LSD跟蹤從暗到亮的梯度方向,而AFM不跟蹤。

如圖4所示,當(dāng)幾條平行線以暗-亮-暗或亮-暗-亮的模式相鄰出現(xiàn)時(shí),這就變得很重要。

為了更好的精度和尺度不變性,DeepLSD檢測(cè)這些雙邊緣,并構(gòu)造角度方向:

8ca9eab4-8e4d-11ed-bfe3-dac502259ad0.png

8cb7df34-8e4d-11ed-bfe3-dac502259ad0.png

圖4 區(qū)分雙邊緣。(a) 亮-暗-亮邊緣和定向角度場(chǎng)的示例。(b) HAWP將其視為一條直線。(c) 為了準(zhǔn)確,DeepLSD將其檢測(cè)為兩條線。

為了使線特征更加精確,作者還提出了一個(gè)優(yōu)化步驟,即利用第二步預(yù)測(cè)的DF和AF來(lái)細(xì)化。需要注意的是,這種優(yōu)化方法也可以用來(lái)增強(qiáng)任何其他深度探測(cè)器的線特征。

優(yōu)化的核心思路是,在3D中平行的線將共享消失點(diǎn)。因此DeepLSD將其作為軟約束融入到優(yōu)化中,有效地降低了自由度。

首先利用多模型擬合算法Progressive-X計(jì)算一組與預(yù)測(cè)線段相關(guān)的消失點(diǎn)(VPs)。然后對(duì)每條線段獨(dú)立進(jìn)行優(yōu)化,損失函數(shù)是三種不同成本的加權(quán)無(wú)約束最小二乘最小化:

8cc5e7dc-8e4d-11ed-bfe3-dac502259ad0.png8cd3418e-8e4d-11ed-bfe3-dac502259ad0.png

4. 實(shí)驗(yàn)

作者訓(xùn)練了DeepLSD的兩個(gè)版本,一個(gè)在室內(nèi)Wireframe數(shù)據(jù)集,沒(méi)有使用GT線,一個(gè)室外MegaDepth數(shù)據(jù)集。

MegaDepth數(shù)據(jù)集保留150個(gè)場(chǎng)景用于訓(xùn)練,17個(gè)場(chǎng)景用于驗(yàn)證,每個(gè)場(chǎng)景只采集50張圖像。

在實(shí)驗(yàn)細(xì)節(jié)上,使用Adam優(yōu)化器和初始學(xué)習(xí)率為1e3,學(xué)習(xí)率調(diào)整策略為,當(dāng)損失函數(shù)到達(dá)一定數(shù)值時(shí)學(xué)習(xí)率/10。

硬件條件為,在NVIDIA RTX 2080 GPU上訓(xùn)練時(shí)間12小時(shí)。

4.1 直線檢測(cè)性能

作者首先在HPatches數(shù)據(jù)集和RDNIM數(shù)據(jù)集上評(píng)估直線檢測(cè)性能,其中HPatches數(shù)據(jù)集具有不同的光照和視點(diǎn)變化,RDNIM數(shù)據(jù)集具有挑戰(zhàn)性的晝夜變化相關(guān)的圖像對(duì)。

評(píng)價(jià)指標(biāo)為重復(fù)性、定位誤差以及單應(yīng)估計(jì)分?jǐn)?shù)。重復(fù)性(Rep)衡量匹配誤差在3個(gè)像素以下的直線的比例,定位誤差(LE)返回50個(gè)最準(zhǔn)確匹配的平均距離。表1和圖5所示是與經(jīng)典線特征檢測(cè)器的對(duì)比結(jié)果。

表1 在HPatches和RDNIM數(shù)據(jù)集上的直線檢測(cè)評(píng)估

8ce0171a-8e4d-11ed-bfe3-dac502259ad0.png8ced81c0-8e4d-11ed-bfe3-dac502259ad0.png

圖5 線段檢測(cè)示例

從結(jié)果來(lái)看,以TPLSD為首的學(xué)習(xí)方法具有較好的可重復(fù)性,但存在較低的定位誤差和不準(zhǔn)確的單應(yīng)矩陣估計(jì)。

手工方法和DeepLSD由于不直接對(duì)端點(diǎn)進(jìn)行回歸,而是利用非常低的細(xì)節(jié)逐步增長(zhǎng)線段,因此精度更高。

當(dāng)變化最具挑戰(zhàn)性時(shí),DeepLSD比LSD表現(xiàn)出最好的改善,即在晝夜變化強(qiáng)烈的RDNIM上。

可以顯著提高定位誤差和單應(yīng)性估計(jì)分?jǐn)?shù)。LSDNet由于通過(guò)將圖像縮放到固定的低分辨率而失去了準(zhǔn)確性。

總體而言,DeepLSD在手工方法和學(xué)習(xí)方法之間提供了最佳的權(quán)衡,并且在單應(yīng)性估計(jì)的下游任務(wù)中始終排名第一。

4.2 重建及定位

這項(xiàng)工作除了評(píng)估自身的線特征生成質(zhì)量外,還進(jìn)行了三維重建對(duì)比。作者利用Line3D++獲取一組已知姿態(tài)的圖像和相關(guān)的2D線段,并輸出線條的三維重建。

作者在Hypersim數(shù)據(jù)集的前4個(gè)場(chǎng)景上將DeepLSD與幾個(gè)基線進(jìn)行比較。其中召回R為距離網(wǎng)格5 mm以內(nèi)的所有線段的長(zhǎng)度,單位為米,越高意味著許多線條被重建。精度P是距離網(wǎng)格5毫米以內(nèi)的預(yù)測(cè)線的百分比,越高表明大部分預(yù)測(cè)的直線在真實(shí)的三維表面上。

結(jié)果如表2所示,DeepLSD總體上獲得了最好的召回和精度。TP-LSD雖然在召回上排名第一,但是能夠恢復(fù)的直線很少,其平均精度比DeepLSD小71 %。

值得注意的是,DeepLSD比LSD能夠重建更多的直線,且精度更高。

表2 線三維重建對(duì)比結(jié)果

8cfe6e5e-8e4d-11ed-bfe3-dac502259ad0.png

作者在7Scenes數(shù)據(jù)集上進(jìn)行了定位實(shí)驗(yàn),估計(jì)位姿精度,其中Stairs場(chǎng)景對(duì)于特征點(diǎn)的定位非常具有挑戰(zhàn)性。

圖6表明,DeepLSD在這個(gè)具有挑戰(zhàn)性的數(shù)據(jù)集上獲得了最好的性能。

與僅使用點(diǎn)相比,可以突出線特征帶來(lái)的性能的大幅提升。在室內(nèi)環(huán)境中,線特征提取并定位的性能良好,即使在低紋理場(chǎng)景中也可以匹配。

8d09a260-8e4d-11ed-bfe3-dac502259ad0.png

圖6 7Scenes數(shù)據(jù)集樓梯的視覺(jué)定位結(jié)果

4.3 線優(yōu)化的影響

作者還研究了優(yōu)化步驟的影響。對(duì)于每種方法,作者將原始線條與優(yōu)化后的線條和VP進(jìn)行比較。

表3展示了線檢測(cè)器在Wireframe測(cè)試集的462張圖像上的檢測(cè)結(jié)果。結(jié)果顯示,優(yōu)化可以顯著改善不精確方法的定位誤差和單應(yīng)性得分,并顯著提高評(píng)價(jià)直線精度的所有指標(biāo)。

特別是對(duì)于HAWP和TP-LSD,兩者的定位誤差都下降了32 %,單應(yīng)性得分提高了27 %和39 %。

注意,優(yōu)化并沒(méi)有給DeepLSD帶來(lái)多大提升,這是因?yàn)樗脑碱A(yù)測(cè)線已經(jīng)是亞像素精確的,并且優(yōu)化受到DF和AF分辨率的限制。

表3 Wireframe數(shù)據(jù)集上的線優(yōu)化

8d17967c-8e4d-11ed-bfe3-dac502259ad0.png

4.4 消融研究

作者在HPatches數(shù)據(jù)集上用低級(jí)別檢測(cè)器指標(biāo)驗(yàn)證了設(shè)計(jì)選擇,將DeepLSD與單邊相同模型進(jìn)行比較。表4展示了各組成部分的重要性。

值得注意的是,在DeepLSD上重新訓(xùn)練HAWP會(huì)導(dǎo)致較差的結(jié)果,因?yàn)榕c線框線相比,線條的數(shù)量更多,而且一般的直線往往有噪聲的端點(diǎn),因此預(yù)測(cè)到兩個(gè)端點(diǎn)的角度也是有噪聲的。

表4 HPatches數(shù)據(jù)集上的消融實(shí)驗(yàn)

8d2557b2-8e4d-11ed-bfe3-dac502259ad0.png

5. 結(jié)論

作者提出了一種混合線段檢測(cè)器,結(jié)合了深度學(xué)習(xí)的魯棒性和手工檢測(cè)器的準(zhǔn)確性,并使用學(xué)習(xí)的替代圖像梯度作為中間表示。還提出了一種可以應(yīng)用于現(xiàn)有深度檢測(cè)器的優(yōu)化方法,彌補(bǔ)了深度檢測(cè)器和手工檢測(cè)器之間的線局部化的差距。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 檢測(cè)器
    +關(guān)注

    關(guān)注

    1

    文章

    870

    瀏覽量

    47795
  • SLAM
    +關(guān)注

    關(guān)注

    23

    文章

    426

    瀏覽量

    31936
  • AFM
    AFM
    +關(guān)注

    關(guān)注

    0

    文章

    59

    瀏覽量

    20218

原文標(biāo)題:DeepLSD:基于深度圖像梯度的線段檢測(cè)和細(xì)化

文章出處:【微信號(hào):GiantPandaCV,微信公眾號(hào):GiantPandaCV】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    使用機(jī)器學(xué)習(xí)改善庫(kù)特征提取的質(zhì)量和運(yùn)行時(shí)間

    基于靜態(tài)時(shí)序分析(STA)的現(xiàn)代設(shè)計(jì)流程非常依賴標(biāo)準(zhǔn)單元、IO、存儲(chǔ)器和定制模塊的特征化Liberty模型。高效、準(zhǔn)確的庫(kù)特征提取是全芯片或模塊級(jí)設(shè)計(jì)流程的關(guān)鍵步驟之,因?yàn)樗艽_保所有庫(kù)單元在所
    的頭像 發(fā)表于 12-26 11:15 ?197次閱讀
    使用機(jī)器學(xué)習(xí)改善庫(kù)<b class='flag-5'>特征提取</b>的質(zhì)量和運(yùn)行時(shí)間

    深度識(shí)別算法包括哪些內(nèi)容

    :CNN是深度學(xué)習(xí)中處理圖像和視頻等具有網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的主要算法。它通過(guò)卷積層、池化層和全連接層等組件,實(shí)現(xiàn)對(duì)圖像特征的自動(dòng)
    的頭像 發(fā)表于 09-10 15:28 ?487次閱讀

    深度識(shí)別人臉識(shí)別在任務(wù)中為什么有很強(qiáng)大的建模能力

    通過(guò)大量數(shù)據(jù)進(jìn)行訓(xùn)練,能夠自動(dòng)學(xué)習(xí)到人臉的特征表示,而不需要人為設(shè)計(jì)特征提取算法。 多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) :深度學(xué)習(xí)模型通常包含多層神經(jīng)網(wǎng)絡(luò),這使得模型能夠捕捉到人臉的復(fù)雜
    的頭像 發(fā)表于 09-10 14:53 ?502次閱讀

    圖像識(shí)別算法都有哪些方法

    圖像識(shí)別算法是計(jì)算機(jī)視覺(jué)領(lǐng)域的核心任務(wù)之,它涉及到從圖像提取特征并進(jìn)行分類(lèi)、識(shí)別和分析的過(guò)程
    的頭像 發(fā)表于 07-16 11:14 ?6092次閱讀

    圖像識(shí)別算法的核心技術(shù)是什么

    圖像識(shí)別算法是計(jì)算機(jī)視覺(jué)領(lǐng)域的個(gè)重要研究方向,其目標(biāo)是使計(jì)算機(jī)能夠像人類(lèi)樣理解和識(shí)別圖像中的內(nèi)容。
    的頭像 發(fā)表于 07-16 11:02 ?779次閱讀

    圖像識(shí)別技術(shù)的原理是什么

    圖像識(shí)別技術(shù)是一種利用計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)技術(shù)對(duì)圖像進(jìn)行分析和理解的技術(shù)。它可以幫助計(jì)算機(jī)識(shí)別和理解圖像中的對(duì)象、場(chǎng)景和活動(dòng)。 圖像預(yù)處理
    的頭像 發(fā)表于 07-16 10:46 ?1456次閱讀

    圖像處理中的卷積運(yùn)算

    卷積運(yùn)算是圖像處理中一種極其重要的操作,廣泛應(yīng)用于圖像濾波、邊緣檢測(cè)、特征提取等多個(gè)方面。它基于個(gè)核(或稱(chēng)為卷積核、濾波器)與
    的頭像 發(fā)表于 07-11 15:15 ?2699次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)通常包括哪幾層

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱(chēng)CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、視頻分析、自然語(yǔ)言處理等領(lǐng)域。CNN的核心特點(diǎn)是能夠自動(dòng)提取
    的頭像 發(fā)表于 07-11 14:41 ?889次閱讀

    計(jì)算機(jī)視覺(jué)怎么給圖像分類(lèi)

    圖像分類(lèi)是計(jì)算機(jī)視覺(jué)領(lǐng)域中的項(xiàng)核心任務(wù),其目標(biāo)是將輸入的圖像自動(dòng)分配到預(yù)定義的類(lèi)別集合中。這過(guò)程涉及圖像
    的頭像 發(fā)表于 07-08 17:06 ?928次閱讀

    深度學(xué)習(xí)與nlp的區(qū)別在哪

    ,它通過(guò)模擬人腦的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),實(shí)現(xiàn)對(duì)數(shù)據(jù)的自動(dòng)特征提取和學(xué)習(xí)。深度學(xué)習(xí)的核心是構(gòu)建多層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),每層都包含大量的神經(jīng)元,這些神經(jīng)元通過(guò)權(quán)重連接,實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)的逐層抽象和特征提取
    的頭像 發(fā)表于 07-05 09:47 ?1070次閱讀

    如何設(shè)計(jì)人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)

    人臉識(shí)別技術(shù)是一種基于人臉特征信息進(jìn)行身份識(shí)別的技術(shù),廣泛應(yīng)用于安全監(jiān)控、身份認(rèn)證、智能門(mén)禁等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn)人臉識(shí)別的關(guān)鍵技術(shù)之,本文將介紹如何設(shè)計(jì)人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)。 人臉識(shí)別概述 人臉
    的頭像 發(fā)表于 07-04 09:20 ?757次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及其功能

    。 引言 深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的個(gè)分支,它通過(guò)模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能,實(shí)現(xiàn)對(duì)數(shù)據(jù)的自動(dòng)學(xué)習(xí)和特征提取。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中的一種
    的頭像 發(fā)表于 07-02 14:45 ?2580次閱讀

    基于深度學(xué)習(xí)的鳥(niǎo)類(lèi)聲音識(shí)別系統(tǒng)

    的泛化能力,然后提出了個(gè)輕量級(jí)的鳥(niǎo)類(lèi)聲音識(shí)別模型,以MobileNetV3為骨干構(gòu)建了一種輕量級(jí)的特征提取和識(shí)別網(wǎng)絡(luò)。通過(guò)調(diào)整模型中的深度可分離卷積,提高了模型的識(shí)別能力。設(shè)計(jì)了
    發(fā)表于 05-30 20:30

    基于FPGA的實(shí)時(shí)邊緣檢測(cè)系統(tǒng)設(shè)計(jì),Sobel圖像邊緣檢測(cè),F(xiàn)PGA圖像處理

    摘要 :本文設(shè)計(jì)了一種 基于 FPGA 的實(shí)時(shí)邊緣檢測(cè)系統(tǒng) ,使用OV5640 攝像頭模塊獲取實(shí)時(shí)的視頻圖像數(shù)據(jù),提取圖像邊緣信息并通過(guò) VGA顯示。FPGA 內(nèi)部使用流水線設(shè)計(jì)和 并
    發(fā)表于 05-24 07:45

    咳嗽檢測(cè)深度神經(jīng)網(wǎng)絡(luò)算法

    的胸部以完成任務(wù)。由于該方法被普遍采用,因?yàn)閷?shí)時(shí)咳嗽事件將為進(jìn)步分析提供更好的結(jié)果,因此它根據(jù)聲音質(zhì)量和咳痰密度將聲音分為干咳、百日咳和濕咳。我們提出的模型包括預(yù)處理、使用MFCC[12]的特征提取
    發(fā)表于 05-15 19:05