欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google欲用神經(jīng)網(wǎng)絡(luò)搜索來(lái)實(shí)現(xiàn)語(yǔ)義分割

mK5P_AItists ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-10-09 16:53 ? 次閱讀

1. Introduction

在 arxiv 瀏覽論文的時(shí)候,單獨(dú)看文章名不知道屬于 CV 哪個(gè)領(lǐng)域,懷著對(duì)一作 Liang-Chieh 敬畏的心,在摘要中掃描到 PASCAL VOC 2012 (semantic image segmentation),瀏覽全文才明白,Google 又發(fā)大招。

Google 在 Cloud AutoML 不斷發(fā)力,相比較而言之前的工作只是在圖像分類(lèi)領(lǐng)域精耕細(xì)作,如今在圖像分割開(kāi)疆?dāng)U土,在 arxiv 提交第一篇基于 NAS(Neural network architecture)的語(yǔ)義分割模型[1](DPC,dense prediction cell)已經(jīng)被 NIPS2018 接收,并且在 Cityscapes,PASCAL-Person-Part,PASCAL VOC 2012 取得 state-of-art 的性能(mIOU 超過(guò) DeepLabv3+)和更高的計(jì)算效率(模型參數(shù)少,計(jì)算量減少)。

Google 儼然已是圖像語(yǔ)義分割領(lǐng)域的高產(chǎn)霸主,Liang-Chieh 從 Deeplabv1- Deeplabv3+ 持續(xù)發(fā)力,還是 MobileNetV2 共同作者,如今在 NAS 領(lǐng)域開(kāi)發(fā)處女地:基于 NAS 的語(yǔ)義分割模型,性能超過(guò)之前的基于 MobileNetV2 的 Network Backbone。

2. Motivation

深度學(xué)習(xí)技術(shù)已經(jīng)成為當(dāng)前人工智能領(lǐng)域的一個(gè)研究熱點(diǎn),其在圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域展現(xiàn)出了巨大的優(yōu)勢(shì),并且仍在繼續(xù)發(fā)展變化。自 Google 提出 Cloud AutoML,NAS(Neural Architecture Search,神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索)也取得重大進(jìn)展,但更多的是在圖像分類(lèi)和自然語(yǔ)言處理方面的應(yīng)用。在過(guò)去的一年中,元學(xué)習(xí)(meta-learning)在大規(guī)模圖像分類(lèi)問(wèn)題上,性能已經(jīng)實(shí)現(xiàn)超越人類(lèi)手工設(shè)計(jì)的神經(jīng)網(wǎng)架構(gòu)。

基于 NAS 的圖像分類(lèi)遷移到高分辨率的圖像處理(語(yǔ)義分割、目標(biāo)識(shí)別、實(shí)例分割)有很大的挑戰(zhàn):(1)神經(jīng)網(wǎng)絡(luò)的搜索空間和基本運(yùn)算單元有本質(zhì)不同。(2)架構(gòu)搜索必須固有地在高分辨率圖像上運(yùn)行,因此不能實(shí)現(xiàn)從低分辨率圖像訓(xùn)練模型遷移到高分辨率圖像。

論文首次嘗試將元學(xué)習(xí)應(yīng)用于密集圖像預(yù)測(cè)(本人理解就是像素級(jí)圖像分割)。語(yǔ)義分割領(lǐng)域一般使用 encoder-decoder 模型,空間金字塔結(jié)構(gòu),空洞卷積等,目標(biāo)是實(shí)現(xiàn)構(gòu)建高分辨率圖像的多尺度特征,密集預(yù)測(cè)像素級(jí)標(biāo)簽。論文利用這些技術(shù)構(gòu)建搜索空間,同時(shí)構(gòu)建計(jì)算量少、處理簡(jiǎn)單的代理任務(wù),該任務(wù)可為高分辨率圖像提供多尺度架構(gòu)的預(yù)測(cè)信息

論文提出的模型在 Cityscapes dataset 驗(yàn)證測(cè)試,取得 82.7% mIOU,超過(guò)人類(lèi)手工設(shè)計(jì)模型 0.7%。在 person-part segmentation 和 VOC 2012 也取得 state-of-art 性能。

3. Architecture

深度學(xué)習(xí)在感知任務(wù)中取得的成功主要?dú)w功于其特征工程過(guò)程自動(dòng)化:分層特征提取器是以端到端的形式從數(shù)據(jù)中學(xué)習(xí),而不是手工設(shè)計(jì)。然而,伴隨這一成功而來(lái)的是對(duì)架構(gòu)工程日益增長(zhǎng)的需求,越來(lái)越多的復(fù)雜神經(jīng)架構(gòu)是由手工設(shè)計(jì)的。算法工程師一般自我調(diào)侃“煉丹師”,就是因?yàn)槌瑓?shù)的設(shè)計(jì)選取存在太多偶然性,是一門(mén)玄學(xué),沒(méi)有明顯的規(guī)律性。

Neural Architecture Search (NAS) 是一種給定模型結(jié)構(gòu)搜索空間的搜索算法,代表機(jī)器學(xué)習(xí)的未來(lái)方向。NAS 是 AutoML 的子領(lǐng)域,在超參數(shù)優(yōu)化和元學(xué)習(xí)等領(lǐng)域高度重疊。NAS 根據(jù)維度可分為三類(lèi):搜索空間、搜索策略和性能評(píng)估策略。

3.1 搜索空間

搜索空間原則上定義了網(wǎng)絡(luò)架構(gòu)。在圖像分類(lèi)任務(wù)中分為三類(lèi):鏈?zhǔn)郊軜?gòu)空間、多分支架構(gòu)空間、Cell/block 構(gòu)建的搜索空間。

論文提出了基于 Dense Prediction Cell (DPC)構(gòu)建的遞歸搜索空間,對(duì)多尺度上下文信息編碼,實(shí)現(xiàn)語(yǔ)義分割任務(wù)。

圖 1 DPC 模型架構(gòu)

DPC 由有向無(wú)環(huán)圖(directed acyclic graph ,DAG)表示,每個(gè) Cell 包含 B 個(gè)分支,每個(gè)分支映射輸入到輸出的張量。每個(gè) Cell 的操作類(lèi)型包括 1x1 卷積,不同比率的 3x3 空洞卷積,不同尺寸的均值空間金字塔池化。

圖 2 3x3 空洞卷積比率類(lèi)型

根據(jù)論文提供的操作方式,3x3 空洞卷積有 8x8,均值空間金字塔池化有 4x4 操作,即操作函數(shù)共有 1+8*8+4*4=81 種類(lèi)型,對(duì)于 B 分支的 Cell,搜索空間為 B!*81B,當(dāng) B=5,搜索空間為 5!*815≈4.2*1011。

3.2 搜索策略

搜索策略定義了使用怎樣的算法可以快速、準(zhǔn)確找到最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)配置。

機(jī)器學(xué)習(xí)模型超參數(shù)調(diào)優(yōu)一般認(rèn)為是一個(gè)黑盒優(yōu)化問(wèn)題,所謂黑盒問(wèn)題就是我們?cè)谡{(diào)優(yōu)的過(guò)程中只看到模型的輸入和輸出,不能獲取模型訓(xùn)練過(guò)程的梯度信息,也不能假設(shè)模型超參數(shù)和最終指標(biāo)符合凸優(yōu)化條件。

自動(dòng)調(diào)參算法一般有 Grid search(網(wǎng)格搜索)、Random search(隨機(jī)搜索),還有 Genetic algorithm(遺傳算法)、Paticle Swarm Optimization(粒子群優(yōu)化)、Bayesian Optimization(貝葉斯優(yōu)化)、TPE、SMAC 等方式。

論文采用隨機(jī)搜索的方式,基于 Google Vizier 實(shí)現(xiàn)[3]。Github 上有開(kāi)源實(shí)現(xiàn)的 advisor[4](非Google 開(kāi)源,第三方),包括隨機(jī)搜索,網(wǎng)格搜索,貝葉斯優(yōu)化等調(diào)參算法實(shí)現(xiàn),感興趣可以關(guān)注一下。

3.3 性能評(píng)估策略

因?yàn)樯疃葘W(xué)習(xí)模型的效果非常依賴于訓(xùn)練數(shù)據(jù)的規(guī)模,通常意義上的訓(xùn)練集、測(cè)試集和驗(yàn)證集規(guī)模實(shí)現(xiàn)驗(yàn)證模型的性能會(huì)非常耗時(shí),例如 DPC 在 Cityscapes dataset 上訓(xùn)練,使用 1 個(gè) P100 GPU 訓(xùn)練候選架構(gòu)(90 迭代次數(shù))需要一周以上時(shí)間,所以需要一些策略去做近似的評(píng)估,同時(shí)滿足快速訓(xùn)練和可以預(yù)測(cè)大規(guī)模訓(xùn)練集的性能。

圖像分類(lèi)任務(wù)中通常在低分辨率圖像中訓(xùn)練模型,再遷移到高分辨率圖像模型中。但是圖像分割需要多尺度上下文信息。論文提出設(shè)計(jì)代理數(shù)據(jù)集:(1)采用較小的骨干網(wǎng)絡(luò)(network backbone),(2)緩存主干網(wǎng)絡(luò)在訓(xùn)練集生成的特征圖,并在其基礎(chǔ)上構(gòu)建單個(gè) DPC。(個(gè)人理解應(yīng)該是權(quán)值共享的方式)。(3)訓(xùn)練候選架構(gòu)時(shí)提前終止(實(shí)驗(yàn)中占用 30K 迭代訓(xùn)練每個(gè)候選架構(gòu))。

論文采用以上策略,在 GPU 上訓(xùn)練只運(yùn)行 90 分鐘,相比一周的訓(xùn)練時(shí)間大幅度縮短。

在架構(gòu)搜索后,論文對(duì)候選架構(gòu)進(jìn)行 reranking experiment,精準(zhǔn)測(cè)量每個(gè)架構(gòu)在大規(guī)模數(shù)據(jù)集的性能。reranking experiment 中,主干網(wǎng)絡(luò)經(jīng)過(guò)微調(diào)和訓(xùn)練完全收斂,生成的最優(yōu)模型作為最佳 DPC 架構(gòu)。

4. Experiment&Result

論文在場(chǎng)景理解(Cityscapes),人體分割(PASCAL- Person-Part),語(yǔ)義分割(PASCAL VOC 2012)對(duì)比展示 DPC 模型的性能。主干網(wǎng)絡(luò)在 COCO 數(shù)據(jù)集預(yù)訓(xùn)練,訓(xùn)練學(xué)習(xí)率采用多項(xiàng)式學(xué)習(xí)率,初始化為 0.01,裁剪圖像,fine-tuned BN 參數(shù)(batch size=8,16)。評(píng)測(cè)和架構(gòu)搜索中,圖像尺寸采用單一類(lèi)型。對(duì)比其他 state-of-the-art 系統(tǒng)時(shí),通過(guò)對(duì)給定圖像的多個(gè)縮放進(jìn)行平均來(lái)執(zhí)行評(píng)估。

論文使用提出的 DPC 架構(gòu)搜索空間,在 Cityscapes 部署生成的代理任務(wù),370 個(gè) GPU 在一周時(shí)間中評(píng)估 28K 個(gè) DPC 架構(gòu)。論文采用 MobileNet-v2 主干網(wǎng)絡(luò)對(duì)整個(gè)模型進(jìn)行微調(diào),選擇前 50 個(gè)架構(gòu)進(jìn)行重新排序。

論文中圖 5 、圖 6 展示了頂級(jí) DPC 架構(gòu)的示意圖。在圖 5b 每個(gè)分支(通過(guò) 1*1 卷積)的 L1 正則化權(quán)重,我們觀察到具有 3×3 卷積(速率= 1×6)的分支貢獻(xiàn)最大,而具有大速率(即較長(zhǎng)背景)的分支貢獻(xiàn)較少。換句話說(shuō),來(lái)自更接近(即最終空間尺度)的圖像特征的信息對(duì)網(wǎng)絡(luò)的最終輸出貢獻(xiàn)更多。相反,性能最差的 DPC(圖 6c)不保留精細(xì)空間信息,因?yàn)樗谌謭D像池操作之后級(jí)聯(lián)四個(gè)分支。

論文實(shí)驗(yàn)中,表 1,表 2,表 3分別對(duì)應(yīng)在場(chǎng)景理解(Cityscapes),人體分割(PASCAL- Person-Part),語(yǔ)義分割(PASCAL VOC 2012)的模型性能,DPC 在各個(gè)數(shù)據(jù)集取得 state-of-art 性能。

5. Discussion

1、論文提出的 DPC 架構(gòu)基于 Cell 構(gòu)建的搜索空間,每個(gè) Cell 有語(yǔ)義分割采用經(jīng)典的空洞卷積,空間金字塔池化,1x1 卷積,在 mIOU 實(shí)現(xiàn) state-of-art 水準(zhǔn)。

2、論文的搜索策略采用隨機(jī)搜索,評(píng)價(jià)指標(biāo)也只有 mIOU,相比 Google 另一篇論文 MnasNet,在準(zhǔn)確率和推斷時(shí)間上均有顯著提高。

3、論文摘要選擇只需要一半的參數(shù)和一半的計(jì)算效率,但是只在論文的表 1 即 Cityscapes 數(shù)據(jù)集對(duì)比了 MobileNet-v2 和 modified Xception 的實(shí)現(xiàn)方式,其他數(shù)據(jù)集沒(méi)有體現(xiàn)計(jì)算效率的優(yōu)越性。論文架構(gòu)搜索和訓(xùn)練時(shí)的目標(biāo)函數(shù)沒(méi)有計(jì)算效率的體現(xiàn)。

Additionally, the resulting architecture is more computationally efficient, requiring half the parameters and half the computational cost as previous state of the art systems

4、作為 Google 在語(yǔ)義分割領(lǐng)域的開(kāi)山之作,目測(cè)會(huì)有一大批基于 NAS 實(shí)現(xiàn)的目標(biāo)檢測(cè)、實(shí)例分割的優(yōu)秀論文,NAS 應(yīng)用到工業(yè)產(chǎn)品指日可待。

5、語(yǔ)義分割是一種廣義上的圖像分類(lèi)(對(duì)圖像的每個(gè)像素進(jìn)行分類(lèi)),和圖像分類(lèi)在搜索空間有很多相似之處,但是目標(biāo)檢測(cè)需要 Region Proposal,Bounding-Box Regression 等,增加搜索空間的難度,NAS 在目標(biāo)檢測(cè)領(lǐng)域可能還需要很長(zhǎng)一段路要走。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1772

    瀏覽量

    57843
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4785

    瀏覽量

    101250

原文標(biāo)題:語(yǔ)義分割領(lǐng)域開(kāi)山之作:Google提出用神經(jīng)網(wǎng)絡(luò)搜索實(shí)現(xiàn)語(yǔ)義分割

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)工具與框架

    卷積神經(jīng)網(wǎng)絡(luò)因其在圖像和視頻處理任務(wù)中的卓越性能而廣受歡迎。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,多種實(shí)現(xiàn)工具和框架應(yīng)運(yùn)而生,為研究人員和開(kāi)發(fā)者提供了強(qiáng)大的支持。 TensorFlow 概述
    的頭像 發(fā)表于 11-15 15:20 ?338次閱讀

    分享幾個(gè)FPGA實(shí)現(xiàn)的小型神經(jīng)網(wǎng)絡(luò)

    今天我們分享幾個(gè)FPGA實(shí)現(xiàn)的小型神經(jīng)網(wǎng)絡(luò),側(cè)重應(yīng)用。
    的頭像 發(fā)表于 07-24 09:30 ?1352次閱讀
    分享幾個(gè)<b class='flag-5'>用</b>FPGA<b class='flag-5'>實(shí)現(xiàn)</b>的小型<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    神經(jīng)網(wǎng)絡(luò)專(zhuān)用硬件實(shí)現(xiàn)的方法和技術(shù)

    神經(jīng)網(wǎng)絡(luò)專(zhuān)用硬件實(shí)現(xiàn)是人工智能領(lǐng)域的一個(gè)重要研究方向,旨在通過(guò)設(shè)計(jì)專(zhuān)門(mén)的硬件來(lái)加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理過(guò)程,提高計(jì)算效率和能效比。以下將詳細(xì)介紹神經(jīng)
    的頭像 發(fā)表于 07-15 10:47 ?1446次閱讀

    遞歸神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)方法

    (Recurrent Neural Network,通常也簡(jiǎn)稱為RNN,但在此處為區(qū)分,我們將循環(huán)神經(jīng)網(wǎng)絡(luò)稱為Recurrent RNN)不同,遞歸神經(jīng)網(wǎng)絡(luò)更側(cè)重于處理樹(shù)狀或圖結(jié)構(gòu)的數(shù)據(jù),如句法分析樹(shù)、自然語(yǔ)言的語(yǔ)法結(jié)構(gòu)等。以下將從遞歸
    的頭像 發(fā)表于 07-10 17:02 ?414次閱讀

    圖像分割語(yǔ)義分割中的CNN模型綜述

    圖像分割語(yǔ)義分割是計(jì)算機(jī)視覺(jué)領(lǐng)域的重要任務(wù),旨在將圖像劃分為多個(gè)具有特定語(yǔ)義含義的區(qū)域或?qū)ο?。卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為深度學(xué)習(xí)的一種核心
    的頭像 發(fā)表于 07-09 11:51 ?1203次閱讀

    matlab的神經(jīng)網(wǎng)絡(luò)app怎么

    而成。每個(gè)神經(jīng)元接收輸入信號(hào),通過(guò)激活函數(shù)處理后輸出信號(hào)。神經(jīng)網(wǎng)絡(luò)可以通過(guò)學(xué)習(xí)訓(xùn)練數(shù)據(jù),自動(dòng)調(diào)整權(quán)重,以實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)的分類(lèi)、回歸、模式識(shí)別等功能。 1.1 神經(jīng)
    的頭像 發(fā)表于 07-09 09:49 ?516次閱讀

    rnn是遞歸神經(jīng)網(wǎng)絡(luò)還是循環(huán)神經(jīng)網(wǎng)絡(luò)

    RNN(Recurrent Neural Network)是循環(huán)神經(jīng)網(wǎng)絡(luò),而非遞歸神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)是一種具有時(shí)間序列特性的神經(jīng)網(wǎng)絡(luò),能夠處理序列數(shù)據(jù),具有記憶功能。以下是關(guān)于循環(huán)
    的頭像 發(fā)表于 07-05 09:52 ?674次閱讀

    遞歸神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)

    遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡(jiǎn)稱RNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,簡(jiǎn)稱RNN)實(shí)際上是同一個(gè)概念,只是不同的翻譯方式
    的頭像 發(fā)表于 07-04 14:54 ?903次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network,簡(jiǎn)稱BP神經(jīng)網(wǎng)絡(luò))是一種多層前饋神經(jīng)網(wǎng)絡(luò),它通過(guò)反向傳播算法來(lái)調(diào)整網(wǎng)
    的頭像 發(fā)表于 07-03 11:00 ?884次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)原理

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、視頻分析、自然語(yǔ)言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)原理、結(jié)構(gòu)
    的頭像 發(fā)表于 07-03 10:49 ?683次閱讀

    bp神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)區(qū)別是什么

    結(jié)構(gòu)、原理、應(yīng)用場(chǎng)景等方面都存在一定的差異。以下是對(duì)這兩種神經(jīng)網(wǎng)絡(luò)的比較: 基本結(jié)構(gòu) BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),由輸入層、隱藏層和輸出層組成。每個(gè)神經(jīng)元之間通過(guò)權(quán)重連接,并通
    的頭像 發(fā)表于 07-03 10:12 ?1394次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)分類(lèi)方法有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類(lèi)、目標(biāo)檢測(cè)、語(yǔ)義分割等計(jì)算機(jī)視覺(jué)任務(wù)。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-03 09:40 ?572次閱讀

    cnn卷積神經(jīng)網(wǎng)絡(luò)分類(lèi)有哪些

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像分類(lèi)、目標(biāo)檢測(cè)、語(yǔ)義分割等領(lǐng)域。本文將詳細(xì)介紹CNN在分類(lèi)任務(wù)中的應(yīng)用,包括基本結(jié)構(gòu)、關(guān)鍵技術(shù)、常見(jiàn)網(wǎng)絡(luò)架構(gòu)以及實(shí)際應(yīng)用案例。
    的頭像 發(fā)表于 07-03 09:28 ?783次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理與實(shí)現(xiàn)

    1.卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、視頻分析、自然語(yǔ)言處理等領(lǐng)域。 卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),其
    的頭像 發(fā)表于 07-02 16:47 ?744次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及其功能

    。 引言 深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它通過(guò)模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能,實(shí)現(xiàn)對(duì)數(shù)據(jù)的自動(dòng)學(xué)習(xí)和特征提取。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中的一種重要模型,它通過(guò)卷積操作和池化操作,有效地提取圖像特征,
    的頭像 發(fā)表于 07-02 14:45 ?2592次閱讀