欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FAIR何愷明團(tuán)隊(duì)最新論文提出“全景FPN”,聚焦于圖像的全景分割任務(wù)

DPVg_AI_era ? 來源:lq ? 2019-01-11 08:57 ? 次閱讀

FAIR何愷明團(tuán)隊(duì)最新論文提出“全景FPN”,聚焦于圖像的全景分割任務(wù),將分別用于語義分割和實(shí)例分割的FCN和Mask R-CNN結(jié)合起來,設(shè)計(jì)了Panoptic FPN。該方法可能成為全景分割研究的強(qiáng)大基線。

Facebook人工智能實(shí)驗(yàn)室(FAIR)何愷明等人團(tuán)隊(duì)在arXiv發(fā)布最新論文:Panoptic Feature Pyramid Networks。

論文聚焦于“全景分割”,在架構(gòu)級別將分別用于語義分割和實(shí)例分割的FCN和Mask R-CNN結(jié)合起來,設(shè)計(jì)了一個單一的網(wǎng)絡(luò):Panoptic FPN。

作者表示,實(shí)驗(yàn)證明Panoptic FPN對語義分割和實(shí)例分割這兩個任務(wù)都有效,同時(shí)兼具穩(wěn)健性和準(zhǔn)確性。鑒于其有效性和概念的簡單性,該方法有望成為一個強(qiáng)大的baseline,成為全景分割后續(xù)進(jìn)展的基礎(chǔ)。

雖然在概念上很簡單,但設(shè)計(jì)一個在這兩個任務(wù)都能實(shí)現(xiàn)高精度的單一網(wǎng)絡(luò)是具有挑戰(zhàn)性的,因?yàn)檫@兩個任務(wù)的最佳性能方法存在許多差異。

Panoptic FPN在COCO和Cityscapes上的結(jié)果

對于語義分割,通過擴(kuò)張卷積(dilated convolutions)增強(qiáng)的FCN是最優(yōu)的。對于實(shí)例分割,具有特征金字塔(FPN)骨架的region-based Mask R-CNN在最近的圖像識別競賽中被用作所有高分網(wǎng)絡(luò)的基礎(chǔ)。

考慮到這些方法在架構(gòu)上的差異,在為這兩個任務(wù)設(shè)計(jì)單個網(wǎng)絡(luò)時(shí),可能需要在實(shí)例分割或語義分割上犧牲準(zhǔn)確性。但是,F(xiàn)AIR團(tuán)隊(duì)提出一種簡單、靈活且有效的架構(gòu),可以使用一個同時(shí)生成region-based輸出(實(shí)例分割)和dense-pixel輸出(語義分割)的單一網(wǎng)絡(luò)來保證這兩個任務(wù)的準(zhǔn)確性。

在對每個任務(wù)單獨(dú)進(jìn)行訓(xùn)練時(shí),該方法在COCO和Cityscapes上的實(shí)例分割和語義分割都取得了很好的效果。實(shí)例分割接近Mask R-CNN,語義分割的精度與最新的DeepLabV3+相當(dāng)。

接下來,我們將具體介紹Panoptic FPN的架構(gòu)和實(shí)驗(yàn)結(jié)果。

全景特征金字塔網(wǎng)絡(luò)Panoptic FPN

Panoptic FPN是一個簡單的、單網(wǎng)絡(luò)的baseline,它的目標(biāo)是在實(shí)例分割和語義分割以及它們的聯(lián)合任務(wù):全景分割上實(shí)現(xiàn)最高性能。

設(shè)計(jì)原則是:從具有FPN的Mask R-CNN開始,進(jìn)行最小的修改,生成一個語義分割的dense-pixel 輸出(如圖1所示)。

模型架構(gòu)

圖1:Panoptic FPN的架構(gòu)

(a)特征金字塔網(wǎng)絡(luò) (b)實(shí)例分割分支 (c)語義分割分支

特征金字塔網(wǎng)絡(luò)(Feature Pyramid Network):首先簡要回顧一下FPN。FPN采用一個具有多空間分辨率特征的標(biāo)準(zhǔn)網(wǎng)絡(luò)(如ResNet),并添加一個具有橫向連接的自上而下的通道,如圖1a所示。自上而下的路徑從網(wǎng)絡(luò)的最深層開始,并逐步向上采樣,同時(shí)添加自底向上路徑的高分辨率特性的轉(zhuǎn)換版本。FPN生成一個金字塔,通常具有1/32到1/4的分辨率,其中每個金字塔級別具有相同的通道維度(默認(rèn)是256)。

實(shí)例分割分支:FPN的設(shè)計(jì),特別是對所有金字塔級別使用相同的通道維數(shù),使得附加基于區(qū)域的對象檢測器變得很容易,比如Faster R-CNN。 為了輸出實(shí)例分段,我們使用Mask R-CNN,它通過添加FCN分支來預(yù)測每個候選區(qū)域的二進(jìn)制分段Mask,從而擴(kuò)展Faster R-CNN,見圖1b。

用于增加特征分辨率的骨架架構(gòu)

Panoptic FPN:如前所述,我們的方法是使用FPN對Mask R-CNN進(jìn)行修改,實(shí)現(xiàn)像素級語義分割預(yù)測。然而,為了實(shí)現(xiàn)準(zhǔn)確的預(yù)測,該任務(wù)所使用的特性應(yīng)該:

(1)具有適當(dāng)?shù)母叻直媛剩圆东@精細(xì)的結(jié)構(gòu);

(2)編碼足夠豐富的語義,以準(zhǔn)確地預(yù)測類標(biāo)簽;

(3)雖然FPN是為目標(biāo)檢測而設(shè)計(jì)的,但是這些要求——高分辨率、豐富的、多尺度的特征——正好是FPN的特征。

因此,我們建議在FPN上附加一個簡單而快速的語義分割分支。

圖3:語義分割分支

實(shí)驗(yàn)和結(jié)果

我們的目標(biāo)是證明我們的方法,Panoptic FPN,可以作為一個簡單有效的單網(wǎng)絡(luò)baseline,用于實(shí)例分割、語義分割,以及他們的聯(lián)合任務(wù)全景分割。

因此,我們從測試語義分割方法(我們將這個單任務(wù)變體稱為Semantic FPN)開始分析。令人驚訝的是,這個簡單的模型在COCO和Cityscapes數(shù)據(jù)集上實(shí)現(xiàn)了具有競爭力的語義分割結(jié)果。

接下來,我們分析了語義分割分支與Mask R-CNN的集成,以及聯(lián)合訓(xùn)練的效果。最后,我們再次在COCO和Cityscapes數(shù)據(jù)集上展示了全景分割的結(jié)果。定性結(jié)果如表2和表6所示。

語義分割FPN

表1:語義分割FPN的結(jié)果

Cityscapes數(shù)據(jù)集:

我們首先將基線Semantic FPN與表1a中Cityscapes數(shù)據(jù)集上語義分割的現(xiàn)有方法進(jìn)行比較。我們的方法是FPN的一個最小擴(kuò)展,與DeepLabV3+[12]等經(jīng)過大量工程設(shè)計(jì)的系統(tǒng)相比,我們的方法能夠獲得強(qiáng)大的結(jié)果。

在我們的基線中,我們故意避免正交的架構(gòu)改進(jìn),如Non-local或SE,這可能會產(chǎn)生進(jìn)一步的收益。在計(jì)算和內(nèi)存方面,Semantic FPN比典型的dilation model更輕量,同時(shí)能產(chǎn)生更高的分辨率特征(見圖4)。

圖4

COCO數(shù)據(jù)集:

我們的方法的一個早期版本贏得了2017年的COCO-Stuff 挑戰(zhàn)。結(jié)果見表1b。

多任務(wù)訓(xùn)練

我們的方法在單任務(wù)上表現(xiàn)非常好;對于語義分割,上一節(jié)的結(jié)果證明了這一點(diǎn);對于實(shí)例分割,這是已知的,因?yàn)樵摲椒ɑ贛ask R-CNN。但是,我們是否可以在多任務(wù)環(huán)境中共同訓(xùn)練這兩項(xiàng)任務(wù)呢?

為了將我們的語義分割分支與Mask R-CNN中的實(shí)例分割分支結(jié)合起來,我們需要確定如何訓(xùn)練一個單一的、統(tǒng)一的網(wǎng)絡(luò)。以往的研究表明,多任務(wù)訓(xùn)練往往具有挑戰(zhàn)性,并可能導(dǎo)致結(jié)果精度下降。我們同樣觀察到,對于語義或?qū)嵗指睿砑虞o助任務(wù)與單任務(wù)基線相比會降低準(zhǔn)確性。

表2:多任務(wù)訓(xùn)練

表2中,ResNet-50-FPN的結(jié)果表明,使用一個簡單的語義分割損失λs,或?qū)嵗指顡p失λi,結(jié)果可以改善單任務(wù)baseline的結(jié)果。具體來說,適當(dāng)?shù)靥砑右粋€語義分割分支λs能改進(jìn)實(shí)例分割,反之亦然。這可以用來改進(jìn)單任務(wù)結(jié)果。然而,我們的主要目標(biāo)是同時(shí)解決這兩個任務(wù),這將在下一節(jié)討論。

Panoptic FPN

測試Panoptic FPN對于全景分割的聯(lián)合任務(wù)的結(jié)果,其中網(wǎng)絡(luò)必須聯(lián)合并準(zhǔn)確的輸出 stuff和thing分割。

表3:Panoptic FPN的結(jié)果

主要結(jié)果:在表3a中,我們比較了使用相同骨架的Panoptic FPN分別訓(xùn)練的兩個網(wǎng)絡(luò)。Panoptic FPN具有相當(dāng)?shù)男阅?,但只需要一半的?jì)算量。

我們還通過比較兩個單獨(dú)的網(wǎng)絡(luò),分別是Panoptic R101-FPN 和 R50-FPN×2,來平衡計(jì)算預(yù)算,見表3b。使用大致相等的計(jì)算預(yù)算,Panoptic FPN明顯優(yōu)于兩個獨(dú)立的網(wǎng)絡(luò)。

綜上所述,這些結(jié)果表明聯(lián)合方法是有益的,我們提出的Panoptic FPN方法可以作為聯(lián)合任務(wù)的可靠baseline。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像識別
    +關(guān)注

    關(guān)注

    9

    文章

    521

    瀏覽量

    38398
  • 分割
    +關(guān)注

    關(guān)注

    0

    文章

    17

    瀏覽量

    11922

原文標(biāo)題:何愷明組又出神作!最新論文提出全景分割新方法

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    labview全景圖像拼接

    本人是個小白一直在求labview的兩張或多張圖片拼接,就像相機(jī)全景一樣,但是一直都找不到。網(wǎng)上只有一個垂直的拼接,但是我想要個橫向的拼接。不過我又找到了一個圖像旋轉(zhuǎn)的程序。我想兩個結(jié)合在一起應(yīng)該
    發(fā)表于 03-08 09:45

    全景監(jiān)控?cái)z像機(jī)四大特性

    從產(chǎn)品技術(shù)面剖析全景攝像機(jī),則主要有四大關(guān)鍵點(diǎn)。1、鏡頭優(yōu)劣會大幅度影響監(jiān)控圖像的質(zhì)量;好的鏡頭可達(dá)到高清、百萬像素以上,而幀速(每秒鐘動畫傳輸?shù)乃俣?越高,也越能看清楚監(jiān)控目標(biāo)的移動過程與細(xì)節(jié)動作
    發(fā)表于 10-11 17:22

    高速球的完美結(jié)合 魚眼全景的發(fā)展方向

    全景攝像機(jī)是對現(xiàn)有監(jiān)控系統(tǒng)的改造與升級。在魚眼全景監(jiān)控系統(tǒng)中,只需要一臺魚眼全景攝像機(jī)即可實(shí)現(xiàn)全景無盲區(qū)監(jiān)控,沒有任何的機(jī)械部件,圖像通過
    發(fā)表于 08-07 10:21

    【MiCOKit申請】360度全景泊車系統(tǒng)

    圖像處理單元矯正和拼接后,形成一幅車輛四周的360度全景俯視圖,實(shí)時(shí)傳送到中控臺的顯示設(shè)備上。通過360度全景泊車系統(tǒng),駕駛員坐在車中即可直觀地看到車輛所處的位置以及車輛周圍的障礙物,從容操控車輛泊車入
    發(fā)表于 07-24 11:59

    【OK210申請】汽車全景系統(tǒng)設(shè)計(jì)

    申請理由:希望能設(shè)計(jì)款汽車全景系統(tǒng),能夠?qū)崿F(xiàn)4路以上攝像頭的圖像集合項(xiàng)目描述:系統(tǒng)采用多路攝像頭構(gòu)成全景圖像,初步目標(biāo)為采集圖像并在屏幕上分區(qū)顯示,在此基礎(chǔ)上完成
    發(fā)表于 08-01 17:13

    如何在FPGA上實(shí)時(shí)展開全景圖像

    目前,全景技術(shù)的研究主要將注意力集中在集合變換算法和鏡頭矯正算法的改進(jìn),對實(shí)時(shí)性問題研究較少。本系統(tǒng)利用FPGA對圓形極坐標(biāo)圖像進(jìn)行實(shí)時(shí)展開。
    發(fā)表于 08-29 08:20

    基于RK3588的360°全景相機(jī)

    看到成千上萬條由全景相機(jī)拍攝而成的炫酷視頻畫面和圖片?!盁o死角”要比“大廣角”有更多優(yōu)勢,“全景”的加持讓視頻和圖像擁有了更多玩法,賦予更多創(chuàng)作的可能性。?全景相機(jī)有著非常廣泛的應(yīng)用,
    發(fā)表于 12-16 16:45

    基于全景圖像的拼接算法研究

    IBR 技術(shù)不僅可以彌補(bǔ)傳統(tǒng)基于幾何繪制技術(shù)的不足,而且能給出更豐富的圖像顯示。論文從工程實(shí)際應(yīng)用的角度出發(fā),提出并實(shí)現(xiàn)了一種圖像拼接的新方法。該方法即可用于
    發(fā)表于 06-06 13:44 ?11次下載

    基于FPGA的折反射全景圖像查表實(shí)時(shí)展開

    基于FPGA的折反射全景圖像查表實(shí)時(shí)展開
    發(fā)表于 09-22 12:41 ?9次下載

    聚焦語義分割任務(wù),如何用卷積神經(jīng)網(wǎng)絡(luò)處理語義圖像分割?

    CNN架構(gòu)圖像語義分割 圖像分割是根據(jù)圖像內(nèi)容對指定區(qū)域進(jìn)行標(biāo)記的計(jì)算機(jī)視覺任務(wù),簡言之就是「這
    發(fā)表于 09-17 15:21 ?584次閱讀

    FAIR、Ross等人最新提出實(shí)例分割的通用框架TensorMask

    然而,盡管目前性能最好的對象檢測器依賴于滑動窗口預(yù)測來生成初始候選區(qū)域,但獲得更準(zhǔn)確的預(yù)測主要來自對這些候選區(qū)域進(jìn)行細(xì)化的階段,如 Faster R-CNN 和 Mask R-CNN,分別用于邊界框目標(biāo)檢測和實(shí)例分割。這類方法已經(jīng)主導(dǎo)了 COCO 目標(biāo)檢測挑戰(zhàn)賽。
    的頭像 發(fā)表于 04-08 12:00 ?1.2w次閱讀

    Facebook AI使用單一神經(jīng)網(wǎng)絡(luò)架構(gòu)來同時(shí)完成實(shí)例分割和語義分割

    這一新架構(gòu)“全景 FPN ”在 Facebook 2017 年發(fā)布的 Mask R-CNN 的基礎(chǔ)上添加了一個用于語義分割的分支。這一新架構(gòu)可以同時(shí)對圖像進(jìn)行實(shí)例和語義
    的頭像 發(fā)表于 04-22 11:46 ?2941次閱讀
    Facebook AI使用單一神經(jīng)網(wǎng)絡(luò)架構(gòu)來同時(shí)完成實(shí)例<b class='flag-5'>分割</b>和語義<b class='flag-5'>分割</b>

    點(diǎn)云分割相較圖像分割的優(yōu)勢是啥?

    自動駕駛領(lǐng)域的下游任務(wù),我認(rèn)為主要包括目標(biāo)檢測、語義分割、實(shí)例分割全景分割。其中目標(biāo)檢測是指在區(qū)域中提取目標(biāo)的候選框并分類,語義
    的頭像 發(fā)表于 12-14 14:25 ?2834次閱讀

    介紹一種新的全景視覺里程計(jì)框架PVO

    論文提出了PVO,這是一種新的全景視覺里程計(jì)框架,用于實(shí)現(xiàn)場景運(yùn)動、幾何和全景分割信息的更全面建模。
    的頭像 發(fā)表于 05-09 16:51 ?1923次閱讀
    介紹一種新的<b class='flag-5'>全景</b>視覺里程計(jì)框架PVO

    AI算法說-圖像分割

    語義分割是區(qū)分同類物體的分割任務(wù),實(shí)例分割是區(qū)分不同實(shí)例的分割任務(wù),而
    的頭像 發(fā)表于 05-17 14:44 ?1473次閱讀
    AI算法說-<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>