好色麻豆精品片在线观看,青青青国产免费手机频在线观看

語義分割

目的：給定一張圖像，我們要對這張圖像上的每個pixel逐一進行分類，結(jié)果展示如下圖：

上圖中的實例分割是語義分割的延伸，要區(qū)別出相同類別的不同個體。

應(yīng)用場景：無人駕駛、輔助醫(yī)療等。

語義分割方法發(fā)展過程：

1.灰度分割(Gray Level Segmentation)

語義分割的最簡單形式是對一個區(qū)域設(shè)定必須滿足的硬編碼規(guī)則或?qū)傩裕M而指定特定類別標(biāo)簽. 編碼規(guī)則可以根據(jù)像素的屬性來構(gòu)建，如灰度級強度(gray level intensity). 基于該技術(shù)的一種分割方法是 Split and Merge 算法. 該算法是通過遞歸地將圖像分割為子區(qū)域，直到可以分配標(biāo)簽；然后再合并具有相同標(biāo)簽的相鄰子區(qū)域。

這種方法的問題是規(guī)則必須是硬編碼的. 而且，僅使用灰度級信息是很難表示比如人類等復(fù)雜類別的. 因此，需要特征提取和優(yōu)化技術(shù)來正確地學(xué)習(xí)復(fù)雜類別的特征表示。

2.條件隨機場(Conditional Random Fields)

CRFs 是一類用于結(jié)構(gòu)化預(yù)測的統(tǒng)計建模方法. 不同于分類算法，CRFs 在進行預(yù)測前，會考慮像素的鄰近信息(neighboring context)，如像素間的關(guān)系. 這使得 CRFs 成為語義分割的理想候選者. 這里介紹下 CRFs 在語義分割中的應(yīng)用.

圖像中的每個像素都是與有限的可能狀態(tài)集相關(guān). 在語義分割中，target 類別標(biāo)簽就是可能狀態(tài)集. 將一個狀態(tài)(或，label u) 分配給的單個像素 x 的成本(cost) 被稱為一元成本(unary cost). 為了對像素間的關(guān)系進行建模，還進一步考慮將一對標(biāo)簽(labels (u, v)) 分配給一對像素 (x, y)，其被成為成對成本(pairwise cost). 可以采用直接相鄰的像素對作為像素對(Grid CRF)；也可以采用圖像中所有的像素構(gòu)建像素對(Denser CRF)。

圖像中所有 unary cost 和 pairwise cost 的相加和作為 CRF 的能量函數(shù)(或損失函數(shù)，loss). 求解最小化即可得到較好的分割輸出。

深度學(xué)習(xí)極大地簡化了語義分割的流程(pipeline)，并得到了較高質(zhì)量的分割結(jié)果

3.FCN

FCN方法的提出成功的將深度學(xué)習(xí)方法成功的引入到了語義分割領(lǐng)域，由于要預(yù)測的圖像是一個二維的表示，因此提出了全卷積網(wǎng)絡(luò)用來抽取圖像中的特征，將得到的高級語義特征上采樣到指定的維度，從而得到了最終的預(yù)測結(jié)果，從而自然的形成了Encoder-Decoder框架，這也成為了語義分割領(lǐng)域中通用框架之一。

具體的模型圖如下：

由于在Encoder中獲取到圖像的高級語義，但是其并不是最終分割的結(jié)果，因此作者采用轉(zhuǎn)置卷積的方法將該高級特征上采樣到指定的維度，從而得到最終的分割結(jié)果。由于直接上采樣之后的結(jié)果并不好，因此在改論文中引入了跳躍模型就是將不同卷積層下獲取到的特征相融合，從而改善模型的效果，其具體結(jié)構(gòu)如下所示：

4.U-NET, SegNet 等

為了改善FCN中的弊端，隨后提出了很多模型最經(jīng)典的是U-Net，SegNet，但是他們的本質(zhì)上并沒有改變Encoder-Decoder模型的架構(gòu)。

5.DeepLab系列

DeepLab的出現(xiàn)帶來了一個新的方法就是擴展卷積（空洞卷積）方法，卷積層引入了一個稱為 “擴張率(dilation rate)”的新參數(shù)，該參數(shù)定義了卷積核處理數(shù)據(jù)時各值的間距。其目的是為了擴大模型的感受野，使其能夠感受到更大范圍下的特征信息。具體的體現(xiàn)如下所示：

擴展卷積方法的提出讓人們可以去除Encoder-Decoder框架的限制。隨后deeplab算法的改進也提出了例如多尺度學(xué)習(xí)的通則紅描述方法（ASPP等）

6.NOW

面對監(jiān)督式方法---最近的方法大家更注重于實時的語義分割任務(wù)，也就是輕量級的語義分割網(wǎng)絡(luò)的設(shè)計。當(dāng)然還有一些其他的方法，例如針對不同的領(lǐng)域設(shè)計不同的語義分割網(wǎng)絡(luò)、改進上采樣方法等。

面對弱監(jiān)督方法---目前出現(xiàn)了很多弱監(jiān)督方法，就是通過學(xué)習(xí)圖像分類的數(shù)據(jù)集（image-level tag）中的信息，來完成語義分割這種密度預(yù)測的任務(wù)。當(dāng)然還有使用框架注釋來標(biāo)注數(shù)據(jù)(bounding-boxes tag)的。

語義分割領(lǐng)域中困難的地方：

1、數(shù)據(jù)問題：分割不像檢測等任務(wù)，只需要標(biāo)注一個類別就可以拿來使用，分割需要精確的像素級標(biāo)注，包括每一個目標(biāo)的輪廓等信息，因此使得制作數(shù)據(jù)集成本過高；

2、計算資源問題：現(xiàn)在想要得到較高的精度的語義分割模型就需要使用類似于ResNet101等深網(wǎng)絡(luò)。同時，分割預(yù)測了每一個像素，這就要求feature map的分辨率盡可能的高，這都說明了計算資源的問題，雖然也有一些輕量級的網(wǎng)絡(luò)，但精度還是太低了；

3、精細分割：目前的方法中對于圖像中的大體積的東西能夠很好的分類，但是對于細小的類別，由于其輪廓太小，從而無法精確的定位輪廓，造成精度較低；

4、上下文信息：分割中上下文信息很重要，否則會造成一個目標(biāo)被分成多個part，或者不同類別目標(biāo)分類成相同類別；

評價指標(biāo)：

1、執(zhí)行時間：速度或運行時間是一個非常有價值的度量，因為大多數(shù)系統(tǒng)需要保證推理時間可以滿足硬實時的需求。然而在通常的實驗中其影響是很不明顯的，并且該指標(biāo)非常依賴硬件設(shè)備及后臺實現(xiàn)，致使一些比較是無用的。

2、內(nèi)存占用：在運行時間相同的情況下，記錄系統(tǒng)運行狀態(tài)下內(nèi)存占用的極值和均值是及其有價值的。

3、精確度：這里指的是逐像素標(biāo)記的精度測量，假設(shè)共有k個類（從l0到lk其中有一個類別是屬于背景的。），Pij表示本屬于i類但是被預(yù)測為j類的像素個數(shù)，Pii表示為真正分對類的數(shù)量，而Pij與Pji分別被稱為假正樣本和假負(fù)樣本。

1）Pixel Accuracy（PA，像素精度）：標(biāo)記正確的像素占總像素的比例

2）Mean Pixel Accuracy(MPA，平均像素精度)：計算每個類內(nèi)被正確分類像素數(shù)比例，之后求所有類的平均數(shù)。

3）Mean Intersection over Union(MIoU，均交并比)：為語義分割的標(biāo)準(zhǔn)度量，其計算兩個集合的交集和并集之比，這兩個集合分別為ground truth 與predicted segmentation,在每個類上計算IoU，之后將其求平均。

-----IoU即真正樣本數(shù)量/（真正樣本數(shù)量+假正樣本數(shù)量+假負(fù)樣本數(shù)量）

4）Frequency weighted Intersection over Union(FWIoU,頻權(quán)交并)：是MIoU的一種提升，這種方法根據(jù)每個類出現(xiàn)的頻率為期設(shè)置權(quán)重。

責(zé)任編輯：lq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

圖像

圖像

+關(guān)注

關(guān)注
2

文章
1089

瀏覽量
40586
函數(shù)

函數(shù)

+關(guān)注

關(guān)注
3

文章
4346

瀏覽量
63006
分割

分割

+關(guān)注

關(guān)注
0

文章
17

瀏覽量
11922

原文標(biāo)題：語義分割入門的總結(jié)

文章出處：【微信號：vision263com，微信公眾號：新機器視覺】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

SparseViT：以非語義為中心、參數(shù)高效的稀疏化視覺Transformer

（IML）都遵循“語義分割主干網(wǎng)絡(luò)”與“精心制作的手工制作非語義特征提取”相結(jié)合的設(shè)計，這種方法嚴(yán)重限制了模型在未知場景的偽影提取能力。論文標(biāo)題： Can We Get Rid

發(fā)表于 01-15 09:30 ?121次閱讀

SparseViT：以非<b class='flag-5'>語義</b>為中心、參數(shù)高效的稀疏化視覺Transformer

【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎(chǔ)模塊

目前高速發(fā)展的大模型能給具身智能帶來一些突破性的進展。對于感知系統(tǒng)，要做的主要任務(wù)是物體檢測，語義分割，立體視覺，鳥瞰視角感知。有很多算法都可以實現(xiàn)物體檢測，比如文章提到的HOG + SVM算法

發(fā)表于 01-04 19:22

利用VLM和MLLMs實現(xiàn)SLAM語義增強

語義同步定位與建圖（SLAM）系統(tǒng)在對鄰近的語義相似物體進行建圖時面臨困境，特別是在復(fù)雜的室內(nèi)環(huán)境中。本文提出了一種面向?qū)ο骃LAM的語義增強（SEO-SLAM）的新型SLAM系統(tǒng)，借助視覺語言模型

發(fā)表于 12-05 10:00 ?305次閱讀

利用VLM和MLLMs實現(xiàn)SLAM<b class='flag-5'>語義</b>增強

語義分割25種損失函數(shù)綜述和展望

語義圖像分割，即將圖像中的每個像素分類到特定的類別中，是許多視覺理解系統(tǒng)中的重要組成部分。作為評估統(tǒng)計模型性能的主要標(biāo)準(zhǔn)，損失函數(shù)對于塑造基于深度學(xué)習(xí)的分割算法的發(fā)

發(fā)表于 10-22 08:04 ?825次閱讀

<b class='flag-5'>語義</b><b class='flag-5'>分割</b>25種損失函數(shù)綜述和展望

畫面分割器怎么調(diào)試

畫面分割器，通常指的是視頻畫面分割器，它是一種可以將一個視頻信號分割成多個小畫面的設(shè)備。這種設(shè)備廣泛應(yīng)用于監(jiān)控系統(tǒng)、視頻會議、多畫面顯示等場景。調(diào)試畫面分割器是一個技術(shù)性很強的工作，需

發(fā)表于 10-17 09:32 ?541次閱讀

圖像語義分割的實用性是什么

圖像語義分割是一種重要的計算機視覺任務(wù)，它旨在將圖像中的每個像素分配到相應(yīng)的語義類別中。這項技術(shù)在許多領(lǐng)域都有廣泛的應(yīng)用，如自動駕駛、醫(yī)學(xué)圖像分析、機器人導(dǎo)航等。一、圖像語義

發(fā)表于 07-17 09:56 ?545次閱讀

圖像分割和語義分割的區(qū)別與聯(lián)系

圖像分割和語義分割是計算機視覺領(lǐng)域中兩個重要的概念，它們在圖像處理和分析中發(fā)揮著關(guān)鍵作用。 1. 圖像分割簡介圖像分割是將圖像劃分為多個區(qū)

發(fā)表于 07-17 09:55 ?1199次閱讀

圖像分割與目標(biāo)檢測的區(qū)別是什么

圖像分割與目標(biāo)檢測是計算機視覺領(lǐng)域的兩個重要任務(wù)，它們在許多應(yīng)用場景中都發(fā)揮著關(guān)鍵作用。然而，盡管它們在某些方面有相似之處，但它們的目標(biāo)、方法和應(yīng)用場景有很大的不同。本文將介紹圖像分割與目標(biāo)檢測

發(fā)表于 07-17 09:53 ?1561次閱讀

機器學(xué)習(xí)中的數(shù)據(jù)分割方法

在機器學(xué)習(xí)中，數(shù)據(jù)分割是一項至關(guān)重要的任務(wù)，它直接影響到模型的訓(xùn)練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學(xué)習(xí)中數(shù)據(jù)分割的方法，包括常見的分割

發(fā)表于 07-10 16:10 ?2161次閱讀

圖像分割與語義分割中的CNN模型綜述

圖像分割與語義分割是計算機視覺領(lǐng)域的重要任務(wù)，旨在將圖像劃分為多個具有特定語義含義的區(qū)域或?qū)ο?。卷積神經(jīng)網(wǎng)絡(luò)（CNN）作為深度學(xué)習(xí)的一種核心模型，在圖像

發(fā)表于 07-09 11:51 ?1197次閱讀

機器人視覺技術(shù)中常見的圖像分割方法

機器人視覺技術(shù)中的圖像分割方法是一個廣泛且深入的研究領(lǐng)域。圖像分割是將圖像劃分為多個區(qū)域或?qū)ο蟮?b class='flag-5'>過程，這些區(qū)域或?qū)ο缶哂心撤N共同的特征，如顏色、紋理、形狀等。在機器人視覺中，圖像

發(fā)表于 07-09 09:31 ?904次閱讀

人工智能的定義和發(fā)展過程

人工智能（Artificial Intelligence，簡稱AI）是計算機科學(xué)的一個分支，旨在通過計算機程序或機器來模擬、實現(xiàn)人類智能的技術(shù)和方法。它使計算機能夠具備感知、理解、判斷、推理、學(xué)習(xí)

發(fā)表于 07-04 14:05 ?1498次閱讀

機器人視覺技術(shù)中圖像分割方法有哪些

和分析。本文將詳細介紹圖像分割的各種方法，包括傳統(tǒng)的圖像處理方法和基于深度學(xué)習(xí)的方法。閾值分割法閾值

發(fā)表于 07-04 11:34 ?1172次閱讀

陶瓷電熔爐啟動過程中升溫停止問題的原因及解決辦法分析

放射性廢物的處置問題一直是核工業(yè)發(fā)展過程中不可忽視的關(guān)鍵環(huán)節(jié)。核燃料后處理循環(huán)過程中產(chǎn)生的高放廢液的安全處置是放射性廢物處理的關(guān)鍵，國際上比較成熟的高放廢液處理方法是玻璃固化[1]。

發(fā)表于 03-12 16:43 ?614次閱讀

助力移動機器人下游任務(wù)！Mobile-Seed用于聯(lián)合語義分割和邊界檢測

精確、快速地劃定清晰的邊界和魯棒的語義對于許多下游機器人任務(wù)至關(guān)重要，例如機器人抓取和操作、實時語義建圖以及在邊緣計算單元上執(zhí)行的在線傳感器校準(zhǔn)。

發(fā)表于 02-20 10:30 ?1015次閱讀

欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

搜索歷史

語義分割方法發(fā)展過程

評論