當(dāng)?shù)貢r間4月3日,谷歌推出了一款新的移動框架MobileNetV2,基于上一代MobileNet,這款模型能顯著提高多種計(jì)算機(jī)視覺任務(wù)。
去年我們推出了MobileNetV1,這是一款為移動設(shè)備而設(shè)計(jì)的通用計(jì)算機(jī)視覺神經(jīng)網(wǎng)絡(luò)模型,它有分類、檢測等功能。這種可以在個人移動設(shè)備上運(yùn)行深度網(wǎng)絡(luò)的能力極大地提升了用戶體驗(yàn),不僅能隨時隨地訪問,還非常安全、私密、省電。隨著新應(yīng)用的出現(xiàn),用戶可以與現(xiàn)實(shí)世界進(jìn)行實(shí)時交互,同樣對更高效的深度網(wǎng)絡(luò)也有更多的需求。
今天,我們很高興宣布MobileNetV2已經(jīng)可以支持下一代移動視覺應(yīng)用。MobileNetV2在MobileNetV1上做出了重大改進(jìn),并推動了目前移動設(shè)備的視覺識別技術(shù)的發(fā)展,包括圖像分類、檢測和語義分割。MobileNetV2作為TensorFlow-Slim圖像分類庫的一部分發(fā)布,或者您可以在Colaboratory中探索MobileNetV2。另外,您還可以利用Jupyter下載筆記本并進(jìn)行使用。MobileNetV2也可以作為TF-Hub上的模塊使用,預(yù)訓(xùn)練的檢查點(diǎn)可以在GitHub上找到。
MobileNetV2的創(chuàng)建基于MobileNetV1的思想,使用深度可分離卷積作為高效的構(gòu)建模塊。然而,V2在架構(gòu)中引入了兩種新特征:
圖層間的線性瓶頸層
瓶頸層之間的快捷連接
基本結(jié)構(gòu)如圖所示:
可以看到,瓶頸對模型的中間輸入和輸出進(jìn)行編碼,而內(nèi)層包括了模型能將低級概念(如像素)轉(zhuǎn)換為高級描述符(如圖像類別)的能力。最后,剩余的連接和傳統(tǒng)一樣,快速連接可實(shí)現(xiàn)更快的訓(xùn)練速度和更高的準(zhǔn)確性。具體細(xì)節(jié)可以查看論文:MobileNetV2:Inverted Residuals and Linear Bottlenecks:https://arxiv.org/abs/1801.04381。
它與第一代MobileNets相比如何?
總體而言,在整個延遲頻譜中,MobileNetV2模型在相同精度下的速度更快。特別的是,新模型所用的操作次數(shù)減少了2次,參數(shù)減少了30%,在谷歌pixel手機(jī)上的速度比V1快了30%~40%,同時達(dá)到了更高的準(zhǔn)確性。
MobileNetV2在目標(biāo)物體檢測和分割時是一個非常高效的特征提取器。例如,當(dāng)與新發(fā)布的SSDLite合作進(jìn)行物體檢測時,新模型在做到與V1同樣準(zhǔn)確的情況下,速度快了35%。我們已經(jīng)在TensorFlow目標(biāo)物體檢測API中開源了此模型。
為支持移動設(shè)備的語義分割,我們將MobileNetV2當(dāng)做特征提取器安裝在簡化版的DeepLabv3上。在語義分割的基準(zhǔn)PASCAL VOC 2012中,我們的結(jié)果與將V1作為特征提取器實(shí)現(xiàn)了相似的性能,但是參數(shù)少了5.3倍,在乘加運(yùn)算上操作次數(shù)減少了5.2倍。
由此可見,MobileNetV2作為許多視覺識別任務(wù)的基礎(chǔ),是移動設(shè)備上高效的模型。我們希望與學(xué)術(shù)界和開源社區(qū)共享,以此幫助更多人的研究和應(yīng)用發(fā)展。
-
谷歌
+關(guān)注
關(guān)注
27文章
6203瀏覽量
106094 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1701瀏覽量
46148
原文標(biāo)題:谷歌推出MobileNetV2,為下一代移動設(shè)備CV網(wǎng)絡(luò)而生
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)
計(jì)算機(jī)視覺技術(shù)的AI算法模型
機(jī)器視覺和計(jì)算機(jī)視覺有什么區(qū)別
計(jì)算機(jī)視覺的五大技術(shù)
計(jì)算機(jī)視覺的工作原理和應(yīng)用
機(jī)器人視覺與計(jì)算機(jī)視覺的區(qū)別與聯(lián)系
計(jì)算機(jī)視覺與人工智能的關(guān)系是什么
計(jì)算機(jī)視覺與智能感知是干嘛的
計(jì)算機(jī)視覺和機(jī)器視覺區(qū)別在哪
計(jì)算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系
計(jì)算機(jī)視覺屬于人工智能嗎
深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用
機(jī)器視覺與計(jì)算機(jī)視覺的區(qū)別
計(jì)算機(jī)視覺的主要研究方向
計(jì)算機(jī)視覺的十大算法
![<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的十大算法](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
評論