自從去年TensorFlow Object Detection API發(fā)布以來,谷歌團隊不斷擴充其性能,除了通過神經(jīng)架構(gòu)搜索和實例分割來提高模型的學(xué)習(xí)能力,還用如Open Images 等不斷出現(xiàn)的新數(shù)據(jù)集來訓(xùn)練模型。它在世界范圍內(nèi)被用于各種各樣的任務(wù)中,從城市街頭中的異常行為檢測,到茂密叢林里的植物識別都有著它的身影。
近日,為了不斷擴充和壯大這一API的能力,谷歌又為目標檢測API進行了升級,最新的能力包括以下幾個方面:
支持通過谷歌云TPUs來對模型訓(xùn)練進行加速;
通過加速推理和基于TF-Lite格式的模型導(dǎo)出來提升移動端的部署能力;
加入了很多新的架構(gòu),包括:
RetinaNet;
MobileNet版本的RetinaNet;
新型的SSD架構(gòu)PoolingPyramidNetwork,縮小了三倍的大小。
同時還給出了每一個模型在coco數(shù)據(jù)集上的預(yù)訓(xùn)練權(quán)重供用戶使用。
通過云TPUs加速訓(xùn)練
用戶常常需要在大量的時間去調(diào)節(jié)一個模型的超參數(shù),如果可以大幅節(jié)省訓(xùn)練時間將十分有意義。所以這次推出的基于SSD架構(gòu)的模型都針對TPUs進行了優(yōu)化設(shè)計,利用強大的云服務(wù)你可以很快的訓(xùn)練出符合要求的網(wǎng)絡(luò)。舉個例子,希望將基于ResNet-50的RetinaNet在coco數(shù)據(jù)集上訓(xùn)練到35%mAP,通過TPUs云服務(wù)只需要不到3個半小時就夠了。
通過量化和TF-Lite加速推理
為了更好的支持移動和嵌入式設(shè)備中低延時的需求,其中的模型提供了對于Tensorflow-lite的原生支持,這使得設(shè)備端的機器學(xué)習(xí)模型可以以更小的容量和更低的延時實現(xiàn)良好的表現(xiàn)。除此之外,新API還加入了模型量化以及對于檢測的原生操作。其中模型量化基于Jacob的論文和Krishnamoorthi的白皮書實現(xiàn)。
為了在有限大小下保證性能,工程師們不僅量化了權(quán)重,同時對激活也進行了量化,實現(xiàn)了速度(大小)和精度的平衡。下圖展現(xiàn)了優(yōu)化后的模型在Pixel2的CPU上所測量得到的延時、模型大小和mAP值??梢园l(fā)現(xiàn),模型得到了大幅壓縮,速度幾乎提升了一倍(>15fps),而精度只有略微下降。
如果你想上手試試的話,Tensorflow團隊提供了一個詳細的教程。
https://medium.com/tensorflow/training-and-serving-a-realtime-mobile-object-detector-in-30-minutes-with-cloud-tpus-b78971cf1193
通過訓(xùn)練你甚至可以做出一個檢測家里小貓小狗的app安裝在自己手機上和朋友們分享。你可以通過colab來完成訓(xùn)練,或者也可以用為開發(fā)者提供的docker來完成開發(fā)。
通過手把手的教程你就可以做出一個很有趣的app,最終訓(xùn)練完成就會看到你的好伙伴被檢測出來啦:
下面是在訓(xùn)練過程中的主要步驟:
環(huán)境搭建(安轉(zhuǎn)相應(yīng)的庫和依賴文件,可以使用dockerfile完成一鍵安裝)
云配置(配置TPUs、存儲服務(wù),基于gcloud和gsutil)
安裝Tensorflow + Object Detection
配置數(shù)據(jù)庫(轉(zhuǎn)換為TFRecoard來加速數(shù)據(jù)IO)并上傳存儲
使用checkpoint來進行遷移學(xué)習(xí)加速訓(xùn)練
在云端訓(xùn)練量化模型
導(dǎo)出模型、在移動端上部署并運行。
TensorFlow團隊希望通過更高效的API將高水平的視覺模型帶給更多希望解決檢測問題的人使用,并為用戶提供從模型訓(xùn)練到移動端部署的順滑體驗。
-
谷歌
+關(guān)注
關(guān)注
27文章
6203瀏覽量
106078 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1209瀏覽量
24848 -
tensorflow
+關(guān)注
關(guān)注
13文章
329瀏覽量
60637
原文標題:TensorFlow 物體檢測API全面升級,快來解鎖新姿勢
文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
來看看CTPS700主要在哪些方面進行了改善
對結(jié)構(gòu)體成員進行了賦值
軟件設(shè)計工具Radiant 2.0 中提供的新功能升級包括哪些方面?
基于視頻圖像的目標檢測技術(shù)研究
智慧城市包括哪些方面(智慧城市領(lǐng)域與內(nèi)容詳解)
蘋果新一代MacBook Air即將發(fā)布,整體進行了兩方面的升級
百度Apollo進行了組織架構(gòu)升級 加快實現(xiàn)自動駕駛的落地
華為Mate40 Pro在哪些方面進行了升級?
相比iPhone 11,蘋果在iPhone 12在哪些方面進行了升級?
智能制造包括哪些方面
光纜維護包括哪些方面
鴻蒙開發(fā)接口公共事件與通知:【FFI能力(Node-API)】
![鴻蒙開發(fā)接口公共事件與通知:【FFI<b class='flag-5'>能力</b>(Node-<b class='flag-5'>API</b>)】](https://file1.elecfans.com/web2/M00/E8/90/wKgaomZMXoqANzvuAAA6UGbDgbQ272.png)
目標檢測識別主要應(yīng)用于哪些方面
人員定位系統(tǒng)技術(shù)原理包括哪些方面?一篇弄懂
![人員定位系統(tǒng)技術(shù)原理<b class='flag-5'>包括</b><b class='flag-5'>哪些方面</b>?一篇弄懂](https://file1.elecfans.com/web2/M00/FB/52/wKgZomaQn7mAOOuJAAQYgzAYhPE783.png)
評論