我們這一年來做的一些工作(總結(jié)見文章最下方)現(xiàn)在差不多形成了一個較完善的計算機視覺工具鏈——CVChain。我們這一年來做的一些工作(總結(jié)見文章最下方)現(xiàn)在差不多形成了一個較完善的計算機視覺工具鏈——CVChain。
縱向上它涵蓋了一個計算機視覺任務(wù)的生命周期:數(shù)據(jù)分析與模型選型、模型訓(xùn)練、發(fā)現(xiàn)模型存在的問題并優(yōu)化、模型加速、模型SDK編寫;橫向上它包含了計算機視覺中三個基本任務(wù):分類、語義分割、目標檢測;與此同時它還總結(jié)了計算機視覺入門到進階的學(xué)習(xí)框架。一言以蔽之:有了CVChain,媽媽再也不用擔心我搞不定計算機視覺!
CVChain是我們平常做項目或者打比賽過程中打磨出來的,它們可以滿足計算機視覺算法工程師日常大部分需求,比如:
1.剛踏入計算機視覺領(lǐng)域,不知道從何學(xué)起,需要一張學(xué)習(xí)的地圖:
https://github.com/mileistone/study_resources/blob/master/modeling/learning_framework/learning_framework_general.md
部分示例
帶著自己一步一步領(lǐng)略計算機視覺的風(fēng)采;
2.已經(jīng)成為一名合格的計算機視覺算法工程師,開始接任務(wù)。當任務(wù)來了,需要分析數(shù)據(jù)分析數(shù)據(jù)以進行模型選型、模型超參的初步設(shè)定;
https://github.com/Media-Smart/volkscv/tree/master/volkscv/analyzer/statistics
3.模型確定后,得訓(xùn)練模型(可能涉及到分類、語義分割、文字識別、目標檢測等等),這個時候需要一個趁手的訓(xùn)練工具;
分類:
https://github.com/Media-Smart/vedacls
語義分割
https://github.com/Media-Smart/vedaseg
示例
文字識別
https://github.com/Media-Smart/vedastr
示例
目標檢測
https://github.com/Media-Smart/vedadet
4.模型訓(xùn)練完之后,效果不夠好,我們需要把FP、FN打印出來,分析模型存在的問題;
https://github.com/Media-Smart/volkscv/tree/master/volkscv/analyzer/visualization
5.模型訓(xùn)練好之后,需要將模型轉(zhuǎn)換為應(yīng)用并進行部署,這里需要用TensorRT對模型進行加速,然后根據(jù)業(yè)務(wù)需求編寫Python前端或者C++前端的SDK;
加速
https://github.com/Media-Smart/volksdep
Python前端
https://github.com/Media-Smart/flexinfer
示例
C++前端
https://github.com/Media-Smart/cheetahinfer
6.計算機行業(yè)競爭激烈,平常得抽空加強學(xué)習(xí),無論是工程、模型還是算法方面,都需要持續(xù)不斷學(xué)習(xí),把自己訓(xùn)練為一名六邊形戰(zhàn)士。
工程
https://github.com/mileistone/study_resources/tree/master/engineering
模型
https://github.com/mileistone/study_resources/tree/master/modeling
算法
https://github.com/mileistone/study_resources/tree/master/modeling/optimization_and_generalization
上述的“2、數(shù)據(jù)分析”提供以下功能。
1、瀏覽圖片和標注
比如分類、目標檢測、語義分割等等,這可以幫助我們對數(shù)據(jù)有一個感性的認識,可以定性出來這個任務(wù)有哪些挑戰(zhàn)。
2、圖片和標注分析
比如圖片大小分布,圖片長寬比分布,圖片中GT框數(shù)量分布,GT框長寬分布等等,這可以讓我們對數(shù)據(jù)有一些理性的認識,讓我們可以定量這個任務(wù)存在的挑戰(zhàn)。
3、打印模型預(yù)測結(jié)果中的FP、FN
比如分類。
比如目標檢測。
比如語義分割。
打印FP、FN可以讓我們發(fā)現(xiàn)模型存在的問題,進而有助于我們分析問題、定位問題直至解決問題。
4、anchor分析
比如GT匹配上的anchor數(shù)量分布,GT與匹配上anchor的IoU分布等等。這有助于我們設(shè)計出更好的anchor策略,比如anchor應(yīng)該放在哪幾層,每一層anchor數(shù)量應(yīng)該設(shè)置多少,對應(yīng)的大小和長寬比是多少,以及l(fā)abel assignment該怎么做等等。
匯總
https://github.com/Media-Smart/vedaseg
https://github.com/Media-Smart/vedastr
https://github.com/Media-Smart/vedacls
https://github.com/Media-Smart/vedadet
Media-Smart/volksdep,https://github.com/Media-Smart/volksdep
Media-Smart/flexinfer,https://github.com/Media-Smart/flexinfer
https://github.com/Media-Smart/cheetahinfer
https://github.com/Media-Smart/volkscv
https://github.com/mileistone/study_resources
- 數(shù)據(jù)分析 - [volkscv](https://github.com/Media-Smart/volkscv/tree/master/volkscv/analyzer/) - 數(shù)據(jù)瀏覽 -> 獲取感性認識 - 圖片、標注 - 數(shù)據(jù)統(tǒng)計 -> 獲取理性認識 - 圖片統(tǒng)計 - 大小 - 長寬比 - 等等 - 標注統(tǒng)計 - 類別 - 各個類別有多少實例 - 等等 - GT框 - 大小 - 長寬比 - 等等 - anchor分析 - GT掛上anchor的數(shù)量分布 - GT與掛上anchor的IoU分布- 模型訓(xùn)練 - [vedaseg](https://github.com/Media-Smart/vedaseg) - semantic segmentation - [vedastr](https://github.com/Media-Smart/vedastr) - scene text recognition - [vedacls](https://github.com/Media-Smart/vedacls) - classification - [vedadet](https://github.com/Media-Smart/vedadet) - object detection - 應(yīng)用部署 - [volksdep](https://github.com/Media-Smart/volksdep) - increase efficiency and decrease latency - convert PyTorch,ONNX model to TensorRT engine - [flexinfer](https://github.com/Media-Smart/flexinfer) -> Python front end SDK based on TensorRT engine - classification - semantic segmentation - scene text recognition - object detection - [cheetahinfer](https://github.com/Media-Smart/cheetahinfer) -> C++ front end SDK based on TensorRT engine - classification - semantic segmentation - object detection- 學(xué)習(xí)資源 - [學(xué)習(xí)框架]
(https://github.com/mileistone/study_resources/tree/master/modeling/learning_framework) - 知識點 - 相關(guān)課程與書籍 - 基礎(chǔ) - [工程](https://github.com/mileistone/study_resources/tree/master/engineering) - 編程語言 - Python - C++ - 軟件工程 - 設(shè)計模式 - 操作系統(tǒng) - Linux - Bash - Vim - 編譯工具鏈 - [模型](https://github.com/mileistone/study_resources/tree/master/modeling) - 內(nèi)容 - 機器學(xué)習(xí) - 深度學(xué)習(xí) - 計算機視覺 - 形式 - 課程 - 書籍 - 論文 - [算法](https://github.com/mileistone/study_resources/tree/master/modeling/optimization_and_generalization) - 凸優(yōu)化 - 數(shù)值優(yōu)化
責任編輯:xj
原文標題:CVChain:一條用視覺競賽和項目經(jīng)驗打磨出的計算機視覺完整工具鏈
文章出處:【微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
CV
+關(guān)注
關(guān)注
0文章
53瀏覽量
16911 -
計算機視覺
+關(guān)注
關(guān)注
8文章
1701瀏覽量
46142
原文標題:CVChain:一條用視覺競賽和項目經(jīng)驗打磨出的計算機視覺完整工具鏈
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
計算機視覺有哪些優(yōu)缺點
計算機視覺技術(shù)的AI算法模型
計算機視覺的五大技術(shù)
計算機視覺的工作原理和應(yīng)用
計算機視覺與人工智能的關(guān)系是什么
計算機視覺與智能感知是干嘛的
計算機視覺和機器視覺區(qū)別在哪
計算機視覺和圖像處理的區(qū)別和聯(lián)系
深度學(xué)習(xí)在計算機視覺領(lǐng)域的應(yīng)用
機器視覺與計算機視覺的區(qū)別
計算機視覺的主要研究方向
本源超導(dǎo)量子計算機自主制造鏈11類產(chǎn)品系列之九: 中國自主量子計算編程生態(tài)工具鏈
![本源超導(dǎo)量子<b class='flag-5'>計算機</b>自主制造<b class='flag-5'>鏈</b>11類產(chǎn)品系列之九: 中國自主量子<b class='flag-5'>計算</b>編程生態(tài)<b class='flag-5'>工具</b><b class='flag-5'>鏈</b>](https://file.elecfans.com/web2/M00/3F/9D/poYBAGJo-maAOH8MAAIB_hk2Mno583.png)
評論