噜噜噜久久久一二三四区,少妇成人影片无码免费

本期講解便是基于 Tengine 實(shí)現(xiàn) yolov4的 cpu推理。

完成動(dòng)機(jī)：

主要是為了熟悉tengine的推理部署流程

一、模型轉(zhuǎn)換

采用下面鏈接中yolov4的模型權(quán)重和配置文件

https://github.com/ultralytics/yolov3github.com

源模型使用的是darknet格式，因?yàn)閥olov4新增了mish算子，所以需要增加對(duì)應(yīng)算子的序列化代碼才能正常轉(zhuǎn)換，下面是我的代碼改動(dòng)，基本按照tanh算子進(jìn)行相應(yīng)增加。

https://github.com/zjd1988/Tengine-Convert-Toolsgithub.com

convert tools增加算子的詳細(xì)流程，參考官方增加自定義算子步驟：

（1）在operator/include/operator目錄下增加mish.hpp 和mish/_param.hpp/_文件，/_由于mish算子不需要額外的參數(shù)配置，因此mish/_para.hpp并沒有添加。mish.hpp內(nèi)容可以參考其他類似沒有參數(shù)配置的算子（比如tanh）,在operator/operator 目錄下增加mish.cpp，增加算子實(shí)現(xiàn)代碼；

（2）在operator/operator目錄下增加mish算子內(nèi)存分配的代碼，因?yàn)閙ish算子不涉及這部分修改，并未做任何修改

（3）在operator/operator/plugin/init.cpp文件中的operator/_plugin/_init函數(shù)中增加算子的注冊(cè)函數(shù)調(diào)用

（4）增加mish算子序列化和解析代碼

（4-1）在serializer/include/tengine/v2/tm2/_format.h中增加mish的類型宏定義和字符串宏定義；
（4-2）在serializer/tengine/v2/tm2/_op/_load.cpp文件中增加LoadTmMishOp函數(shù)實(shí)現(xiàn)，同時(shí)在LoadTmOpFunc函數(shù)中增加調(diào)用LoadTmMishOp的邏輯代碼；
（4-3）在serializer/tengine/v2/tm2/_op/_save.cpp文件中增加SaveTmMishOp函數(shù)實(shí)現(xiàn)，同時(shí)在SaveTmReorgOp函數(shù)中增加調(diào)用SaveTmMishOp的邏輯代碼；
（4-4）在serializer/tengine/v2/tm2/_op/_serializer.hpp，增加LoadTmMishOp和 SaveTmMishOp的函數(shù)聲明

（4-5）本次轉(zhuǎn)換模型針對(duì)darknet，所以需要對(duì)tools/darknet/darknet/_serializer.cpp文件中增加mish算子解析的相應(yīng)邏輯。因?yàn)閙ish沒有單獨(dú)使用，而是作為conv的激活函數(shù)調(diào)用，所以是在LoadConv2D函數(shù)參照leaky增加相應(yīng)的代碼。其他單獨(dú)算子的實(shí)現(xiàn)也可以參考其他類似算子的實(shí)現(xiàn)方式

完成代碼改動(dòng)后，按照如下操作進(jìn)行編譯，即可生成轉(zhuǎn)換工具

mkdir build && cd build
cmake ..
make -j4 && make install

最后執(zhí)行轉(zhuǎn)換動(dòng)作（提前準(zhǔn)備好模型文件）

./install/bin/tm_convert_tool -f darknet -p yolov4.cfg -m yolov4.weights -o yolov4.tmfile

二、推理

官方代碼鏈接下的readme并沒有找到介紹如何新增算子，但是可以參考類似算子進(jìn)行修改添加，下面是我參考tanh算子的實(shí)現(xiàn)，進(jìn)行的修改

（1-1）在inlcude/tengine/_op.h中增加mish的枚舉定義，include/tengine/_op/_name.h中增加mish的字符串宏定義
（1-2）在src/op/mish.c中增加mish算子的注冊(cè)函數(shù)
（1-3）在src/serializer/tm/tm2/_format.h 和src/serializer/tm/op/tm2/_mish.c 中增加序列化相關(guān)代碼,

note：src/serializer/tm/tm2/_format.h中定義算子的類型數(shù)值需要跟convert/_tools下的serializer/include/tengine/v2/tm2/_format.h代碼保持一致

（1-4）在src/dev/cpu/op/目錄下增加mish算子實(shí)現(xiàn)代碼目錄，包括mish/_ref.c（x86）、mish/_hcl/_arm.c（arm），其中contex-a目錄下的文件為具體的kernel實(shí)現(xiàn)代碼

也可以參考下面的鏈接，查看有哪些代碼改動(dòng)和文件增加：

https://github.com/zjd1988/Tenginegithub.com

測(cè)試

測(cè)試圖片使用的是標(biāo)題中的圖片（512x384）test.jpg
測(cè)試代碼使用的官方代碼

examples/tm_yolov3_tiny.cpp

做了簡(jiǎn)單修改。

三、后續(xù)

（1）合并conv和mish算子
（2）后續(xù)抽空新增一個(gè)需要配置參數(shù)的算子

四、使用感受

（1）模型轉(zhuǎn)換和推理分離，新增算子需要增加兩次，官方回復(fù)會(huì)后續(xù)考慮合并，希望會(huì)越來越方便
（2）推理引擎編譯速度快（本文目的不在于測(cè)試性能，只是驗(yàn)證tengine在推理yolov4的正確性）
（3）代碼結(jié)構(gòu)清晰，便于閱讀和調(diào)試

以上便是解答過程以及使用感受。

更多Tengine相關(guān)內(nèi)容請(qǐng)關(guān)注Tengine-邊緣AI推理框架專欄。

審核編輯黃昊宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

cpu

cpu

+關(guān)注

關(guān)注
68

文章
10908

瀏覽量
213087
Tengine

Tengine

+關(guān)注

關(guān)注
1

文章
47

瀏覽量
2883

評(píng)論

相關(guān)推薦

【ELF 2學(xué)習(xí)板試用】ELF2開發(fā)板（飛凌嵌入式）部署yolov5s的自定義模型

開發(fā)板上進(jìn)行推理。獲得自定義訓(xùn)練得到的yolov5s pt模型準(zhǔn)備自定義數(shù)據(jù)集（博主用的是VOC數(shù)據(jù)集）數(shù)據(jù)集目錄結(jié)構(gòu)如下： └─VOC2028:自定義數(shù)據(jù)集 ├─Annotations存放

發(fā)表于 02-04 18:15

采用華為云 Flexus 云服務(wù)器 X 實(shí)例部署 YOLOv3 算法完成目標(biāo)檢測(cè)

一、前言 1.1 開發(fā)需求這篇文章講解：?采用華為云最新推出的 Flexus 云服務(wù)器 X 實(shí)例部署 YOLOv3 算法，完成圖像分析、目標(biāo)檢測(cè)。隨著計(jì)算機(jī)視覺技術(shù)的飛速發(fā)展，深度學(xué)習(xí)模型如

發(fā)表于 01-02 12:00 ?133次閱讀

采用華為云 Flexus 云服務(wù)器 X 實(shí)例部署 <b class='flag-5'>YOLOv</b>3 算法完成目標(biāo)檢測(cè)

在RK3568教學(xué)實(shí)驗(yàn)箱上實(shí)現(xiàn)基于YOLOV5的算法物體識(shí)別案例詳解

一、實(shí)驗(yàn)?zāi)康?本節(jié)視頻的目的是了解YOLOv5模型的用途及流程，并掌握基于YOLOV5算法實(shí)現(xiàn)物體識(shí)別的方法。二、實(shí)驗(yàn)原理 YOLO（You Only Look Once?。?YOLOv

發(fā)表于 12-03 14:56

CPU推理：AI算力配置新范式

在當(dāng)前的人工智能領(lǐng)域，尤其是涉及到深度學(xué)習(xí)的推理階段，行業(yè)普遍認(rèn)為GPU是唯一的選擇。然而，GPU的成本相對(duì)較高，且對(duì)于某些特定的應(yīng)用場(chǎng)景，其高昂的價(jià)格和較高的能耗成為了一大負(fù)擔(dān)。相比之下，CPU

發(fā)表于 11-21 01:03 ?389次閱讀

AI推理CPU當(dāng)?shù)?，Arm驅(qū)動(dòng)高效引擎

AI的訓(xùn)練和推理共同鑄就了其無與倫比的處理能力。在AI訓(xùn)練方面，GPU因其出色的并行計(jì)算能力贏得了業(yè)界的青睞，成為了當(dāng)前AI大模型最熱門的芯片；而在 AI 推理方面，具備卓越通用性和靈活性的CPU

發(fā)表于 11-13 14:34 ?2648次閱讀

YOLOv6在LabVIEW中的推理部署（含源碼）

相關(guān)介紹文章，所以筆者在實(shí)現(xiàn)YOLOv6 ONNX 在LabVIEW中的部署推理后，決定和各位讀者分享一下如何使用LabVIEW實(shí)現(xiàn)YOLOv

發(fā)表于 11-06 16:07 ?417次閱讀

RK3588 技術(shù)分享 | 在Android系統(tǒng)中使用NPU實(shí)現(xiàn)Yolov5分類檢測(cè)

隨著人工智能和大數(shù)據(jù)時(shí)代的到來，傳統(tǒng)嵌入式處理器中的CPU和GPU逐漸無法滿足日益增長的深度學(xué)習(xí)需求。為了應(yīng)對(duì)這一挑戰(zhàn)，在一些高端處理器中，NPU（神經(jīng)網(wǎng)絡(luò)處理單元）也被集成到了處理器里。NPU

發(fā)表于 10-24 10:13

手冊(cè)上新 |迅為RK3568開發(fā)板NPU例程測(cè)試

rknn-toolkit-lite2環(huán)境搭建和使用 3.1 rknn-toolkit-lite2環(huán)境搭建 3.1.1 直接安裝 3.1.2 conda虛擬環(huán)境安裝 3.2 rknn-toolkit-lite2推理測(cè)試第4章

發(fā)表于 10-23 14:06

RK3588 技術(shù)分享 | 在Android系統(tǒng)中使用NPU實(shí)現(xiàn)Yolov5分類檢測(cè)-迅為電子

RK3588 技術(shù)分享 | 在Android系統(tǒng)中使用NPU實(shí)現(xiàn)Yolov5分類檢測(cè)-迅為電子

發(fā)表于 08-23 14:58 ?860次閱讀

RK3588 技術(shù)分享 | 在Android系統(tǒng)中使用NPU實(shí)現(xiàn)Yolov5分類檢測(cè)

隨著人工智能和大數(shù)據(jù)時(shí)代的到來，傳統(tǒng)嵌入式處理器中的CPU和GPU逐漸無法滿足日益增長的深度學(xué)習(xí)需求。為了應(yīng)對(duì)這一挑戰(zhàn)，在一些高端處理器中，NPU（神經(jīng)網(wǎng)絡(luò)處理單元）也被集成到了處理器里。NPU

發(fā)表于 08-20 11:13

基于迅為RK3588【RKNPU2項(xiàng)目實(shí)戰(zhàn)1】：YOLOV5實(shí)時(shí)目標(biāo)分類

[/url] 【RKNPU2 人工智能開發(fā)】【AI深度學(xué)習(xí)推理加速器】——RKNPU2 從入門到實(shí)踐（基于RK3588和RK3568）【RKNPU2項(xiàng)目實(shí)戰(zhàn)1】：YOLOV5實(shí)時(shí)目標(biāo)分類【RKNPU2項(xiàng)目實(shí)戰(zhàn)2】：SORT目標(biāo)追蹤【RKNPU2項(xiàng)目實(shí)戰(zhàn)3】車牌識(shí)別

發(fā)表于 08-15 10:51

手冊(cè)上新 |迅為RK3568開發(fā)板NPU例程測(cè)試

rknn-toolkit-lite2環(huán)境搭建和使用 3.1 rknn-toolkit-lite2環(huán)境搭建 3.1.1 直接安裝 3.1.2 conda虛擬環(huán)境安裝 3.2 rknn-toolkit-lite2推理測(cè)試第4章

發(fā)表于 08-12 11:03

用OpenVINO C# API在intel平臺(tái)部署YOLOv10目標(biāo)檢測(cè)模型

最近YOLO家族又添新成員：YOLOv10，YOLOv10提出了一種一致的雙任務(wù)方法，用于無nms訓(xùn)練的YOLOs，它同時(shí)帶來了具有競(jìng)爭(zhēng)力的性能和較低的推理延遲。此外，還介紹了整體效率-精度驅(qū)動(dòng)

發(fā)表于 06-21 09:23 ?1176次閱讀

英特爾助力京東云用CPU加速AI推理，以大模型構(gòu)建數(shù)智化供應(yīng)鏈

英特爾助力京東云用CPU加速AI推理，以大模型構(gòu)建數(shù)智化供應(yīng)鏈

發(fā)表于 05-27 11:50 ?593次閱讀

基于OpenCV DNN實(shí)現(xiàn)YOLOv8的模型部署與推理演示

基于OpenCV DNN實(shí)現(xiàn)YOLOv8推理的好處就是一套代碼就可以部署在Windows10系統(tǒng)、烏班圖系統(tǒng)、Jetson的Jetpack系統(tǒng)

發(fā)表于 03-01 15:52 ?1889次閱讀