九九热这里只有精品视频18,一区二区亚洲精品精华液闺蜜

目前，在許多需要在本地進行數(shù)據(jù)分析的“永遠在線”的物聯(lián)網(wǎng)邊緣設(shè)備中，神經(jīng)網(wǎng)絡(luò)正在變得越來越普及，主要是因為可以有效地同時減少數(shù)據(jù)傳輸導(dǎo)致的延時和功耗。而談到針對物聯(lián)網(wǎng)邊緣設(shè)備上的神經(jīng)網(wǎng)絡(luò)，我們自然會想到Arm Cortex-M系列處理器內(nèi)核，那么如果您想要強化它的性能并且減少內(nèi)存消耗，CMSIS-NN就是您最好的選擇。基于CMSIS-NN內(nèi)核的神經(jīng)網(wǎng)絡(luò)推理運算，對于運行時間/吞吐量將會有4.6X的提升，而對于能效將有4.9X的提升。

CMSIS-NN庫包含兩個部分：NNFunction和NNSupportFunctions。NNFunction包含實現(xiàn)通常神經(jīng)網(wǎng)絡(luò)層類型的函數(shù)，比如卷積（convolution），深度可分離卷積（depthwise separable convolution），全連接（即內(nèi)積inner-product），池化（pooling）和激活（activation）這些函數(shù)被應(yīng)用程序代碼用來實現(xiàn)神經(jīng)網(wǎng)絡(luò)推理應(yīng)用。內(nèi)核API也保持簡單，因此可以輕松地重定向到任何機器學(xué)習(xí)框架。NNSupport函數(shù)包括不同的實用函數(shù)，如NNFunctions中使用的數(shù)據(jù)轉(zhuǎn)換和激活功能表。這些實用函數(shù)也可以被應(yīng)用代碼用來構(gòu)造更復(fù)雜的NN模塊，例如，長期短時記憶（LSTM）或門控循環(huán)單元（GRU）。

對于某些內(nèi)核（例如全連接和卷積），會使用到不同版本的內(nèi)核函數(shù)。Arm提供了一個基本的版本，可以為任何圖層參數(shù)“按原樣”通用。我們還部署了其他版本，包括進一步的優(yōu)化技術(shù)，但會對輸入進行轉(zhuǎn)換或?qū)訁?shù)有一些限制。理想情況下，可以使用簡單的腳本來分析網(wǎng)絡(luò)拓撲，并自動確定要使用的相應(yīng)函數(shù)。

基于CMSIS-NN內(nèi)核的神經(jīng)網(wǎng)絡(luò)推理運算對運行時間/吞吐量和能效有顯著提升

我們在卷積神經(jīng)網(wǎng)絡(luò)（CNN）上測試了CMSIS-NN內(nèi)核，在CIFAR-10數(shù)據(jù)集上進行訓(xùn)練，包括60,000個32x32彩色圖像，分為10個輸出類。網(wǎng)絡(luò)拓撲結(jié)構(gòu)基于Caffe中提供的內(nèi)置示例，具有三個卷積層和一個完全連接層。下表顯示了使用CMSIS-NN內(nèi)核的層參數(shù)和詳細運行時結(jié)果。測試在運行頻率為216 MHz的ARM Cortex-M7內(nèi)核STMichelectronics NUCLEO-F746ZG mbed開發(fā)板上進行。

基于CMSIS-NN內(nèi)核的神經(jīng)網(wǎng)絡(luò)推理運算對運行時間/吞吐量和能效有顯著提升

整個圖像分類每張圖像大約需要99.1毫秒（相當于每秒10.1張圖像）。運行此網(wǎng)絡(luò)的CPU的計算吞吐量約為每秒249 MOps。預(yù)量化的網(wǎng)絡(luò)在CIFAR-10測試集上達到了80.3％的精度。在ARM Cortex-M7內(nèi)核上運行的8位量化網(wǎng)絡(luò)達到了79.9％的精度。使用CMSIS-NN內(nèi)核的最大內(nèi)存占用空間為?133 KB，其中使用局部im2col來實現(xiàn)卷積以節(jié)省內(nèi)存，然后進行矩陣乘法。沒有使用局部im2col的內(nèi)存占用將是?332 KB，這樣的話神經(jīng)網(wǎng)絡(luò)將無法在板上運行。

為了量化CMSIS-NN內(nèi)核相對于現(xiàn)有解決方案的好處，我們還使用一維卷積函數(shù)（來自CMSIS-DSP的arm_conv），類似Caffe的pooling和ReLU來實現(xiàn)了一個基準版本。對于CNN應(yīng)用，下表總結(jié)了基準函數(shù)和CMSIS-NN內(nèi)核的比較結(jié)果。CMSIS-NN內(nèi)核的運行時間/吞吐量比基準函數(shù)提高2.6至5.4倍，能效提高也與吞吐量的提高相一致。

基于CMSIS-NN內(nèi)核的神經(jīng)網(wǎng)絡(luò)推理運算對運行時間/吞吐量和能效有顯著提升

高效的NN內(nèi)核是充分發(fā)揮Arm Cortex-M CPU能力的關(guān)鍵。CMSIS-NN提供了優(yōu)化的函數(shù)來加速關(guān)鍵的NN層，如卷積，池化和激活。此外，非常關(guān)鍵的是CMSIS-NN還有助于減少對于內(nèi)存有限的微控制器而言至關(guān)重要的內(nèi)存占用。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

內(nèi)核

內(nèi)核

+關(guān)注

關(guān)注
3

文章
1383

瀏覽量
40442
神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4782

瀏覽量
101219
物聯(lián)網(wǎng)

物聯(lián)網(wǎng)

+關(guān)注

關(guān)注
2914

文章
44964

瀏覽量
377386

原文標題：想讓你的微控制器效率提升5倍嗎？

文章出處：【微信號：arm_china，微信公眾號：Arm芯聞】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

如何縮短Vivado的運行時間

在Vivado Implementation階段，有時是有必要分析一下什么原因?qū)е?b class='flag-5'>運行時間（runtime）過長，從而找到一些方法來縮短運行時間。

發(fā)表于 05-29 14:37 ?1.4w次閱讀

發(fā)布MCU上跑的輕量神經(jīng)網(wǎng)絡(luò)包 NNoM，讓MCU也神經(jīng)一把

Spotting）使用運動傳感器識別活動狀態(tài) （Human Activity Recognition）神經(jīng)網(wǎng)絡(luò)控制系統(tǒng) （替代PID等傳統(tǒng)控制方法）圖像處理（帶專用加速器的 MCU）...它輕量但不低能，它支持

發(fā)表于 05-01 19:03

CMSIS-NN神經(jīng)網(wǎng)絡(luò)內(nèi)核助力微控制器效率提升

自然會想到Arm Cortex-M系列處理器內(nèi)核，那么如果您想要強化它的性能并且減少內(nèi)存消耗，CMSIS-NN就是您最好的選擇。基于CMSIS-NN內(nèi)核的

發(fā)表于 07-23 08:08

如何設(shè)計BP神經(jīng)網(wǎng)絡(luò)圖像壓縮算法？

處理的運算量和數(shù)據(jù)吞吐量。圖像壓縮是信息傳輸和存儲系統(tǒng)的關(guān)鍵技術(shù)，然而我們該如何進行FPGA設(shè)計，以實現(xiàn)給定的功能已經(jīng)成為神經(jīng)網(wǎng)絡(luò)應(yīng)用的關(guān)鍵呢？

發(fā)表于 08-08 06:11

CMSIS-NN神經(jīng)網(wǎng)絡(luò)內(nèi)核可以讓微控制器效率提升5倍是真的嗎？

全新CMSIS-NN神經(jīng)網(wǎng)絡(luò)內(nèi)核讓微控制器效率提升5倍

發(fā)表于 03-15 06:55

可分離卷積神經(jīng)網(wǎng)絡(luò)在 Cortex-M 處理器上實現(xiàn)關(guān)鍵詞識別

的架構(gòu)成為可能，甚至在資源受限的微控制器器件中也能運行。在 Cortex-M 處理器上運行關(guān)鍵詞識別時，內(nèi)存占用和執(zhí)行時間是兩個最重要因素，在設(shè)計和優(yōu)化用于該用途的

發(fā)表于 07-26 09:46

DSP數(shù)字信號處理和CMSIS-NN神經(jīng)網(wǎng)絡(luò)教程

之后，開啟第2版DSP數(shù)字信號處理和CMSIS-NN神經(jīng)網(wǎng)絡(luò)教程，同步開啟三代示波器。軟件：1、開發(fā)板預(yù)裝出廠程序，各種外設(shè)驅(qū)動包全做好了，可以檢測全部硬件功能...

發(fā)表于 08-04 06:59

圖像預(yù)處理和改進神經(jīng)網(wǎng)絡(luò)推理的簡要介紹

為提升識別準確率，采用改進神經(jīng)網(wǎng)絡(luò)，通過Mnist數(shù)據(jù)集進行訓(xùn)練。整體處理過程分為兩步：圖像預(yù)處理和改進神經(jīng)網(wǎng)絡(luò)推理。圖像預(yù)處理主要根據(jù)圖像的特征，將數(shù)據(jù)處理成規(guī)范的格式，而改進

發(fā)表于 12-23 08:07

充分利用Arm NN進行GPU推理

計算（GPGPU），尤其是用作將運算符實現(xiàn)為計算著色器的推理引擎的后端。GPU推理不僅具有優(yōu)于CPU推理的性能，還具有其他優(yōu)勢。在移動CPU上執(zhí)行深度

發(fā)表于 04-11 17:33

AT32講堂016 | AT32 MCU DSP使用案例和網(wǎng)絡(luò)神經(jīng)算法CMSIS-NN案例

()參考AT32_DSP_DEMOprojectat_start_f403aexamples5_11_arm_variance_exampleCMSIS NN with DSP介紹本用戶手冊介紹了CMSIS NN軟件庫，這是一個

發(fā)表于 08-16 19:40

ARM Cortex-M系列芯片神經(jīng)網(wǎng)絡(luò)推理庫CMSIS-NN詳解

1、ARM Cortex-M系列芯片神經(jīng)網(wǎng)絡(luò)推理庫CMSIS-NN詳解CMSIS-NN是用于ARM Cortex-M系列的芯片的神經(jīng)網(wǎng)絡(luò)

發(fā)表于 08-19 16:06

在Linux上使用Arm NN分析和優(yōu)化運行推理的機器學(xué)習(xí)應(yīng)用程序的步驟

CPU上運行單個推理；在時間軸視圖的詳細信息面板中可以選擇“Arm NN 時間線”以顯示有關(guān) NN

發(fā)表于 09-27 14:24

用CMSIS-NN版本轉(zhuǎn)換Arm Cortex-M的神經(jīng)網(wǎng)絡(luò)：r0p0指南

2. 概覽本指南向您展示了如何將神經(jīng)網(wǎng)絡(luò)從任何框架轉(zhuǎn)換成一個基于 Arm Cortex-M-M 裝置的實施工具, 使用 Arm CMSIS- NN 庫。此教程用于不再支持的 CMSIS

發(fā)表于 08-11 07:06

事隔五年之后，開啟第2版DSP數(shù)字信號處理和CMSIS-NN神經(jīng)網(wǎng)絡(luò)教程，同步開啟三代示波器，前50章發(fā)布（2021-11

事隔五年之后，開啟第2版DSP數(shù)字信號處理和CMSIS-NN神經(jīng)網(wǎng)絡(luò)教程，同步開啟三代示波器，前50章發(fā)布（2021-11-02）

發(fā)表于 11-26 10:36 ?0次下載

移植CMSIS-NN v6.0.0版本到VisionBoard

CMSIS-NN是什么？官方的解釋是：CMSISNNsoftwarelibraryisacollectionofefficientneuralnetworkkernelsdevelopedtomaximizetheperformanceandminimizethememoryfootprintofneuralnet

發(fā)表于 07-10 08:35 ?729次閱讀

欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

搜索歷史

基于CMSIS-NN內(nèi)核的神經(jīng)網(wǎng)絡(luò)推理運算對運行時間/吞吐量和能效有顯著提升

評論

如何縮短Vivado的運行時間

發(fā)布MCU上跑的輕量神經(jīng)網(wǎng)絡(luò)包 NNoM，讓MCU也神經(jīng)一把

CMSIS-NN神經(jīng)網(wǎng)絡(luò)內(nèi)核助力微控制器效率提升

如何設(shè)計BP神經(jīng)網(wǎng)絡(luò)圖像壓縮算法？

CMSIS-NN神經(jīng)網(wǎng)絡(luò)內(nèi)核可以讓微控制器效率提升5倍是真的嗎？

可分離卷積神經(jīng)網(wǎng)絡(luò)在 Cortex-M 處理器上實現(xiàn)關(guān)鍵詞識別

DSP數(shù)字信號處理和CMSIS-NN神經(jīng)網(wǎng)絡(luò)教程

圖像預(yù)處理和改進神經(jīng)網(wǎng)絡(luò)推理的簡要介紹

充分利用Arm NN進行GPU推理

AT32講堂016 | AT32 MCU DSP使用案例和網(wǎng)絡(luò)神經(jīng)算法CMSIS-NN案例

ARM Cortex-M系列芯片神經(jīng)網(wǎng)絡(luò)推理庫CMSIS-NN詳解

在Linux上使用Arm NN分析和優(yōu)化運行推理的機器學(xué)習(xí)應(yīng)用程序的步驟

用CMSIS-NN版本轉(zhuǎn)換Arm Cortex-M的神經(jīng)網(wǎng)絡(luò)：r0p0指南

事隔五年之后，開啟第2版DSP數(shù)字信號處理和CMSIS-NN神經(jīng)網(wǎng)絡(luò)教程，同步開啟三代示波器，前50章發(fā)布（2021-11

移植CMSIS-NN v6.0.0版本到VisionBoard

搜索歷史

基于CMSIS-NN內(nèi)核的神經(jīng)網(wǎng)絡(luò)推理運算 對運行時間/吞吐量和能效有顯著提升

評論

基于CMSIS-NN內(nèi)核的神經(jīng)網(wǎng)絡(luò)推理運算對運行時間/吞吐量和能效有顯著提升