你有沒有被問過,“你不能用人工智能來提高我們系統(tǒng)的性能嗎?”
或者,“你能否通過將人工智能融入我們的設(shè)備來為我們的設(shè)備增加更多價值?”
人工智能、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)……人工智能應(yīng)用正在呈指數(shù)級擴展,沒有一天不聽這些話。另外,有很多人有同樣的想法——“我很感興趣,但即使我研究了一點,我也不太明白如何使用它。我不知道如何在我的工作中使用它,我無法想象它會給我的工作帶來什么價值。”
在這篇博客中,我想介紹使用瑞薩嵌入式 AI 處理器 - RZ/V 系列的軟件包進行 AI 評估。
什么是人工智能?
如果您已經(jīng)熟悉 AI 和深度學(xué)習(xí),這可能沒有必要,但我想先回顧一下有關(guān) AI 的一些基礎(chǔ)知識。
人工智能 (AI)。許多書籍和網(wǎng)站都以各種方式解釋了這一點,例如人工智能可以像專業(yè)人士一樣下棋,或者只需要求它打開房間里的燈。但是,我想專注于人工智能的最狹義定義:使用神經(jīng)網(wǎng)絡(luò)技術(shù)的人工智能,特別是——視覺人工智能——可以對圖像進行各種識別和判斷。
神經(jīng)網(wǎng)絡(luò)。如圖 1 所示,生物體大腦中的神經(jīng)接收來自多個其他神經(jīng)元的輸入,并將它們傳送到下一個神經(jīng)元。眾所周知,記憶、識別和判斷是基于兩種信號的組合:來自輸入側(cè)的信號被使用的強度(加權(quán))以及加權(quán)后每個輸入的總和如何傳輸?shù)捷敵鰝?cè)(激活功能)。
使用神經(jīng)網(wǎng)絡(luò)的人工智能模仿這種機制,通過大量的算術(shù)處理來進行各種識別和判斷,例如對多個輸入進行加權(quán)、求和,然后通過激活函數(shù)將結(jié)果傳遞到下一個階段。
以 3x3 卷積運算為例,它經(jīng)常在 Vision AI 中用于量化輸入圖像的特征。圖像首先被細(xì)分為 3 像素 x 3 像素的圖像。對每個值(像素密度)進行加權(quán),并使用激活函數(shù)將這些值的總和作為輸出值發(fā)送到下一個階段。(圖2)
圖 2 神經(jīng)網(wǎng)絡(luò)的 3x3 卷積運算示例
這個過程首先在輸入圖像的整個表面上進行,然后是由輸出創(chuàng)建的下一個圖像(因此它不完全是已經(jīng)可以看作圖像的數(shù)據(jù),它被稱為 - 特征值,這意味著抽象輸入圖像特征的數(shù)據(jù))被發(fā)送到下一個重復(fù)相同過程的神經(jīng)網(wǎng)絡(luò)。
即使是簡單的圖像識別,比如區(qū)分?jǐn)?shù)字和字母,也需要幾層這樣的計算,而一般的物體識別需要幾十層這樣的計算,所以通過重復(fù)無數(shù)次的操作,我們就可以實現(xiàn)圖像識別,比如確定數(shù)字5 是 5 或從狗的圖像中識別狗的位置。
簡而言之,最大的區(qū)別在于沒有人工智能的傳統(tǒng)計算機軟件——人們思考他們想要處理什么(算法)并構(gòu)建程序——而使用神經(jīng)網(wǎng)絡(luò)的人工智能——使用大量輸入和自動準(zhǔn)備處理所需的內(nèi)部數(shù)據(jù)(加權(quán)參數(shù))。換句話說,在人工智能中,主角不是程序,而是數(shù)據(jù)。因此,雖然傳統(tǒng)的軟件開發(fā)側(cè)重于編程,但人工智能開發(fā)中最重要和最耗時的部分是準(zhǔn)備加權(quán)參數(shù)(學(xué)習(xí))的過程,以便它能夠以必要的精度和速度。
我們在此介紹的 AI 評估軟件包使用了 PyTorch 等 AI 框架提供的預(yù)訓(xùn)練模型,因此您可以評估 AI 的圖像推理執(zhí)行情況,而無需耗時的學(xué)習(xí)過程。
讓我們考慮一個視覺 AI 評估的具體說明。
需要什么?
無需從一開始就購買評估板。在這篇博客中,我將幫助您體驗嵌入式 AI 處理器 RZ/V 系列的 Vision AI 實現(xiàn)流程,僅使用免費的開源軟件(以下簡稱 OSS)和瑞薩電子在網(wǎng)絡(luò)上免費提供的軟件包。
*1 PyTorch、PyTorch 徽標(biāo)和任何相關(guān)標(biāo)記是 Facebook, Inc. 的商標(biāo)。
*2 TensorFlow、TensorFlow 徽標(biāo)和任何相關(guān)標(biāo)記是 Google Inc. 的商標(biāo)。
*3 DRP-AI Translator:瑞薩電子的 ONNX 轉(zhuǎn)換工具
圖 3 RZ/V2L AI實現(xiàn)工具流程整體架構(gòu)
圖 3 顯示了整個工具流程。人工智能學(xué)習(xí)有各種行業(yè)標(biāo)準(zhǔn)框架,大家熟悉,所以我們開發(fā)了RZ/V系列,“你可以使用現(xiàn)有的你熟悉的人工智能框架進行人工智能訓(xùn)練,將訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型連接到瑞薩工具使用一種稱為 ONNX 的通用格式,”——這是一種 AI 開發(fā)流程。ONNX 是一種被廣泛采用的格式,大多數(shù) AI 框架都能夠直接輸出或使用轉(zhuǎn)換工具以 ONNX 格式輸出,但我們將使用 AI 框架 PyTorch 作為示例。
在 AI 世界中,Linux 而非 Windows 是事實上的標(biāo)準(zhǔn),這里使用的所有操作系統(tǒng)和軟件包也需要安裝 Linux(Ubuntu)的 PC。
有一種稱為 WSL2 的技術(shù)可以在 Windows 上將 Linux 作為虛擬操作系統(tǒng)運行,但瑞薩評估包不保證可以與 WSL2 一起使用,因此請準(zhǔn)備一臺安裝了 Ubuntu 的 PC。如果你不打算做 AI 學(xué)習(xí),你不需要高性能,所以你也可以重復(fù)使用手頭的舊 PC。
首先,一臺 Linux PC 和 DRP-AI 支持包
準(zhǔn)備好 Linux PC
對于硬件,您可以使用您自己的帶有 x86 64 位 CPU 和至少 6GB RAM 的 PC,但操作系統(tǒng)不是 Windows。我們將改為使用 Linux 發(fā)行版之一的 Ubuntu 版本 18.04。
轉(zhuǎn)到提供 Uubuntu 18.04 的網(wǎng)頁并從ubuntu-18.04.6-desktop-amd64.iso下載 ISO 文件。
您可以使用適用于 Windows 的 Rufus 工具將 ISO 文件轉(zhuǎn)換為可引導(dǎo)的 USB 驅(qū)動器,以便您可以在計劃安裝 Ubuntu 的 PC 上安裝 Ubuntu 18.04。
(有關(guān)使用 Rufus 的詳細(xì)信息,請參閱 https://rufus.ie/en/ 。)
準(zhǔn)備好軟件
要下載軟件,首先從瑞薩電子網(wǎng)站下載軟件包“ RZ/V2L DRP-AI Support Package ”。該文件是一個超過 2GB 的大型 ZIP 文件,因此我們建議通過高速互聯(lián)網(wǎng)連接下載它。
解壓此 ZIP 文件時,打開文件夾 rzv2l_ai-implementation-guide,您將在其中找到文件
rzv2l_ai-implementation-guide_en_rev5.00.pdf(以下簡稱“實施指南”)。
本指南以分步練習(xí)的形式編寫。如果您遵循它,您將能夠評估包含的經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型,從轉(zhuǎn)換到評估板上的實際操作。接下來,我想介紹一些在使用本指南進行評估時需要考慮的要點。
圖 4 DRP-AI 支持包詳情
創(chuàng)建 ONNX 文件
從這里開始,我們將在 Linux 中使用命令行。
(如果您是 Linux 新手,則需要學(xué)習(xí)操作系統(tǒng)本身的基本命令。)
AI 框架 PyTorch 和 torchvision 也可以使用命令 pip3 從 Linux 命令行安裝。(請參閱實施指南,第 2.2 章,第 26 頁)
在您下載的 DRP-AI 支持包中,您會找到 rzv2l_ai-implementation-guide_ver5.00.tar.gz 壓縮文件。按照實施指南中的說明解壓縮文件。(第 30 頁)
同樣,在名為 pytorch_mobilenet 的文件夾中,在 rzv2l_ai-implementation-guide 下,您將找到文件
pytorch_mobilenet_en_rev5.00.pdf(以下簡稱 MobileNet 指南)和 pytorch_mobilenet_ver5.00.tar.gz,您應(yīng)該按照實施指南。
MobileNet 是為移動和嵌入式設(shè)備開發(fā)的用于圖像識別的輕量級快速神經(jīng)網(wǎng)絡(luò),它輸出圖像中對象正確答案的概率。例如,如圖5所示,物體是小獵犬的概率為93.53%,說明判斷正確。
圖 5 MobileNet的圖像識別圖像
如果您繼續(xù)閱讀 pytorch_mobilenet_en_rev5.00.pdf 的第 2 章,您將找到一個名為 mobilenet_v2.onnx 的文件。這是具有 ONNX 格式的加權(quán)參數(shù)的預(yù)訓(xùn)練 MobileNet v2 神經(jīng)網(wǎng)絡(luò)模型的表示。
現(xiàn)在我們已經(jīng)有了經(jīng)過訓(xùn)練的 ONNX 文件,讓我們進入下一階段,為 DRP-AI 創(chuàng)建 DRP-AI 對象文件并評估性能。
在 DRP-AI Translator 中轉(zhuǎn)換為 DRP-AI 對象文件
從這里開始,我們將使用 Renesas 的 ONNX 轉(zhuǎn)換工具 DRP-AI Translator。首先,從 Renesas 網(wǎng)站下載DRP-AI Translator 。
根據(jù)實施指南的第 3.1 章安裝解壓縮的安裝程序。如果您按照實施指南和 MobileNet 指南中的步驟操作,您最終應(yīng)該會得到如圖 6 所示的目錄結(jié)構(gòu)。
圖 6 ONNX 文件的目錄結(jié)構(gòu)和 DRP-AI 轉(zhuǎn)換器目錄結(jié)構(gòu)
在此之后,通過復(fù)制/重命名和編輯樣本中的文件,準(zhǔn)備要輸入到 DRP-AI 翻譯器的文件。有關(guān)詳細(xì)說明,請參閱 MobileNet 指南第 3.3-3.5 章。
準(zhǔn)備好后,ONNX 轉(zhuǎn)換本身可以通過一個命令完成。對于 RZ/V2L,從 shell 運行
$ 。/run_DRP-AI_translator_V2L.sh mobilenet_v2 -onnx 。/onnx/mobilenet_v2.onnx
在工作目錄下的 output/mobilenet_v2/ 目錄中,這將生成在真實芯片上運行 MobileNet 所需的二進制文件。(圖 7)
圖 7 運行 DRP-AI Translator 后的文件列表
如何閱讀性能估算器 Excel
除了評估實際設(shè)備所需的對象外,DRP-AI 轉(zhuǎn)換器還輸出神經(jīng)網(wǎng)絡(luò)模型的摘要,該模型從 ONNX 轉(zhuǎn)換為 Excel 格式。(圖 8)
連同神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)信息,此 Excel 文件包含模型每一層(每個功能)的大致處理時間(DRP-AI 單機性能,不包括 LSI 內(nèi)部總線和外部 DRAM 帶寬的限制) ,它允許您估計近似性能。
圖 8 mobilenet_v2_summary.xlsx 示例
概括
我們?yōu)閷I感興趣但不知從何下手的用戶介紹了瑞薩電子提供的免費軟件包,大家可以試試。如果您擁有本博客中創(chuàng)建的目標(biāo)文件,那么您離使用真實芯片評估 AI 性能又近了一步。本博客使用的RZ/V2L的評估板套件已經(jīng)可以購買,您可以體驗到評估板套件中嵌入的實際芯片的AI性能、低功耗和低發(fā)熱。
瑞薩嵌入式 AI 處理器的 RZ/V 系列還包括RZ/V2M ,其 AI 性能比這里介紹的RZ/V2L高約 1.5 倍,并且提供RZ/V2M DRP-AI Support Package,可用于與上面提到的方法相同。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19435瀏覽量
231306 -
嵌入式
+關(guān)注
關(guān)注
5095文章
19189瀏覽量
307951 -
AI
+關(guān)注
關(guān)注
87文章
31670瀏覽量
270472
發(fā)布評論請先 登錄
相關(guān)推薦
微處理器中寄存器的作用
微處理器在人工智能方面的應(yīng)用
基于瑞薩RZ/V2H AI微處理器的解決方案:高性能視覺AI系統(tǒng)
![基于瑞薩<b class='flag-5'>RZ</b>/<b class='flag-5'>V</b>2H <b class='flag-5'>AI</b><b class='flag-5'>微處理器</b>的解決方案:高性能視覺<b class='flag-5'>AI</b>系統(tǒng)](https://file1.elecfans.com/web2/M00/F7/28/wKgZomaD21SAbKA6AADrJjvRsaM578.png)
嵌入式微處理器的分類 嵌入式微處理器的種類和型號
嵌入式微處理器的類型與特點 嵌入式微處理器技術(shù)的優(yōu)缺點
嵌入式微處理器有哪幾類 嵌入式微處理器包含哪些重要參數(shù)
什么是嵌入式微處理器? 嵌入式微處理器的區(qū)別
嵌入式微處理器的分類特點 嵌入式微處理器作用
主流嵌入式微處理器的結(jié)構(gòu)與原理是什么 常見的嵌入式微處理器類型包括
什么是嵌入式微處理器?嵌入式微處理器有哪些?
嵌入式微處理器的原理和應(yīng)用
瑞薩電子推出面向高性能機器人應(yīng)用的RZ/V2H微處理器
RZ/G2L微處理器DDR ECC功能和機制概要
![<b class='flag-5'>RZ</b>/G2L<b class='flag-5'>微處理器</b>DDR ECC功能和機制概要](https://file1.elecfans.com/web2/M00/C1/C7/wKgZomXeyKiAALMaAAA6a_WH4b8118.png)
評論