隨著人工智能領(lǐng)域的發(fā)展,這些設(shè)備的計(jì)算量和功耗都在增加。隨后,邊緣設(shè)備上的處理負(fù)載隨著系統(tǒng)架構(gòu)的性能和復(fù)雜性而顯著增長。因此,更高分辨率的圖像和更復(fù)雜的算法被灌輸?shù)较到y(tǒng)中,隨著對(duì)人工智能處理的需求不斷增加,需要進(jìn)一步優(yōu)化以實(shí)現(xiàn)高 TOPS 性能。
Synopsys 發(fā)布了神經(jīng)處理單元 (NPU)、知識(shí)產(chǎn)權(quán) (IP) 內(nèi)核和工具鏈,以滿足 AI 片上系統(tǒng) (SoC) 中日益復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型的性能需求。其新的 DesignWare ARC NPX6 和 NPX6FS NPU IP 可處理實(shí)時(shí)計(jì)算的需求,同時(shí)為 AI 應(yīng)用消耗超低功耗。此外,該公司的新 MetaWare MX 開發(fā)工具提供了一個(gè)完整的編譯環(huán)境和自動(dòng)神經(jīng)網(wǎng)絡(luò)算法分區(qū),以最大限度地提高最新 NPU 上應(yīng)用軟件開發(fā)的資源效率。
使用新的 DesignWare ARC NPX6 和 NPX6FS NPU IP 以及 MetaWare MX 開發(fā)工具包,設(shè)計(jì)人員可以利用最新的神經(jīng)網(wǎng)絡(luò)模型,滿足不斷升級(jí)的性能預(yù)期,并加快其下一代智能 SoC 的上市時(shí)間。ARC NPX6 NPU IP 系列包括眾多處理深度學(xué)習(xí)算法覆蓋的產(chǎn)品,包括對(duì)象識(shí)別、圖像質(zhì)量增強(qiáng)和場(chǎng)景分割等計(jì)算機(jī)視覺任務(wù),以及音頻和自然語言處理等更大的人工智能應(yīng)用。設(shè)計(jì)中的單個(gè)內(nèi)核可以從 4K MAC 擴(kuò)展到 96K MAC,以實(shí)現(xiàn)超過 250 TOPS 的單個(gè) AI 引擎性能和超過 440 TOPS 的稀疏性。
NPX6 NPU IP 包含對(duì)多達(dá) 8 個(gè) NPU 的多 NPU 集群的硬件和軟件支持,稀疏度為 3500 TOPS。由于硬件和軟件中的高級(jí)帶寬功能以及內(nèi)存層次結(jié)構(gòu)(每個(gè)內(nèi)核中包含 L1 內(nèi)存和訪問通用 L2 內(nèi)存的高性能、低延遲連接),因此可以擴(kuò)展到大量 MAC 數(shù)量。對(duì)于受益于神經(jīng)網(wǎng)絡(luò)內(nèi)的 BF16 或 FP16 的應(yīng)用,提供了一個(gè)可選的張量浮點(diǎn)單元。
圖片來源:新思科技
MetaWare MX 開發(fā)工具包為應(yīng)用軟件開發(fā)提供軟件編程環(huán)境,包括神經(jīng)網(wǎng)絡(luò)軟件開發(fā)工具包 (NN SDK) 和虛擬模型支持。NN SDK 自動(dòng)將使用 Pytorch、Tensorflow 或 ONNX 等流行框架訓(xùn)練的神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換為 NPX 優(yōu)化的可執(zhí)行代碼。
其概念是,NPX6 NPU 處理器 IP 可隨后用于制造各種產(chǎn)品,從幾 TOPS 到數(shù)千 TOPS,所有這些都可以使用單個(gè)工具鏈編寫。
NPX6 NPU IP 的主要特點(diǎn):
可擴(kuò)展的實(shí)時(shí) AI/神經(jīng)處理器 IP,性能高達(dá) 3,500 TOPS,支持 CNN、RNN/LSTM、轉(zhuǎn)換器、推薦網(wǎng)絡(luò)和其他神經(jīng)網(wǎng)絡(luò)。
電源效率(高達(dá) 30 TOPS/W)在業(yè)界是無與倫比的。
1-24核卷積加速器,增加4K MAC/核
支持張量算子集架構(gòu)并允許變量激活 (TOSA) 的張量加速器
軟件開發(fā)套件
自動(dòng)混合模式量化工具
降低帶寬的架構(gòu)和軟件工具特性
通過并行處理各個(gè)層來減少延遲。
DesignWare ARC VPX 矢量 DSP 無縫集成。
生產(chǎn)力很高。MetaWare MX Development Toolkit 支持 Tensorflow 和 Pytorch 框架以及 ONNX 交換標(biāo)準(zhǔn)。
此外,ARC NPX6FS NPU IP 符合 ISO 26262 ASIL D 標(biāo)準(zhǔn),用于隨機(jī)硬件故障檢測(cè)和系統(tǒng)功能安全開發(fā)流程。這些處理器具有符合 ISO 26262 的特定安全機(jī)制,可處理下一代區(qū)域設(shè)計(jì)的混合關(guān)鍵性和虛擬化需求,以及完整的安全文檔。
ARC MetaWare MX 開發(fā)工具包包括神經(jīng)網(wǎng)絡(luò)軟件開發(fā)工具包 (SDK)、編譯器和調(diào)試器、虛擬平臺(tái) SDK、運(yùn)行時(shí)和庫以及高級(jí)仿真模型。它提供了一個(gè)統(tǒng)一的工具鏈環(huán)境來加速應(yīng)用程序開發(fā),并在 MAC 資源之間智能地劃分算法以進(jìn)行優(yōu)化處理。MetaWare MX 安全開發(fā)工具包包含安全手冊(cè)和安全指南,可幫助開發(fā)人員滿足 ISO 26262 標(biāo)準(zhǔn)并為安全關(guān)鍵型汽車應(yīng)用的 ISO 26262 合規(guī)性測(cè)試做準(zhǔn)備。
使用 NPU 集群加速邊緣 AI 應(yīng)用程序
為了滿足 AI 應(yīng)用日益增長的性能和復(fù)雜需求,NXP NPU IP 內(nèi)核提供了高性能、可擴(kuò)展的實(shí)時(shí) AI 和神經(jīng)處理 IP,高達(dá) 3500 TOPS 支持各種神經(jīng)網(wǎng)絡(luò),如 CNN、RNN/LSTM、變壓器、和推薦網(wǎng)絡(luò)。
此外,它通過并行處理各個(gè)層來減少延遲。此外,高效的 MetaWare MX 開發(fā)工具包支持 Tensorflow 和 Pytorch 框架以及 ONNX 交換格式。
審核編輯:郭婷
-
變壓器
+關(guān)注
關(guān)注
159文章
7529瀏覽量
136459 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4782瀏覽量
101232 -
AI
+關(guān)注
關(guān)注
87文章
31707瀏覽量
270489
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論