欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Xilinx Zynq系列FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)中相關(guān)資源評(píng)估

FPGA之家 ? 來(lái)源:FPGA之家 ? 作者:FPGA之家 ? 2022-04-07 11:31 ? 次閱讀

0Zynq7000系列概覽

94155fe2-b5e8-11ec-aa7f-dac502259ad0.png

1內(nèi)存占用

1.1 FPGA程序中內(nèi)存的實(shí)現(xiàn)方式

參閱xilinx文檔UG998

942dedb4-b5e8-11ec-aa7f-dac502259ad0.png

FPGA并沒有像軟件那樣用已有的cache,F(xiàn)PGA的HLS編譯器會(huì)在FPGA中創(chuàng)建一個(gè)快速的memory architecture以最好的適應(yīng)算法中的數(shù)據(jù)樣式(data layout)。因此FPGA可以有相互獨(dú)立的不同大小的內(nèi)部存儲(chǔ)空間,例如寄存器,移位寄存器,F(xiàn)IFOs和BRAMs。

寄存器:最快的內(nèi)存結(jié)構(gòu),集成在在運(yùn)算單元之中,獲取不需要額外的時(shí)延。

移位寄存器:可以被當(dāng)作一個(gè)數(shù)據(jù)序列,每一個(gè)數(shù)據(jù)可以在不同的運(yùn)算之中被重復(fù)使用。將其中所有數(shù)據(jù)移動(dòng)到相鄰的存儲(chǔ)設(shè)備中只需要一個(gè)時(shí)鐘周期。

FIFO:只有一個(gè)輸入和輸出的數(shù)據(jù)序列,通常被用于循環(huán)或循環(huán)函數(shù),細(xì)節(jié)會(huì)被HLS編譯器處理。

BRAM:集成在FPGA fabric模塊中的RAM,每個(gè)xilinx的FPGA中集成有多個(gè)這樣的BRAM??梢员划?dāng)作有以下特性的cache:1.不支持像處理器cache中那樣的緩存一致性(cache coherency,collision),不支持處理器中的一些邏輯類型。2.只在設(shè)備有電時(shí)保持內(nèi)存。3.不同的BRAM塊可以同時(shí)傳輸數(shù)據(jù)。

1.2Zynq的BRAM內(nèi)存大小

94409540-b5e8-11ec-aa7f-dac502259ad0.png

zynq 7z020的BRAM為4.9Mb,7z035的BRAM為17.6Mb(2.2MB)

9451e96c-b5e8-11ec-aa7f-dac502259ad0.png

1.3一個(gè)卷積操作占用的內(nèi)存

例如,我們實(shí)現(xiàn)的卷積函數(shù),輸入27×600,卷積核16×27,輸出16×600,數(shù)據(jù)類型為float。

  //convolution operation

for (i = 0; i < 16; i++) {

    for (j = 0; j < 600; j++) {

      result = 0;

      for (k = 0; k < 27; k++) {

        temp = weights[i*27+k] * buf_in[k*600+j];

        result += temp;

      }

      buf_out[i*600+j] = result;

    }

  }


在HLS中生成的IPcore占用硬件資源為:

94768290-b5e8-11ec-aa7f-dac502259ad0.png

948c8400-b5e8-11ec-aa7f-dac502259ad0.png

9499078e-b5e8-11ec-aa7f-dac502259ad0.png

在vivado中搭建好系統(tǒng),占用的資源為:

94a95382-b5e8-11ec-aa7f-dac502259ad0.png

94b7ea3c-b5e8-11ec-aa7f-dac502259ad0.png

2PipeCNN可實(shí)現(xiàn)性

PipeCNN是一個(gè)基于OpenCL的FPGA實(shí)現(xiàn)大型卷積網(wǎng)絡(luò)的加速器。

PipeCNN解析文檔:

PipeCNN論文解析:用OpenCL實(shí)現(xiàn)FPGA上的大型卷積網(wǎng)絡(luò)加速

github地址:https://github.com/doonny/PipeCNN#how-to-use

2.1 已實(shí)現(xiàn)的PipeCNN資源消耗

對(duì)于Altera FPGA,運(yùn)用Intel's OpenCL SDKv16.1 toolset.

對(duì)于Xilinx FPGAs, theSDAcceldevelopment environment v2017.2 can be used.

94c7cd1c-b5e8-11ec-aa7f-dac502259ad0.png

Xilinx'sKCU1500(XCKU115 FPGA)(已經(jīng)有xilin的板子實(shí)現(xiàn)過pipeCNN,但是型號(hào)比zynq高很多)

94e36eaa-b5e8-11ec-aa7f-dac502259ad0.png

硬件資源可以被三個(gè)宏調(diào)控,device/hw_param.cl. Change the following macros

  • VEC_SIZE

  • LANE_NUM

  • CONV_GP_SIZE_X

消耗資源為:

94f89c80-b5e8-11ec-aa7f-dac502259ad0.png

95070432-b5e8-11ec-aa7f-dac502259ad0.png

3實(shí)現(xiàn)大型神經(jīng)網(wǎng)絡(luò)的方法

方案一:壓縮模型到<2.2MB,可實(shí)現(xiàn)在BRAM中

優(yōu)點(diǎn):1.速度快 2.實(shí)現(xiàn)方便

缺點(diǎn):1.模型壓縮難度 2.難以實(shí)現(xiàn)大型網(wǎng)絡(luò)

方案二:用FPGA調(diào)用DDR

優(yōu)點(diǎn):1.速度中等 2.可實(shí)現(xiàn)大型網(wǎng)絡(luò)

缺點(diǎn):調(diào)用DDR有難度,開發(fā)周期長(zhǎng)

方案三:用片上單片機(jī)調(diào)用DDR(插入SD卡)分包傳入IPcore運(yùn)算

優(yōu)點(diǎn):可實(shí)現(xiàn)大型網(wǎng)絡(luò)

缺點(diǎn):速度較慢

4Virtex-7高端FPGA概覽

Virtex-7為高端FPGA,比Zynq高了一個(gè)檔次。

951bc20a-b5e8-11ec-aa7f-dac502259ad0.png

952c0bc4-b5e8-11ec-aa7f-dac502259ad0.png

7系列FPGA相關(guān)文檔:

95392c3c-b5e8-11ec-aa7f-dac502259ad0.png

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1630

    文章

    21803

    瀏覽量

    606455
  • 寄存器
    +關(guān)注

    關(guān)注

    31

    文章

    5372

    瀏覽量

    121314
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4785

    瀏覽量

    101246

原文標(biāo)題:Xilinx Zynq系列FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)中相關(guān)資源評(píng)估

文章出處:【微信號(hào):zhuyandz,微信公眾號(hào):FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    FPGA程序內(nèi)存的實(shí)現(xiàn)方式

    ? ? Xilinx zynq系列FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)評(píng)估
    發(fā)表于 07-10 09:24 ?2052次閱讀

    脈沖耦合神經(jīng)網(wǎng)絡(luò)FPGA上的實(shí)現(xiàn)誰(shuí)會(huì)?

    脈沖耦合神經(jīng)網(wǎng)絡(luò)(PCNN)在FPGA上的實(shí)現(xiàn),實(shí)現(xiàn)數(shù)據(jù)分類功能,有報(bào)酬。QQ470345140.
    發(fā)表于 08-25 09:57

    【PYNQ-Z2申請(qǐng)】基于PYNQ的神經(jīng)網(wǎng)絡(luò)自動(dòng)駕駛小車

    ,分享項(xiàng)目的開展,實(shí)施過程,結(jié)果,展示項(xiàng)目結(jié)果,并全程開源項(xiàng)目源碼。本人一直非常希望學(xué)習(xí)與實(shí)踐Xilinx Zynq系列FPGA芯片與基于FPGA
    發(fā)表于 12-19 11:36

    【PYNQ-Z2試用體驗(yàn)】基于PYNQ的神經(jīng)網(wǎng)絡(luò)自動(dòng)駕駛小車 - 項(xiàng)目規(guī)劃

    小車運(yùn)動(dòng)的控制信號(hào),實(shí)現(xiàn)小車自動(dòng)駕駛。在初步實(shí)現(xiàn)方案,為了快速實(shí)現(xiàn)整體功能,使用軟件神經(jīng)網(wǎng)絡(luò)作為控制器,使用單片機(jī)作為底盤電機(jī)的控制器。在
    發(fā)表于 03-02 23:10

    基于賽靈思FPGA的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)設(shè)計(jì)

    FPGA實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò) (CNN)。CNN 是一類深度神經(jīng)網(wǎng)絡(luò),在處理大規(guī)模圖像識(shí)別任務(wù)以及與機(jī)器學(xué)習(xí)類似的其他問題方面已大獲成功。在當(dāng)前案例
    發(fā)表于 06-19 07:24

    如何設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)圖像壓縮算法?

    (Digital Signal Processor)相比,現(xiàn)場(chǎng)可編程門陣列(Field Programma-ble Gate Array,FPGA)在神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)上更具優(yōu)勢(shì)。DSP處理器在處理時(shí)采用指令順序執(zhí)行
    發(fā)表于 08-08 06:11

    如何移植一個(gè)CNN神經(jīng)網(wǎng)絡(luò)FPGA?

    )第二步:使用Lattice sensAI 軟件編譯已訓(xùn)練好的神經(jīng)網(wǎng)絡(luò),定點(diǎn)化網(wǎng)絡(luò)參數(shù)。該軟件會(huì)根據(jù)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和預(yù)設(shè)的FPGA資源進(jìn)行分析
    發(fā)表于 11-26 07:46

    基于FPGA神經(jīng)網(wǎng)絡(luò)的性能評(píng)估及局限性

    FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)關(guān)鍵問題分析基于FPGA的ANN實(shí)現(xiàn)方法基于FPGA
    發(fā)表于 04-30 06:58

    EdgeBoard神經(jīng)網(wǎng)絡(luò)算子在FPGA實(shí)現(xiàn)方法是什么?

    FPGA加速的關(guān)鍵因素是什么?EdgeBoard神經(jīng)網(wǎng)絡(luò)算子在FPGA實(shí)現(xiàn)方法是什么?
    發(fā)表于 09-28 06:37

    FPGA實(shí)現(xiàn)大型神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)

    1、加速神經(jīng)網(wǎng)絡(luò)的必備開源項(xiàng)目  到底純FPGA適不適合這種大型神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)?這個(gè)問題其實(shí)我們不適合回答,但是FPGA廠商是的實(shí)際操作是很有權(quán)威性的,現(xiàn)在不論是Intel還是
    發(fā)表于 10-24 16:10

    Xilinx Zynq系列FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)相關(guān)資源評(píng)估

    集成在FPGA fabric模塊的RAM,每個(gè)xilinxFPGA中集成有多個(gè)這樣的BRAM??梢员划?dāng)作有以下特性的cache:1.不支持像處理器cache
    的頭像 發(fā)表于 03-30 10:29 ?1903次閱讀
    <b class='flag-5'>Xilinx</b> <b class='flag-5'>Zynq</b><b class='flag-5'>系列</b><b class='flag-5'>FPGA</b><b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b><b class='flag-5'>中</b><b class='flag-5'>相關(guān)</b><b class='flag-5'>資源</b><b class='flag-5'>評(píng)估</b>

    如何用OpenCL實(shí)現(xiàn)FPGA上的大型卷積網(wǎng)絡(luò)加速?

    Xilinx zynq系列FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)評(píng)估
    的頭像 發(fā)表于 04-19 11:12 ?2651次閱讀
    如何用OpenCL<b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>FPGA</b>上的大型卷積<b class='flag-5'>網(wǎng)絡(luò)</b>加速?

    基于FPGA的RBF神經(jīng)網(wǎng)絡(luò)硬件實(shí)現(xiàn)

    基于FPGA的RBF神經(jīng)網(wǎng)絡(luò)硬件實(shí)現(xiàn)說(shuō)明。
    發(fā)表于 04-28 11:24 ?26次下載

    基于FPGA神經(jīng)網(wǎng)絡(luò)硬件實(shí)現(xiàn)方法

    基于FPGA神經(jīng)網(wǎng)絡(luò)硬件實(shí)現(xiàn)方法說(shuō)明。
    發(fā)表于 06-01 09:35 ?37次下載
    基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>硬件<b class='flag-5'>實(shí)現(xiàn)</b>方法

    如何在FPGA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)

    可編程門陣列(FPGA)作為一種靈活、高效的硬件實(shí)現(xiàn)方式,為神經(jīng)網(wǎng)絡(luò)的加速提供了新的思路。本文將從FPGA實(shí)現(xiàn)
    的頭像 發(fā)表于 07-10 17:01 ?2364次閱讀