欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>硬件即代碼第三部分:空間與時間

硬件即代碼第三部分:空間與時間

2023-06-14 | zip | 0.00 MB | 次下載 | 免費

資料介紹

描述

在本周的部分中,一切都與性能有關。FPGA 的常見用途之一是提高速度和/或能源效率方面的性能。這部分是通過 1) 消除指令的解釋開銷,2) 消除中央內(nèi)存瓶頸,以及 3) 指令級并行性來實現(xiàn)的。

如果您是本系列的新手,您可能想返回到Hardware-as-Code Part I 。

示例 1 的性能

在第二部分中,我們生成了以下簡單功能的硬件實現(xiàn):

int16_t calc(int16_t x) {
  return 7 * x - 15;
}

讓我們仔細看看這個函數(shù)作為在 CPU 上執(zhí)行的軟件和作為 FPGA 上的自定義硬件函數(shù)的性能。首先,考慮用于在 CPU 上執(zhí)行此功能的能量。典型的小型 CPU 將由以下功能硬件塊組成:

  • 1.取指令
  • 2.指令解碼
  • 3. 內(nèi)存參數(shù)獲取
  • 4.執(zhí)行指令
  • 5. 寫回結果

其中前兩個被 FPGA 功能完全消除。這些純粹是 CPU 模型所需的解釋開銷。3 號和 4 號專用于中央存儲器模型所需的數(shù)據(jù)移動。FPGA 通常不需要外部存儲器,這將再次完全消除開銷。4 號是 CPU 中唯一實際執(zhí)行特定應用功能的部分。然而,所有這些單元在整個程序執(zhí)行過程中都在不斷地消耗能量。此外,外部存儲器也消耗大量電力。

執(zhí)行時間呢?讓我們估計一下在小型 CPU 上執(zhí)行可能需要的周期數(shù):

  • 將 x 加載到寄存器中(2 個周期)
  • 將第一個常數(shù)加載到寄存器中(1 個周期)
  • 乘法(1 個周期)
  • 將第二個常數(shù)加載到寄存器中(1 個周期)
  • 添加(1個周期)
  • 將結果存儲到內(nèi)存(2 個周期)

總共8個周期!當然,對于具有更大指令集和更復雜指令的 CPU,您可能可以使用更少的指令,但這些通常需要更多的周期。因此,假設 4-8 個周期。

現(xiàn)在對于 FPGA 實現(xiàn),我們有一個執(zhí)行乘法和加法的單周期電路。這就像有一個專門為這個應用程序構建的自定義指令。值通過寄存器傳遞,沒有內(nèi)存訪問。CPU 有時可以利用寄存器來傳遞值,但通常只有少數(shù)可用。此外,許多函數(shù)需要堆棧內(nèi)存來存儲局部變量和臨時值。

不服氣?讓我們稍微擴展第一個例子來解決一個現(xiàn)實世界的問題,看看它是如何比較的。

機器學習分類示例

分類是機器學習執(zhí)行的一項非常常見的任務。分類任務是根據(jù)您擁有的一些數(shù)據(jù)將某事物分類為 2 個或更多類。例如,根據(jù)附在風扇上的一些振動傳感器數(shù)據(jù),將其分類為工作或不工作(電機故障/螺旋槳卡住)。

讓我們根據(jù)兩個測量值將一些數(shù)據(jù)簡單地分類為兩個類別。下圖顯示了許多具有已知類別的對象的測量數(shù)據(jù)。

pYYBAGNYgAWALy9aAAA4vNITZAU787.png
?

每個點代表一個示例對象的兩個測量值,顏色代表該對象的已知類別。目標是,根據(jù)一個新對象的兩個值(x,y),預測它是在橙色類還是藍色類中。從圖中可以看出,橙色的類對象都在綠線和藍線的左側。藍色類對象都在一條或兩條線的右側。

讓我們實現(xiàn)一個簡單的預測函數(shù),它只測試一個新點是否在兩條線的左側:

poYBAGNYgAiAFNs-AADqxxvCru0968.png
?

此代碼也可從 git repo 獲得:文件夾中的https://github.com/sathibault/hac-examples.git 。poly-classify

繼續(xù)classify 在您的計算機和 FPGA 板上構建和測試此功能(如果您需要查看它是如何完成的,請返回第 II 部分)。您應該看到如下輸出:

poly-classify>.\program
classify(7, 82) = 1
classify(5, 100) = 1
classify(10, 70) = 0
classify(15, 100) = 0

輸出 1 表示該點位于兩條線的左側,預測的類為橙色。否則,預測類別為藍色。

我選擇這個例子是因為它很容易解釋,并且非常代表當今使用的非常成功的神經(jīng)網(wǎng)絡所需的計算。

指令級并行

除了消除中央內(nèi)存瓶頸和 CPU 的解釋開銷外,定制硬件還支持高級別的指令級并行性。對于第二個示例,為classify函數(shù)生成的硬件如下所示:

poYBAGNYgAqAQdwwAAAxCkoZSM0362.png
?

如您所見,每個方程都有自己專用的乘法器和加法器。盡管相對于第一個示例,我們所做的工作量增加了四倍,但整個函數(shù)仍然在一個周期內(nèi)執(zhí)行!通常對應于 CPU 上的許多指令并按順序執(zhí)行的功能可以并行執(zhí)行。試著估計一下我的指令/周期這個函數(shù)在 CPU 上需要多少。

我真的在強調(diào) CPU 方法的負面影響,但對于 FPGA 來說,這并不全是玫瑰。我們可以在速度和功耗方面取得一些顯著的進步,但缺點是它占用了物理空間。上圖中的每個模塊都占用了 FPGA 上的空間。隨著函數(shù)的增長,它將占用的空間量也會增加,并且可用的空間有限。雖然空間也可能是微控制器程序存儲器的一個問題,但 FPGA 的空間限制通常更加有限。我們將在下一期中更詳細地研究空間使用情況。

下一步

到目前為止,我們一直在研究簡單的直線代碼示例。下一次,我們將看看循環(huán)和數(shù)組的使用。

繼續(xù)第四部分:嵌入式 RAM

連接

在我發(fā)布新的分期付款時,請關注我以保持最新狀態(tài)。還有一個 Discord 服務器(公共聊天平臺),用于您在https://discord.gg/3sA7FHayGH上可能有的任何評論、問題或討論


下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關電源設計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數(shù)字電路基礎pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅動電路設計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費