欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思AI引擎簡介

YCqV_FPGA_EETre ? 來源:FPGA開發(fā)圈 ? 2020-09-03 09:35 ? 次閱讀

Versal ACAP 簡介

Versal 自適應(yīng)計算加速平臺 (ACAP) 是基于 TSMC 7nm FinFET 工藝技術(shù)構(gòu)建的最新一代賽靈思器件。它利用高帶寬片上網(wǎng)絡(luò) (NoC) 將代表處理器系統(tǒng) (PS) 的標(biāo)量引擎、代表可編程邏輯 (PL) 的自適應(yīng)引擎與智能引擎有機(jī)結(jié)合在一起。

本文將著重介紹智能引擎中所包含的 AI 引擎。

賽靈思 AI 引擎簡介

在部分賽靈思 Versal ACAP 中包含了 AI 引擎。這些 AI 引擎可排列組合為一組與內(nèi)存、數(shù)據(jù)流和級聯(lián)接口相連的二維AI 引擎拼塊陣列。在當(dāng)前 ACAP 器件(例如,VC1902 器件)上,此陣列最多可包含 400 個拼塊。此陣列中還包含AI 引擎接口(位于最后一行),以便于陣列中的其它器件(PS、PL 和 NoC)進(jìn)行交互。

AI 引擎接口包含PL 和 NoC 接口拼塊以及配置拼塊。從 PL 到 AI 引擎陣列的連接是使用 AXI4-Stream 接口通過 PL 和 NoC 接口拼塊來實現(xiàn)的。從 NoC 到 AI 引擎陣列的連接是使用 AXI4 存儲器映射接口通過 NoC 接口拼塊來實現(xiàn)的。

有趣的是,從中可以看到,只有在 NoC 到 AI 引擎拼塊之間才存在 AXI4 存儲器映射直接通信通道,在 AI 引擎拼塊到 NoC 之間卻并不存在。

注:PL 和 NoC 接口拼塊的精確數(shù)量因器件而異?!禫ersal 架構(gòu)和產(chǎn)品數(shù)據(jù)手冊:簡介》(DS950)中羅列了 AI 引擎陣列的大小。

https://china.xilinx.com/support/documentation/data_sheets/ds950-versal-overview.pdf

AI 引擎拼塊架構(gòu)

現(xiàn)在,我們來詳細(xì)了解下此陣列,看看 AI 引擎拼塊的內(nèi)部。

每個 AI 引擎拼塊都包含:

1 個拼塊互連模塊,用于處理 AXI4-Stream 和存儲器映射 AXI4 輸入/輸出

1 個存儲器模塊,其中包含 32 KB 數(shù)據(jù)內(nèi)存,細(xì)分為 8 個內(nèi)存 bank、1 個內(nèi)存接口、DMA 和各種鎖定。

1 個 AI 引擎

AI 引擎可訪問全部 4 個方向中的多達(dá) 4 個內(nèi)存模塊(作為 1 個連續(xù)存儲器塊)。這意味著除了拼塊本地的內(nèi)存,AI 引擎還可以訪問 3 個相鄰拼塊的本地內(nèi)存(除非拼塊位于陣列邊緣)。

北側(cè)內(nèi)存模塊

南側(cè)內(nèi)存模塊

東側(cè)或西側(cè)內(nèi)存模塊(取決于 AI 引擎和內(nèi)存模塊所在的行和相對布局)。

AI 引擎架構(gòu)

AI 引擎屬于高度優(yōu)化的處理器,包含下列主要特色:

32 位標(biāo)量 RISC 處理器(名為 Scalar Unit)

1 個 512b SIMD 矢量單元(可提供矢量定點/整數(shù)單元)和 1 個單精度浮點 (SPFP) 矢量單元

3 個地址生成器單元 (AGU)

超長指令字 (VLIW) 功能

3 個數(shù)據(jù)內(nèi)存端口(2 個負(fù)載端口,1 個存儲端口)

直接流傳輸接口(2 個輸入流,2 個輸出流)

AI 引擎陣列編程

AI 引擎拼塊按 10 或 100 為單位組成陣列。創(chuàng)建嵌入多項指令的單一程序用于指定并行性將是一項冗長且近乎不可能的任務(wù)。因此 AI 引擎陣列模型編程與 Kahn 處理網(wǎng)絡(luò) (Kahn Process Networks) 之間的共通之處在于自主計算進(jìn)程通過通信邊緣實現(xiàn)彼此互連,從而生成處理網(wǎng)絡(luò)。

(請參閱https://perso.ensta-paris.fr/~chapoutot/various/kahn_networks.pdf)

在 AI 引擎框架中,Graph 邊緣是緩存和數(shù)據(jù)流,而計算進(jìn)程則被稱為內(nèi)核。在Graph中,內(nèi)核經(jīng)過例化,彼此相連并連接到設(shè)計其余部分(NoC 或 PL)。

編程流程分為 2 個階段:

單內(nèi)核編程:

內(nèi)核用于描述特定計算進(jìn)程。每個內(nèi)核都將在單一 AI 引擎拼塊上運(yùn)行。但請注意,多個內(nèi)核可在同一個 AI 引擎拼塊上運(yùn)行,并共享處理時間。任意 C/C++ 代碼均可用于對 AI 引擎進(jìn)行編程。標(biāo)量處理器將處理大部分代碼。如果您的目標(biāo)是設(shè)計高性能內(nèi)核,那么應(yīng)考慮采用矢量處理器,它使用稱為內(nèi)部函數(shù)的專用函數(shù)。這些函數(shù)專用于 AI 引擎的矢量處理器,支持您從 AI 引擎中發(fā)掘出巨大的處理性能。賽靈思將提供預(yù)構(gòu)建內(nèi)核(包含在庫內(nèi)),以供用戶在其定制 Graph 中使用。

Graph 編程:

賽靈思將提供 C++ 框架以從內(nèi)核創(chuàng)建Graph。此框架包含 Graph 節(jié)點和連接聲明。這些節(jié)點可包含在 AI 引擎陣列內(nèi)或可編程邏輯(HLS 內(nèi)核)中。為了完全掌握內(nèi)核位置,將有一系列方法可用來約束布局(內(nèi)核、緩存、系統(tǒng)內(nèi)存等)。Graph 將例化并使用緩存和數(shù)據(jù)流將內(nèi)核連接在一起。它還將描述 AI 引擎陣列與其它ACAP 器件(PL 或 DDR)之間的雙向往來數(shù)據(jù)傳輸。

賽靈思將提供預(yù)構(gòu)建 Graph(包含在庫內(nèi)),以供用戶在其應(yīng)用中使用。

在運(yùn)行時以及仿真期間,AI 引擎應(yīng)用由 PS 進(jìn)行控制。

賽靈思將根據(jù)應(yīng)用的操作系統(tǒng)提供多種 API,如下所述。

Xilinx Run Time (XRT) 和 OpenCL,適用于 Linux 應(yīng)用

裸機(jī)驅(qū)動程序

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能引擎
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    7129
  • 處理器系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    7824
  • Versal
    +關(guān)注

    關(guān)注

    1

    文章

    163

    瀏覽量

    7718

原文標(biāo)題:【工程師必看】 Versal ACAP AI 引擎入門

文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    什么是AI查詢引擎

    AI 查詢引擎可高效處理、存儲和檢索大量數(shù)據(jù),以增強(qiáng)生成式 AI 模型的輸入。
    的頭像 發(fā)表于 01-10 10:00 ?212次閱讀

    低溫失效的原因,有沒有別的方法或者一些見解?

    低溫失效的原因,有沒有別的方法或者一些見解。就是芯片工作溫度在100°--40°區(qū)間,然后呢我們到了0°以下就不工作了,然后在低溫的情況下監(jiān)測了電流和電壓都正常,頻率也都正常,頻率不是FPGA的頻率是晶振的頻率,焊接的話七
    發(fā)表于 12-30 16:28

    FPGA產(chǎn)品的主要特點

    近年來,全球半導(dǎo)體供應(yīng)鏈屢受挑戰(zhàn),芯片短缺問題一度對行業(yè)產(chǎn)生深遠(yuǎn)影響。易通過優(yōu)化供應(yīng)鏈管理、強(qiáng)化產(chǎn)能規(guī)劃,確??蛻舻腇PGA需求得到及時滿足。面向工業(yè)控制、機(jī)器視覺、醫(yī)療影像、消費(fèi)電子、汽車智駕等一眾終端領(lǐng)域,易
    的頭像 發(fā)表于 12-04 14:20 ?699次閱讀
    易<b class='flag-5'>靈</b><b class='flag-5'>思</b>FPGA產(chǎn)品的主要特點

    使用 AMD Versal AI 引擎釋放 DSP 計算的潛力

    “Versal AI 引擎可以在降低功耗預(yù)算的情況下提高 DSP 計算密度,”高級產(chǎn)品營銷經(jīng)理 Udayan Sinha 表示。這種效率使 Versal AI 引擎能夠在嚴(yán)格的功耗預(yù)算
    的頭像 發(fā)表于 11-29 14:07 ?675次閱讀

    快手“可AI”軟件著作權(quán)獲批

    近日,天眼查知識產(chǎn)權(quán)信息顯示,北京快手科技有限公司自主研發(fā)的“可AI”軟件著作權(quán)已成功獲得登記批準(zhǔn),版本號確定為V1.0。這一消息標(biāo)志著快手在人工智能領(lǐng)域的技術(shù)研發(fā)取得了新的進(jìn)展。 據(jù)公開資料顯示
    的頭像 發(fā)表于 11-29 13:50 ?462次閱讀

    使用AMD Versal AI引擎加速高性能DSP應(yīng)用

    AMD Versal AI 引擎使您能夠擴(kuò)展數(shù)字信號處理( DSP )算力與面向未來的設(shè)計,從而適應(yīng)當(dāng)前和下一代計算密集型 DSP 應(yīng)用。借助 Versal AI 引擎,客戶能以更低的
    的頭像 發(fā)表于 11-20 16:35 ?428次閱讀

    戴爾越14龍采用第二代AMD AI PC處理器

    2024年,如果你想購入一臺用于學(xué)習(xí)、辦公、輕創(chuàng)作、輕游戲的高性價比全能AI PC,戴爾越14「龍」全戰(zhàn)力AMD輕薄本可以滿足你的需求。
    的頭像 發(fā)表于 09-20 15:36 ?639次閱讀

    AI引擎機(jī)器學(xué)習(xí)陣列指南

    AMD Versal AI Core 系列和 Versal AI Edge 系列旨在憑借 AI 引擎機(jī)器學(xué)習(xí) ( ML ) 架構(gòu)來提供突破性的 AI
    的頭像 發(fā)表于 09-18 09:16 ?482次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>機(jī)器學(xué)習(xí)陣列指南

    快訊 | 發(fā)展新質(zhì)生產(chǎn)力問道如何下好“創(chuàng)新棋”?

    7月11日,南湖區(qū)委宣傳部、清華大學(xué)馬克主義學(xué)院共同帶隊一行蒞臨圍繞時頻新質(zhì)生產(chǎn)力創(chuàng)新層面進(jìn)行實地調(diào)研,副總經(jīng)理田永和、對外合作部
    的頭像 發(fā)表于 07-12 13:31 ?502次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>快訊 | 發(fā)展新質(zhì)生產(chǎn)力問道<b class='flag-5'>賽</b><b class='flag-5'>思</b>?<b class='flag-5'>賽</b><b class='flag-5'>思</b>如何下好“創(chuàng)新棋”?

    FPGA下載問題

    在ARM開發(fā)中,通??晒┻x擇的下載器有多種。清華的FPGA,除了官方的專用下載器,有其他的下載器可以使用嗎?使用下載器可以嗎?
    發(fā)表于 06-23 12:28

    快訊 | 熱烈歡迎嘉興市政協(xié)一行領(lǐng)導(dǎo)蒞臨總部調(diào)研指導(dǎo)工作!

    近日,嘉興市政協(xié)一行領(lǐng)導(dǎo)蒞臨總部調(diào)研指導(dǎo)工作,副總經(jīng)理王文濤、田永和全程陪同。嘉興市政協(xié)一行領(lǐng)導(dǎo)蒞臨
    的頭像 發(fā)表于 05-17 13:22 ?527次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>快訊 | 熱烈歡迎嘉興市政協(xié)一行領(lǐng)導(dǎo)蒞臨<b class='flag-5'>賽</b><b class='flag-5'>思</b>總部調(diào)研指導(dǎo)工作!

    FPGA flash操作原理

    FPGA flash操作原理分享
    的頭像 發(fā)表于 04-09 15:03 ?1088次閱讀

    勒科技新型高性能800G硅光引擎即將亮相OFC 2024

    南通勒光電科技有限公司(簡稱“勒科技”)在近日重磅推出了專為AI集群和數(shù)據(jù)中心設(shè)計的新一代產(chǎn)品——新型高性能800G硅光引擎。這款備受矚目的創(chuàng)新產(chǎn)品即將在盛大的2024年度光纖通信
    的頭像 發(fā)表于 03-22 10:07 ?983次閱讀

    勒科技聯(lián)合劍橋科技發(fā)布新型800G硅光引擎

    南通勒光電科技有限公司,業(yè)界簡稱“勒科技”,近日正式揭曉了其專為AI集群和數(shù)據(jù)中心量身打造的新一代產(chǎn)品——高性能800G硅光引擎。這款創(chuàng)新產(chǎn)品即將在美國圣地亞哥的年度盛事——202
    的頭像 發(fā)表于 03-22 10:00 ?1025次閱讀

    開放原子開源大賽—基于OpenHarmony的團(tuán)結(jié)引擎應(yīng)用開發(fā)正式啟動!

    “基于OpenHarmony的團(tuán)結(jié)引擎應(yīng)用開發(fā)”是開放原子全球開源大賽下開設(shè)的新興及應(yīng)用題之一,本次題旨在鼓勵更多開發(fā)者基于Ope
    發(fā)表于 03-13 10:45