深度學(xué)習(xí)是一種關(guān)鍵的計算方法,它正在推動技術(shù)的發(fā)展——處理海量數(shù)據(jù)并發(fā)現(xiàn)人類永遠(yuǎn)無法自行辨別的微妙模式。但為了獲得最佳性能,深度學(xué)習(xí)算法需要得到正確的軟件編譯器和硬件組合的支持。特別是,允許根據(jù)需要靈活使用硬件資源進行計算的可重構(gòu)處理器是關(guān)鍵。
在最近的一項研究中,香港的研究人員報告了一種名為 ReAAP 的新型可重構(gòu)處理器,其性能優(yōu)于幾種常用于支持深度神經(jīng)網(wǎng)絡(luò) (DNN) 的計算平臺,深度學(xué)習(xí)是一種有用的形式,通常涉及具有許多計算密集型的大型數(shù)據(jù)集數(shù)據(jù)層。他們在 10 月 10 日發(fā)表在IEEE Transactions on Computers上的一篇論文中對其進行了描述。
在他們的研究中,研究人員將他們在 ReAAP 中提出的軟件編譯器與 Nvidia GPU 和 ARM CPU 上的其他三個基線軟件編譯器進行了比較。結(jié)果表明,它的執(zhí)行速度是運行在GPU并且是運行相同軟件編譯器的 1.6 到 3.3 倍在中央處理器上.
此外,Zheng 指出,ReAAP 為各種不同的計算密集層實現(xiàn)了硬件資源的持續(xù)高利用率。
雖然 ReAAP 擅長處理具有典型數(shù)據(jù)密集型工作負(fù)載的 DNN,但它目前不太適合在數(shù)據(jù)稀疏時支持 DNN。鄭說他的團隊希望在未來解決這個問題。更重要的是,研究人員希望以 ReAAP 為基礎(chǔ),使其能夠更好地處理量化數(shù)據(jù)(處理的數(shù)據(jù)以一種顯著降低神經(jīng)網(wǎng)絡(luò)的內(nèi)存需求和計算成本的方式)。
“在 [ReAAP 更好地處理量化數(shù)據(jù)] 的擴展完成和評估后,我們將考慮將其與其他幾個人工智能計算加速解決方案一起商業(yè)化,”鄭說,并指出這將使 ReAAP 在資源方面更有效率受限平臺,例如各種物聯(lián)網(wǎng) (IoT) 設(shè)備。
而普通處理器通常允許數(shù)據(jù)使用特定的硬件路徑進行處理,可重構(gòu)處理器提供了一種更具適應(yīng)性的選擇:重新配置最有效的硬件資源以根據(jù)需要處理數(shù)據(jù)。
“可重構(gòu)處理器結(jié)合了軟件靈活性和硬件并行性的優(yōu)勢,”參與該研究的香港科技大學(xué)電子與計算機工程系博士后研究員鄭建偉解釋道。
這些優(yōu)勢促使他的團隊創(chuàng)建了 ReAAP,這是一個集成的軟硬件系統(tǒng)。它的軟件編譯器負(fù)責(zé)評估和優(yōu)化各種深度學(xué)習(xí)工作負(fù)載。一旦確定了并行處理數(shù)據(jù)的最佳解決方案,它就會發(fā)送指令重新配置硬件協(xié)處理器,從而分配適當(dāng)?shù)挠布Y源來進行并行計算?!白鳛槎说蕉讼到y(tǒng),ReAAP 可以部署以加速各種深度學(xué)習(xí)應(yīng)用程序,只需在 [the] 軟件中為每個應(yīng)用程序定制一個 Python 腳本,”Zheng 解釋說。
審核編輯 :李倩
-
處理器
+關(guān)注
關(guān)注
68文章
19440瀏覽量
231321 -
AI
+關(guān)注
關(guān)注
87文章
31711瀏覽量
270510 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1209瀏覽量
24850
原文標(biāo)題:一種讓AI更快的可重構(gòu)處理器
文章出處:【微信號:芯長征科技,微信公眾號:芯長征科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
基于相變材料的可重構(gòu)超構(gòu)表面用于圖像處理
![基于相變材料的<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>超構(gòu)表面用于圖像<b class='flag-5'>處理</b>](https://file1.elecfans.com/web2/M00/0C/5E/wKgaomc0DzWAZaypAAAcwdbARO8329.jpg)
BitEnergy AI公司開發(fā)出一種新AI處理方法
對稱多處理器的特點是什么
對稱多處理器和非對稱多處理器的區(qū)別
英特爾?至強?可擴展處理器助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型
![英特爾?至強?<b class='flag-5'>可</b>擴展<b class='flag-5'>處理器</b>助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型](https://file1.elecfans.com/web2/M00/09/75/wKgaomb4xg2AIxy4AAHdkJ2buX8621.jpg)
AMD推出全新銳龍AI 300系列處理器
![AMD推出全新銳龍<b class='flag-5'>AI</b> 300系列<b class='flag-5'>處理器</b>](https://file1.elecfans.com/web2/M00/07/C5/wKgaombrkvKAYe0gAAInnAEUPOQ722.png)
ARM處理器的結(jié)構(gòu)和特點
下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI中更快的嵌入處理
![下<b class='flag-5'>一</b>代高功能新<b class='flag-5'>一</b>代<b class='flag-5'>AI</b>加速<b class='flag-5'>器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級<b class='flag-5'>AI</b>系統(tǒng)高級<b class='flag-5'>AI</b>中<b class='flag-5'>更快</b>的嵌入<b class='flag-5'>處理</b>](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
![](https://file1.elecfans.com/web2/M00/00/C5/wKgaomaq4k2AeltDAAYu30jwc94475.png)
評論