欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡(jiǎn)要分析AI芯片的性能分析和應(yīng)用介紹

lC49_半導(dǎo)體 ? 來(lái)源:djl ? 2019-09-05 09:49 ? 次閱讀

各大半導(dǎo)體廠商紛紛發(fā)布了人工智能相關(guān)產(chǎn)品。九月初,先是華為的麒麟970集成了寒武紀(jì)的人工智能加速器IP。之后,蘋(píng)果在其發(fā)布會(huì)上展示了新一代的A11 Bionic SoC,其中集成了neural engine加速器。Imagination也不甘落后,在蘋(píng)果之后也發(fā)布了PowerVR NNA神經(jīng)網(wǎng)絡(luò)處理器IP。九月底,Nvidia的開(kāi)源深度學(xué)習(xí)加速器(DLA)正式上線,幾乎與之同時(shí),Intel也公布了Loihi芯片。本文將盤(pán)點(diǎn)以上幾款產(chǎn)品,分析異同。

華為、蘋(píng)果、Imagination:面向手機(jī)的成熟產(chǎn)品發(fā)布,移動(dòng)端AI時(shí)代的敲門(mén)磚

2016年初,以Eyeriss為代表的深度學(xué)習(xí)加速器芯片乘著人工智能興起的東風(fēng)紛紛破土而出。目前基于深度學(xué)習(xí)的人工智能算法需要很大的計(jì)算量,而傳統(tǒng)CPU芯片上用于計(jì)算的ALU數(shù)目并不多,性能不足以支持深度學(xué)習(xí)算法的流暢執(zhí)行。

另外,GPU雖然在云端服務(wù)器獲得大規(guī)模應(yīng)用,但是一方面GPU架構(gòu)的功耗太大,無(wú)法在移動(dòng)端廣泛使用;另一方面GPU最適合的是深度學(xué)習(xí)訓(xùn)練,在深度學(xué)習(xí)的推理應(yīng)用中因?yàn)镚PU基于batch運(yùn)算的模式導(dǎo)致延遲過(guò)大,也不適合在移動(dòng)端使用。

深度學(xué)習(xí)加速器目前主打的是性能和能效比,其性能能幫助深度學(xué)習(xí)的推理流暢執(zhí)行,而其能效比則保證了算法加速過(guò)程中不會(huì)消耗太多電池,可以在移動(dòng)端長(zhǎng)時(shí)間使用。目前在移動(dòng)領(lǐng)域,智能攝像頭、無(wú)人機(jī)、手機(jī)等都是深度學(xué)習(xí)加速器潛在的應(yīng)用領(lǐng)域,其中以手機(jī)的應(yīng)用市場(chǎng)最大。

關(guān)于深度學(xué)習(xí)加速器的用法,一般分為芯片和IP兩種。芯片的代表如Movidius的Myriad系列(以及基于Myriad芯片的neural stick產(chǎn)品)和,用戶可以把芯片集成到自己的系統(tǒng)中來(lái)做深度學(xué)習(xí)加速。然而,在BOM可謂寸土寸金的手機(jī)領(lǐng)域,額外加一塊芯片加速深度學(xué)習(xí)幾乎不可能,可行的做法是在手機(jī)SoC里面集成一塊深度學(xué)習(xí)加速器IP,在手機(jī)執(zhí)行深度學(xué)習(xí)應(yīng)用的時(shí)候可以把計(jì)算放到加速器模塊去執(zhí)行。

簡(jiǎn)要分析AI芯片的性能分析和應(yīng)用介紹


華為、蘋(píng)果和Imagination紛紛發(fā)布人工智能加速I(mǎi)P

華為、蘋(píng)果和Imagination發(fā)布的深度學(xué)習(xí)加速器產(chǎn)品都是這樣的IP模塊。這些模塊經(jīng)過(guò)長(zhǎng)期設(shè)計(jì)和驗(yàn)證,已經(jīng)非常成熟,可以進(jìn)入大規(guī)模生產(chǎn)階段。產(chǎn)品能進(jìn)入量產(chǎn)階段意味著之前已經(jīng)經(jīng)過(guò)了長(zhǎng)期的技術(shù)積累,正如蘋(píng)果和華為透露他們的人工智能加速I(mǎi)P至少在兩年前就已經(jīng)立項(xiàng)了,可見(jiàn)這些手機(jī)巨頭對(duì)于人工智能的遠(yuǎn)見(jiàn)和拿下市場(chǎng)的決心。

目前手機(jī)上的人工智能應(yīng)用應(yīng)該說(shuō)還處于非常初期的階段,硬件和軟件屬于“先有雞還是先有蛋”的境況:在沒(méi)有深度學(xué)習(xí)加速硬件的情況下開(kāi)發(fā)手機(jī)端的人工智能應(yīng)用,會(huì)導(dǎo)致硬件限制執(zhí)行速度,用戶體驗(yàn)不好;

而如果沒(méi)有手機(jī)端的人工智能相關(guān)應(yīng)用,硬件廠商往往就不會(huì)想到要去做專門(mén)的深度學(xué)習(xí)加速器。而華為、蘋(píng)果和Imagination推出的手機(jī)端深度學(xué)習(xí)加速器IP可謂是打破了這個(gè)僵局,成為手機(jī)端人工智能應(yīng)用普及的敲門(mén)磚。

華為、蘋(píng)果和Imagination公布的加速器峰值性能分別是1.96 TOPS、0.6 TOPS和4TOPS,而實(shí)測(cè)的性能麒麟970可以到300 GOPS(執(zhí)行VGG-16模型),Imagination約750 GOPS(執(zhí)行GoogleNet模型),蘋(píng)果的實(shí)測(cè)數(shù)據(jù)還沒(méi)有公布,估計(jì)也是在100 GOPS的數(shù)量級(jí)。這樣的數(shù)字能夠支持基礎(chǔ)的深度學(xué)習(xí)算法:

目前,蘋(píng)果宣稱其A11中的neural engine主要是加速Face ID應(yīng)用,而華為的展示項(xiàng)目則是實(shí)時(shí)物體辨識(shí)。預(yù)期在未來(lái),這些人工智能加速器的應(yīng)用場(chǎng)景會(huì)遠(yuǎn)遠(yuǎn)多于這些,同時(shí)也促成移動(dòng)端人工智能應(yīng)用的井噴式發(fā)展。

另一方面,我們也應(yīng)該看到,100GOPS數(shù)量級(jí)的算法運(yùn)行計(jì)算量更大的實(shí)時(shí)物體檢測(cè)(object detection,從畫(huà)面中同時(shí)定位并識(shí)別多個(gè)物體)還不夠流暢,因此深度學(xué)習(xí)IP還有不少進(jìn)步的空間。

Nvidia DLA:為AI生態(tài)鋪路的前瞻性產(chǎn)品

與華為、蘋(píng)果等定制深度學(xué)習(xí)IP模塊不同,Nvidia選擇了開(kāi)源其深度學(xué)習(xí)加速架構(gòu)DLA。目前,DLA已經(jīng)在github上發(fā)布了其RTL代碼可供編譯、仿真以及驗(yàn)證,預(yù)計(jì)在未來(lái)Nvidia將進(jìn)一步公布其C模型等重要設(shè)計(jì)組件。

Nvidia DLA最主要的部分是計(jì)算單元,據(jù)悉目前DLA會(huì)使用Winograd算法來(lái)減小卷積的計(jì)算開(kāi)銷,同時(shí)也會(huì)使用數(shù)據(jù)壓縮技術(shù),來(lái)減少DRAM訪問(wèn)時(shí)的數(shù)據(jù)流量。

Nvidia同時(shí)給出了NVDLA構(gòu)成的兩種系統(tǒng),在比較復(fù)雜的大系統(tǒng)中, DLA的接口包括與處理器交互的IRQ/CSB,與片外DRAM交互的DBBIF,以及與SRAM交互的SRAMIF,而在小系統(tǒng)的例子中,則省去了SRAMIF,因?yàn)樾∠到y(tǒng)中的SRAM比較寶貴可能沒(méi)有可供NVDLA使用的部分。

簡(jiǎn)要分析AI芯片的性能分析和應(yīng)用介紹

在性能方面,NVDLA在使用2048個(gè)MAC的時(shí)候可以每秒完成269次ResNet-50推理,相當(dāng)于2.1TOPS的性能,當(dāng)然其對(duì)于內(nèi)存的帶寬要求也達(dá)到了20GB/s,接近DDR4系列的最高帶寬。

簡(jiǎn)要分析AI芯片的性能分析和應(yīng)用介紹

那么,Nvidia為什么選擇了開(kāi)源的形態(tài)呢?通過(guò)觀察,我們不難發(fā)現(xiàn)目前在人工智能硬件領(lǐng)域,Nvidia已經(jīng)成為云端人工智能加速的主宰者,而在發(fā)展?jié)摿薮蟮臒o(wú)人車領(lǐng)域,Nvidia也接連推出多款GPU產(chǎn)品布局,在競(jìng)爭(zhēng)中也處于領(lǐng)跑地位。

在這些Nvidia具有競(jìng)爭(zhēng)優(yōu)勢(shì)的領(lǐng)域,Nvidia的GPU都是作為一種性能強(qiáng)勁的計(jì)算加速器存在的。然而,對(duì)于產(chǎn)品種類多樣而更適合使用SoC產(chǎn)品形態(tài)的移動(dòng)領(lǐng)域,Nvidia一直沒(méi)有打開(kāi)局面。

之前Nvidia曾經(jīng)推出過(guò)TK系列和TX系列作為帶有深度學(xué)習(xí)和機(jī)器視覺(jué)硬件加速特性的SoC來(lái)試水移動(dòng)市場(chǎng),可惜這些產(chǎn)品的功耗都在10W左右,而且成本很高,導(dǎo)致一直無(wú)法占領(lǐng)移動(dòng)端人工智能加速市場(chǎng)。Nvidia最擔(dān)心的恐怕就是有一家芯片廠商在移動(dòng)端人工加速市場(chǎng)脫穎而出,由下至上挑戰(zhàn)Nvidia在人工智能加速硬件領(lǐng)域的地位。

因此,Nvidia開(kāi)源其DLA加速模塊,其實(shí)是讓全球的SoC廠商幫Nvidia一起優(yōu)化DLA加速模塊,并且?guī)椭鶱vidia搶占移動(dòng)端市場(chǎng)。另一方面,開(kāi)源DLA也能加速移動(dòng)端人工智能加速硬件的成熟,這樣當(dāng)硬件不再成為瓶頸后,移動(dòng)端人工智能應(yīng)用將迎來(lái)爆發(fā)。而Nvidia作為深度學(xué)習(xí)模型訓(xùn)練(GPU)以及優(yōu)化(TensorRT)工具鏈生態(tài)環(huán)境的實(shí)際掌控者,在移動(dòng)端人工智能市場(chǎng)真正蓬勃發(fā)展后,即使DLA不帶來(lái)收入也能從人工智能產(chǎn)業(yè)鏈的上游獲得大量收益,因此開(kāi)源DLA的舉動(dòng)是Nvidia布局人工智能生態(tài)的重要一步。

Intel Loihi:神經(jīng)擬態(tài)芯片,試驗(yàn)性產(chǎn)品

與前述的幾家公司不同,Intel推出的Loihi是一款基于神經(jīng)擬態(tài)(neuromorphic)的芯片。目前最流行的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中,神經(jīng)網(wǎng)絡(luò)把人類的神經(jīng)系統(tǒng)的統(tǒng)計(jì)行為抽象為一系列運(yùn)算(高維卷積以及非線性運(yùn)算)的數(shù)學(xué)系統(tǒng),與真正的生物神經(jīng)工作并不相同,而之前介紹的幾款產(chǎn)品(以及絕大多數(shù)其他人工智能加速器硬件)都是加速這類經(jīng)典神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的。

神經(jīng)擬態(tài)則是幾乎完全照搬生物神經(jīng)系統(tǒng),試圖在模型中完全重現(xiàn)生物神經(jīng)的工作方式(例如引入神經(jīng)元電勢(shì)可以充放電,在電勢(shì)超過(guò)一定閾值后神經(jīng)元就會(huì)放出電脈沖到其他相鄰的神經(jīng)元)。理論上,這種神經(jīng)擬態(tài)芯片可以由異步系統(tǒng)實(shí)現(xiàn),并且有很低的功耗。然而,目前神經(jīng)擬態(tài)結(jié)構(gòu)如何訓(xùn)練仍然是學(xué)術(shù)界沒(méi)有解決的問(wèn)題。

Intel發(fā)布的Loihi聲稱可以自我學(xué)習(xí),然而學(xué)習(xí)的效果如何還不得而知。應(yīng)該說(shuō)在模型訓(xùn)練問(wèn)題還沒(méi)有解決前,神經(jīng)擬態(tài)就基本無(wú)法與經(jīng)典的深度學(xué)習(xí)在主流人工智能應(yīng)用里正面競(jìng)爭(zhēng),而主要會(huì)用在一些實(shí)驗(yàn)性的應(yīng)用,例如利用神經(jīng)擬態(tài)芯片去完成腦科學(xué)研究,或者做一些專用場(chǎng)合的高效數(shù)據(jù)處理(例如三星就使用過(guò)IBM的True North神經(jīng)擬態(tài)芯片來(lái)實(shí)現(xiàn)動(dòng)態(tài)視覺(jué)傳感器,只有在畫(huà)面發(fā)生變化的時(shí)候該傳感器才會(huì)記錄)。而Intel發(fā)布的Loihi,也更多是一款試驗(yàn)性質(zhì)的產(chǎn)品。

為什么大家紛紛推出AI芯片產(chǎn)品?

在一個(gè)月中,幾家大公司相繼發(fā)布AI芯片,這首先說(shuō)明人工智能應(yīng)用真正獲得了市場(chǎng)的認(rèn)可。如果我們回顧芯片市場(chǎng),會(huì)發(fā)現(xiàn)總是先有軟件應(yīng)用出現(xiàn),該應(yīng)用在得到認(rèn)可后快速發(fā)展很快遇到硬件瓶頸,于是推動(dòng)相應(yīng)硬件的開(kāi)發(fā),而在硬件瓶頸突破后,該應(yīng)用又會(huì)獲得更快速的普及,從而形成一個(gè)正循環(huán)。目前人工智能正處于該循環(huán)的第二步,即硬件限制了人工智能應(yīng)用的普及,尤其是在移動(dòng)端的普及,而各大硬件廠商正是看到了人工智能的巨大潛力,于是紛紛開(kāi)發(fā)相關(guān)芯片并爭(zhēng)相發(fā)布。

在未來(lái)的移動(dòng)人工智能市場(chǎng),由于移動(dòng)產(chǎn)品的多樣性(如要求高性能但是允許高功耗的智能攝像頭市場(chǎng),要求高性能但是同時(shí)要求低延遲和低功耗的無(wú)人機(jī)市場(chǎng),要求中等性能但是對(duì)成本和功耗要求很高的手機(jī)市場(chǎng),以及要求超低功耗但是對(duì)于性能要求也不高的物聯(lián)網(wǎng)市場(chǎng)),預(yù)計(jì)還是會(huì)有多家公司分別占領(lǐng)不同的市場(chǎng),而不太會(huì)出現(xiàn)一家獨(dú)大通吃所有市場(chǎng)的情況。未來(lái)人工智能芯片預(yù)計(jì)會(huì)進(jìn)入群雄逐鹿的時(shí)代。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47791

    瀏覽量

    240561
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5518

    瀏覽量

    121604
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1911

    瀏覽量

    35244
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    調(diào)制信號(hào)的性能分析

    調(diào)制信號(hào)的性能分析涉及多個(gè)方面,以下是對(duì)調(diào)制信號(hào)性能分析介紹: 一、調(diào)制信號(hào)的基礎(chǔ) 調(diào)制是將信息編碼到載波信號(hào)的過(guò)程,包括改變載波的幅度、
    的頭像 發(fā)表于 01-21 09:23 ?188次閱讀

    什么是半導(dǎo)體芯片的失效切片分析?

    性能。這項(xiàng)技術(shù)不僅有助于優(yōu)化芯片設(shè)計(jì),提升性能和可靠度,還可以用于故障檢測(cè)和質(zhì)量控制。切片方式的介紹1.機(jī)械研磨機(jī)械研磨是一種低成本的切片技術(shù),適用于各種材質(zhì)的樣品
    的頭像 發(fā)表于 12-10 10:43 ?366次閱讀
    什么是半導(dǎo)體<b class='flag-5'>芯片</b>的失效切片<b class='flag-5'>分析</b>?

    FIB技術(shù):芯片失效分析的關(guān)鍵工具

    芯片失效分析的關(guān)鍵工具在半導(dǎo)體行業(yè)迅速發(fā)展的今天,芯片的可靠性成為了衡量其性能的關(guān)鍵因素。聚焦離子束(FIB)技術(shù),作為一種先進(jìn)的微納加工技術(shù),對(duì)于
    的頭像 發(fā)表于 11-28 17:11 ?545次閱讀
    FIB技術(shù):<b class='flag-5'>芯片</b>失效<b class='flag-5'>分析</b>的關(guān)鍵工具

    云端AI開(kāi)發(fā)環(huán)境分析

    當(dāng)今,云端AI開(kāi)發(fā)環(huán)境作為支撐AI技術(shù)快速迭代與應(yīng)用部署的關(guān)鍵基礎(chǔ)設(shè)施,扮演著至關(guān)重要的角色。下面,AI部落小編為您分析云端AI開(kāi)發(fā)環(huán)境。
    的頭像 發(fā)表于 11-25 10:27 ?215次閱讀

    深蕾半導(dǎo)體HDMI AI分析盒子

    HDMI AI分析盒子,是專門(mén)針對(duì)視覺(jué)內(nèi)容進(jìn)行處理,集成了邊緣計(jì)算和AI算法處理能力的設(shè)備。能夠?qū)DMI RX輸入內(nèi)容進(jìn)行AI分析、內(nèi)容合
    的頭像 發(fā)表于 11-08 10:45 ?302次閱讀
    深蕾半導(dǎo)體HDMI <b class='flag-5'>AI</b><b class='flag-5'>分析</b>盒子

    AI模型托管原理分析

    AI模型托管是指將訓(xùn)練好的AI模型部署在云端或邊緣服務(wù)器上,由第三方平臺(tái)提供模型運(yùn)行、管理和優(yōu)化等服務(wù)。以下,AI部落小編將對(duì)AI模型托管的原理進(jìn)行詳細(xì)
    的頭像 發(fā)表于 11-07 09:33 ?262次閱讀

    AI模型市場(chǎng)分析

    隨著人工智能技術(shù)的快速發(fā)展,AI模型已成為全球科技競(jìng)爭(zhēng)的新高地、未來(lái)產(chǎn)業(yè)的新賽道以及經(jīng)濟(jì)發(fā)展的新引擎。下面,AI部落小編分析了當(dāng)前AI模型市場(chǎng)。
    的頭像 發(fā)表于 11-01 09:51 ?231次閱讀

    使用AI大模型進(jìn)行數(shù)據(jù)分析的技巧

    使用AI大模型進(jìn)行數(shù)據(jù)分析的技巧涉及多個(gè)方面,以下是一些關(guān)鍵的步驟和注意事項(xiàng): 一、明確任務(wù)目標(biāo)和需求 在使用AI大模型之前,首先要明確數(shù)據(jù)分析的任務(wù)目標(biāo),這將直接影響模型的選擇、數(shù)據(jù)
    的頭像 發(fā)表于 10-23 15:14 ?1182次閱讀

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問(wèn)下哪些比較容易學(xué) 不過(guò)好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    社會(huì)資源和資本力量關(guān)注算力芯片的發(fā)展,希望我們的國(guó)家能夠更獨(dú)立自主地設(shè)計(jì)制造高性能算力芯片。 內(nèi)容簡(jiǎn)介: 本書(shū)介紹了超級(jí)計(jì)算機(jī)算力和AI算力
    發(fā)表于 09-02 10:09

    為什么用CubeIDE導(dǎo)入AI模型進(jìn)行分析會(huì)報(bào)錯(cuò)?

    python已經(jīng)安裝好了,但是在用CubeAI的時(shí)候,導(dǎo)入模型進(jìn)行分析會(huì)報(bào)錯(cuò),無(wú)法分析。有知道為什么會(huì)報(bào)[AI:persondetection][12152] Failed to execute
    發(fā)表于 05-22 06:38

    信號(hào)分析的方法有哪些

    信號(hào)分析是信息處理和通信領(lǐng)域中至關(guān)重要的一個(gè)環(huán)節(jié),它主要關(guān)注于從復(fù)雜的信號(hào)中提取有用信息,進(jìn)而理解信號(hào)的本質(zhì)和特性。隨著科技的快速發(fā)展,信號(hào)分析的方法也在不斷更新和完善。本文將詳細(xì)探討幾種主要的信號(hào)分析方法,并
    的頭像 發(fā)表于 05-16 17:05 ?1965次閱讀

    聆思CSK6芯片性能與應(yīng)用前景分析

    聆思CSK6芯片性能與應(yīng)用前景分析
    的頭像 發(fā)表于 05-15 09:11 ?867次閱讀

    使用cube-AI分析模型時(shí)報(bào)錯(cuò)的原因有哪些?

    使用cube-AI分析模型時(shí)報(bào)錯(cuò),該模型是pytorch的cnn轉(zhuǎn)化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.ai
    發(fā)表于 03-14 07:09

    SAGE算法的性能分析

    電子發(fā)燒友網(wǎng)站提供《SAGE算法的性能分析.pdf》資料免費(fèi)下載
    發(fā)表于 02-28 10:38 ?0次下載