人工智能的三大核心,是深度學(xué)習(xí)算法、數(shù)據(jù)和算力。在這三大要素中,大數(shù)據(jù)的獲取和處理難度在下降,算法也在深度學(xué)習(xí)模型的基礎(chǔ)上不斷優(yōu)化,而統(tǒng)一協(xié)調(diào)數(shù)據(jù)和算法的AI芯片能否獲得大的飛躍,成為市場(chǎng)關(guān)注的焦點(diǎn)。
根據(jù)Gartner數(shù)據(jù),全球各大芯片公司、互聯(lián)網(wǎng)巨頭和創(chuàng)業(yè)企業(yè)都在AI芯片市場(chǎng)競(jìng)爭(zhēng),預(yù)計(jì)到2023年全球市場(chǎng)規(guī)模將達(dá)到323億美元,其中數(shù)據(jù)中心、個(gè)人終端和物聯(lián)網(wǎng)芯片是增長(zhǎng)重點(diǎn)。
深度學(xué)習(xí)算法對(duì)芯片性能需求主要為:大數(shù)據(jù)在計(jì)算和存儲(chǔ)單元之間的高速通信需求;專業(yè)計(jì)算能力需求,深度學(xué)習(xí)算法中有大量卷積、殘差網(wǎng)絡(luò)、全連接等特殊計(jì)算需要處理,需要需要提升運(yùn)算速度,降低功耗;大數(shù)據(jù)對(duì)芯片提出的新要求,非結(jié)構(gòu)化數(shù)據(jù)增多,對(duì)傳統(tǒng)芯片結(jié)構(gòu)造成較大壓力。
通用CPU在深度學(xué)習(xí)中可用但效率低。比如在圖像處理領(lǐng)域,主要用到的是CNN(卷積神經(jīng)網(wǎng)絡(luò)),在自然語(yǔ)言識(shí)別、語(yǔ)音處理等領(lǐng)域,主要用到的是RNN(循環(huán)神經(jīng)網(wǎng)絡(luò)),雖然這兩種算法模型有較大差別,但本質(zhì)都是向量和矩陣運(yùn)算。
正因?yàn)镃PU在AI計(jì)算上的弱點(diǎn),給了可以實(shí)現(xiàn)海量并行計(jì)算且能夠計(jì)算加速的AI芯片開(kāi)拓了市場(chǎng)空間。AI芯片,包括基于傳統(tǒng)架構(gòu)的GPU、FPGA以及ASIC,也包括類腦芯片和可重構(gòu)AI芯片等。
AI芯片還可以按照部署位置劃分為云端芯片和邊緣端芯片。云端芯片部署位置包括公有云、私有云、混合云等,主要用于處理大數(shù)據(jù)和大規(guī)模運(yùn)算,還能夠支持語(yǔ)音、圖片、視頻等非結(jié)構(gòu)化應(yīng)用的計(jì)算和傳輸,可用多個(gè)處理器并行完成相關(guān)任務(wù);邊緣端AI芯片主要應(yīng)用于嵌入式、移動(dòng)終端等,如攝像頭、智能手機(jī)、邊緣服務(wù)器、工控設(shè)備,此類芯片一般體系小、耗電低,性能要求略低,一般只具備少量AI能力。
同時(shí)AI芯片按照任務(wù)還可以劃分為訓(xùn)練芯片和推理芯片。訓(xùn)練芯片通過(guò)大量標(biāo)記過(guò)的數(shù)據(jù)在平臺(tái)上進(jìn)行“學(xué)習(xí)”,并形成具備特定功能的神經(jīng)網(wǎng)絡(luò)模型;推理則是利用已經(jīng)訓(xùn)練好的模型輸入新數(shù)據(jù)通過(guò)計(jì)算得到各種結(jié)論。訓(xùn)練芯片對(duì)算力、精度要求高且需要一定的通用性,推理芯片更注重綜合能力,包括算力能耗、時(shí)延、成本等。
訓(xùn)練芯片由于對(duì)算力的要求,只適合在云端部署,多采用“CPU+加速芯片”,加速芯片可以是CPU、FPGA或者ASIC。AI訓(xùn)練芯片市場(chǎng)集中度高,英偉達(dá)和谷歌領(lǐng)先,英特爾和AMD正在發(fā)力。推理芯片在云端和終端都可以進(jìn)行,門檻低,市場(chǎng)參與者多,比如英偉達(dá)、谷歌、賽靈思、寒武紀(jì)等。終端推理芯片市場(chǎng)較為分散,參與者有英偉達(dá)、英特爾、ARM、高通、寒武紀(jì)、地平線、云知聲等。
GPU、FPGA、ASIC各有特點(diǎn)和優(yōu)勢(shì)。GPU是由大量核心組成的大規(guī)模并行計(jì)算架構(gòu),專為多任務(wù)并行運(yùn)算處理設(shè)計(jì)的芯片。以英偉達(dá)的GPUTITANX為例,其在深度學(xué)習(xí)中所需的訓(xùn)練時(shí)間是CPU的1/10以下,但缺點(diǎn)是功耗高。
FPGA靈活性最高,可根據(jù)用戶需求,用硬件描述語(yǔ)言對(duì)FPGA的硬件電路進(jìn)行設(shè)計(jì)。同時(shí)FPGA具有算力強(qiáng)、功耗優(yōu)勢(shì)明顯、成本可控等優(yōu)勢(shì),但是技術(shù)難度大,目前國(guó)內(nèi)公司差距明顯?;诖?,F(xiàn)PGA被廣泛應(yīng)用在AI云端和終端推理,亞馬遜、微軟都推出了基于FPGA的云計(jì)算服務(wù),國(guó)內(nèi)包括騰訊云、阿里云和百度大腦也有所布局,但差距較大。從市場(chǎng)上看,F(xiàn)PGA被賽靈思、英特爾、Lattice和Microsemi壟斷,其中賽靈思和英特爾市場(chǎng)份額超過(guò)90%。
ASIC是對(duì)特定用戶需求設(shè)計(jì)的定制芯片,性能強(qiáng)、體積小、功耗低、可靠性高。ASIC是一種技術(shù)方案,產(chǎn)品和功能可以是多樣的。越來(lái)越多的公司開(kāi)始采用ASIC芯片進(jìn)行深度學(xué)習(xí)算法加速,比如Google的TPU。但是ASIC研發(fā)周期長(zhǎng),商業(yè)應(yīng)用風(fēng)險(xiǎn)大。國(guó)內(nèi)寒武紀(jì)開(kāi)發(fā)的Cambricon系列處理器就在此列中,華為海思的麒麟980處理器搭載的NPU就是寒武紀(jì)的處理器IP。
整體來(lái)看,短期GPU仍然主導(dǎo)AI芯片市場(chǎng),GPGA使用更為廣泛。長(zhǎng)期來(lái)看GPU、FPGA和ASIC三大技術(shù)路線將并存。GPU主要方向是高級(jí)復(fù)雜算法和通用型人工智能平臺(tái),F(xiàn)PGA在垂直領(lǐng)域有較大空間,ASIC長(zhǎng)遠(yuǎn)來(lái)看適用于面向各種場(chǎng)景的定制化需求。
目前國(guó)內(nèi)人工智能芯片行業(yè)發(fā)展處于起步階段,在GPU和DSP設(shè)計(jì)上處于追趕狀態(tài)。但全球芯片生態(tài)上并沒(méi)有形成全封閉式壟斷,國(guó)內(nèi)芯片廠商尤其是專用芯片設(shè)計(jì)廠商,還是存在彎道超車的機(jī)會(huì),其主打的應(yīng)用場(chǎng)景為云端數(shù)據(jù)中心、自動(dòng)駕駛、智能家居和機(jī)器人領(lǐng)域。隨著5G和物聯(lián)網(wǎng)等應(yīng)用的成熟落地,相關(guān)芯片產(chǎn)品的市場(chǎng)空間將進(jìn)一步擴(kuò)大。
責(zé)任編輯人:CC
-
人工智能
+關(guān)注
關(guān)注
1796文章
47791瀏覽量
240578 -
人工智能芯片
+關(guān)注
關(guān)注
1文章
121瀏覽量
29183
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論