電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))要說(shuō)跟上AI時(shí)代的進(jìn)程,RISC-V相對(duì)其他架構(gòu)來(lái)說(shuō)也一點(diǎn)不慢。從各個(gè)初創(chuàng)公司的產(chǎn)品或者路線(xiàn)圖也可以看出,AI計(jì)算是他們最為重視的一環(huán),甚至重要性要超過(guò)通用計(jì)算。畢竟這是RISC-V可以后發(fā)制人的一大領(lǐng)域,甚至不會(huì)有太多架構(gòu)設(shè)計(jì)上的歷史桎梏。為此,不少廠(chǎng)商也都從AI出發(fā),設(shè)計(jì)出了定位不一的RISC-V產(chǎn)品。
高性能AI計(jì)算
Esperanto作為為數(shù)不多的幾家沖擊高性能AI計(jì)算的公司,如今也開(kāi)始察覺(jué)到了AI市場(chǎng)的風(fēng)向變動(dòng),于是決定將重心從過(guò)去的推薦加速改為大語(yǔ)言模型和HPC。Esperanto走進(jìn)大眾視野的方式相當(dāng)特別,他們的第一款產(chǎn)品就是千核RISC-V芯片ET-SOC-1。
ET-SOC-1基于臺(tái)積電7nm工藝打造,集成了1088個(gè)64位ET-Minion RISC-V核心和4個(gè)ET-Maxion核心,提供了超高的單線(xiàn)程性能。雖說(shuō)ET-SOC-1對(duì)ML進(jìn)行了優(yōu)化,是一個(gè)理想的推理芯片選擇,但Esperanto為其打造的軟件棧主要還是以推薦場(chǎng)景打造。直到他們近期推出了新的AI軟件開(kāi)發(fā)工具包,并專(zhuān)門(mén)針對(duì)LLM進(jìn)行了優(yōu)化,并展示了運(yùn)行300億參數(shù)的OPT模型。
據(jù)Esperanto表示,目前他們的生成式AI應(yīng)用已經(jīng)可以運(yùn)行最新的LLM和圖片生成模型,比如LLaMA2、Vicuma和Stable Diffusion等等。不過(guò)在千變?nèi)f化的AI市場(chǎng)下,單個(gè)模型往往難以維持長(zhǎng)時(shí)間的熱度,所以Esperanto的計(jì)劃是持續(xù)跟進(jìn)最流行的開(kāi)源模型。
IP廠(chǎng)商也不例外,除了SiFive、平頭哥、Tenstorrent等已經(jīng)推出高性能AI IP或?qū)ΜF(xiàn)有產(chǎn)品線(xiàn)進(jìn)行AI升級(jí)的公司外,Semidynamics也發(fā)布了最新完全可定制的矢量單元,用于配合其Atrevido CPU核心。該矢量單元有多個(gè)矢量?jī)?nèi)核構(gòu)成,每個(gè)內(nèi)核都有算數(shù)單元,可以執(zhí)行加減、乘加等數(shù)字與邏輯運(yùn)算。
這個(gè)矢量單元的最大特色在于全定制性,與其他廠(chǎng)商只有部分配置選項(xiàng)不同,為了應(yīng)對(duì)未來(lái)各種AI模型的精度要求,Semidynamics的矢量單元在定制化后,可以支持FP64、FP32、FP16、BF16、INT64、INT32、INT16或INT8的數(shù)據(jù)類(lèi)型。
盡管ASIC、GPU和FPGA常被視為最合適進(jìn)行AI計(jì)算的三大硬件,但在如今的市場(chǎng)環(huán)境下,無(wú)論是服務(wù)器還是消費(fèi)終端,CPU也都需要一些可觀的AI計(jì)算特性。所以開(kāi)源社區(qū)推出了LLaMA.cpp這一模型,該模型是基于Meta的LLaMA模型打造而成,無(wú)需PyTorch等庫(kù)的外部依賴(lài),僅靠C/C++編譯即可生成執(zhí)行文件,且無(wú)需GPU,只靠CPU就可以運(yùn)行。
曠視科技參考并借鑒了LLaMA.cpp項(xiàng)目,推出了InferLLM這一輕量級(jí)的LLM模型推理管家,且除了常見(jiàn)的Arm、x86和CUDA外,他們也針對(duì)RISCV-Vector做了專(zhuān)門(mén)的優(yōu)化,目前已經(jīng)可以部署在群芯閃耀科技發(fā)布的Milk-V Pioneer RISC-V主板上,而該主板用到的64位CPU正是算能科技的算豐SG2042。
算豐SG2042采用了單芯片64個(gè)RISC-V內(nèi)核的設(shè)計(jì),支持雙路CPU互聯(lián)、4通道DDR4和32通道PCIe 4.0,典型功耗為120W,可以說(shuō)是典型的服務(wù)器芯片設(shè)計(jì)。但很明顯,即便是高性能CPU,在一些非重型AI負(fù)載下,也能有可觀的表現(xiàn)。
低功耗的邊緣端
盡管云端的生成式AI已經(jīng)變得越來(lái)越普及,企業(yè)在花了大成本購(gòu)置硬件資源后也能在本地運(yùn)行更多的AI計(jì)算負(fù)載降低效率提高安全性。但對(duì)于消費(fèi)者而言,似乎真正部署在端側(cè)的生成式AI才更加值得關(guān)注,在實(shí)用性上也剛強(qiáng)一些,而且不只是手機(jī)這種使用高端芯片的產(chǎn)品,不少IoT產(chǎn)品也在規(guī)劃著如何接入生成式AI,因此大算力的邊緣AI芯片就成了首選。
云天勵(lì)飛作為國(guó)內(nèi)首批闖入AI賽道的廠(chǎng)商,此前一直在主攻AI算法領(lǐng)域,但單靠算法的泛化能力相對(duì)較弱,于是云天勵(lì)飛也就開(kāi)始加入芯片設(shè)計(jì)賽道,比如2018年推出的DeepEye 1000等。
而在今年舉辦的第三屆滴水湖中國(guó)RISC-V論壇上,云天勵(lì)飛展示了去年成功流片,如今已經(jīng)接近量產(chǎn)的邊緣AP級(jí)SoC Deep Edge10V。從芯片結(jié)構(gòu)上看,Edge10V采用了Chiplet設(shè)計(jì),滿(mǎn)足國(guó)產(chǎn)Chiplet UCIE標(biāo)準(zhǔn)。CPU部分采用了1.2GHz的雙核C920,還集成了一個(gè)500MHz的NNP400T NPU,算力高達(dá)12TOPS@INT8。在視頻處理能力上,Edge10V也配備了支持H265/H264視頻編解碼的多媒體子系統(tǒng)。
另外值得一提的是,Edge10V僅僅是Edge10系列中的一環(huán),由于Chiplet設(shè)計(jì)支持多die擴(kuò)展,所以也可以在Edge10Max這一產(chǎn)品上實(shí)現(xiàn)高達(dá)64Tops的算力。云天勵(lì)飛芯片BD總監(jiān)張福林表示,Edge10V主要應(yīng)用于邊緣計(jì)算,而Edge10Max則應(yīng)用于邊緣CV大模型,比如Pytorch、Caffe、Tensorflow等框架下的模型。從應(yīng)用上來(lái)看,Edge10V的主要應(yīng)用場(chǎng)景還是云天勵(lì)飛擅長(zhǎng)的機(jī)器視覺(jué)領(lǐng)域,比如機(jī)器人、智能安防之類(lèi)的邊緣端。
本屆滴水湖論壇上,普林芯馳也展示了他們的智能離線(xiàn)語(yǔ)音交互MCU SPV20系列芯片。該系列的特色在于,除了基于SiFive E21RISC-V核心打造的CPU外,還有基于CEVA TL420核心的DSP與集成普林芯馳自有算法的NPU。該NPU支持CNN、DS-CNN等深度壓縮語(yǔ)音識(shí)別模型,可用于家電的智能語(yǔ)音控制。
嘉楠科技的第二代AI推理芯片,勘智K510,同樣是針對(duì)邊緣側(cè)AI開(kāi)發(fā)的產(chǎn)品。這一芯片采用了雙核RISC-V 64位CPU,主頻最高達(dá)到800MHz。勘智K510支持INT8和BF16雙數(shù)據(jù)類(lèi)型,且具備2.5TFLOPS的算力,還支持Tensorflow、Pytorch和ONNX等多種框架的算子庫(kù)。
用生成式AI設(shè)計(jì)RISC-V芯片
隨著生成式AI在代碼生成上日益精進(jìn)的表現(xiàn),如今利用生成式AI來(lái)設(shè)計(jì)芯片也成了可能。近日,開(kāi)源硬件平臺(tái)Efabless就舉辦了一屆生成式開(kāi)源芯片設(shè)計(jì)挑戰(zhàn)賽,其中清華RIOS Lab團(tuán)隊(duì)的RISC-V芯片,CyberRio獲得了亞軍。
據(jù)其Github頁(yè)面所示,該芯片的大部分Verilog代碼都是使用GPT-4生成的,從而基于一個(gè)經(jīng)典的5級(jí)流水線(xiàn)設(shè)計(jì)出了CyberRio。CyberRio也在Skywater提供的130nm的工藝平臺(tái)上得到了流片驗(yàn)證,這也意味著全球第一個(gè)由LLM完成主要涉及的CPU被成功制造出來(lái)。
不過(guò)開(kāi)放團(tuán)隊(duì)也表示,GPT-4對(duì)硬件語(yǔ)言的理解并不算完整,無(wú)論是對(duì)設(shè)計(jì)語(yǔ)言本身的理解,還是對(duì)握手或并行處理等設(shè)計(jì)概念。這很可能是GPT-4訓(xùn)練過(guò)程本身的缺陷,不過(guò)開(kāi)發(fā)團(tuán)隊(duì)也提出了Langchain之類(lèi)的替代方案或許可以解決GPT-4信息缺失造成的問(wèn)題。
寫(xiě)在最后
盡管RISC-V社區(qū)針對(duì)AI計(jì)算的開(kāi)發(fā)熱情空前高漲,但同樣需要來(lái)自架構(gòu)上的各種支持,比如矢量、虛擬化擴(kuò)展等也需要不斷地優(yōu)化,給到開(kāi)發(fā)者一個(gè)優(yōu)秀的通用方案,而不僅僅只有各大廠(chǎng)商獨(dú)立開(kāi)發(fā)的AI技術(shù)棧。與此同時(shí),RISC-V硬件廠(chǎng)商應(yīng)該吸引更多的軟件框架開(kāi)發(fā)者為RISC-V做一定的適配或移植工作,這樣也能讓已經(jīng)成熟的生成式AI社區(qū)盡快融入RISC-V生態(tài)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28704瀏覽量
208697 -
控制
+關(guān)注
關(guān)注
4文章
1016瀏覽量
122791 -
AI
+關(guān)注
關(guān)注
87文章
31711瀏覽量
270515
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
新的一年 RISC-V前景如何呢?
1 月 7 日消息,RISC-V 領(lǐng)軍企業(yè) SiFive 成立中國(guó)分公司,中文名稱(chēng)定為“芯伍科技”。
1 月 14 日消息,專(zhuān)注傳統(tǒng)與 AI 業(yè)務(wù),Imagination 放棄 RISC-V CPU 開(kāi)發(fā)。
新的
發(fā)表于 01-24 16:19
Rivos全新產(chǎn)品采用Andes晶心科技NX45 RISC-V處理器
專(zhuān)注于加速數(shù)據(jù)分析和生成式AI工作負(fù)載的RISC-V主要會(huì)員公司Rivos與32/64位RISC-V處理器內(nèi)核的領(lǐng)先供貨商、
關(guān)于RISC-V學(xué)習(xí)路線(xiàn)圖推薦
向量指令集、密碼指令集等)進(jìn)行硬件加速和優(yōu)化。
嵌入式系統(tǒng)開(kāi)發(fā) :
掌握RISC-V在嵌入式系統(tǒng)中的應(yīng)用,如物聯(lián)網(wǎng)設(shè)備、智能家居等。目前AI、大模型
發(fā)表于 11-30 15:21
RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)期
RISC-V是一種開(kāi)放標(biāo)準(zhǔn)指令集架構(gòu) (ISA),最初由加州大學(xué)伯克利分校的研究人員于2010年開(kāi)發(fā)。業(yè)界稱(chēng),這種開(kāi)源特性為芯片設(shè)計(jì)者提供了極大的靈活性,可以根據(jù)具體需求定制AI加速器。
而A
發(fā)表于 10-31 16:06
RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫(kù)?
RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫(kù)?還請(qǐng)壇友們多多指教一下。
發(fā)表于 10-10 22:24
芯原聯(lián)合主辦RISC-V和生成式AI論壇
隨著生成式AI技術(shù)的快速演進(jìn),相關(guān)應(yīng)用已開(kāi)始向各行業(yè)滲透,AI模型在云側(cè)進(jìn)行訓(xùn)練、端側(cè)進(jìn)行推理和微調(diào)時(shí),產(chǎn)生了巨大的算力需求。
risc-v的發(fā)展歷史
領(lǐng)域中得到廣泛應(yīng)用,包括嵌入式設(shè)備、個(gè)人電腦、服務(wù)器等。
國(guó)際合作:RISC-V基金會(huì)將繼續(xù)加強(qiáng)與國(guó)際企業(yè)和機(jī)構(gòu)的合作,共同推動(dòng)RISC-V架構(gòu)的發(fā)展和應(yīng)用。
綜上所述,RISC-V的
發(fā)表于 07-29 17:20
RISC-V適合什么樣的應(yīng)用場(chǎng)景
設(shè)計(jì)使得開(kāi)發(fā)者可以靈活選擇所需的指令集和模塊,以滿(mǎn)足嵌入式系統(tǒng)的各種性能要求。
3. 人工智能(AI)和機(jī)器學(xué)習(xí)(ML)
高性能計(jì)算:RISC-V結(jié)合AI加速器或協(xié)處理器,可以提供高效
發(fā)表于 07-29 17:16
RISC-V在中國(guó)的發(fā)展機(jī)遇有哪些場(chǎng)景?
聯(lián)網(wǎng)市場(chǎng)的重要參與者,擁有龐大的用戶(hù)基數(shù)和豐富的應(yīng)用場(chǎng)景。RISC-V在中國(guó)的發(fā)展將受益于這一市場(chǎng)需求的增長(zhǎng)。
2. 人工智能(AI)
AI算力需求:隨著人工智能技術(shù)的廣泛應(yīng)用,對(duì)算力
發(fā)表于 07-29 17:14
芯原股份RISC-V和生成式AI論壇成功舉辦
海世博中心舉辦。此次論壇邀請(qǐng)了烏鎮(zhèn)智庫(kù)、RISC-V國(guó)際基金會(huì)、Tenstorrent、MIPS、知合計(jì)算、芯來(lái)科技和華東政法大學(xué)等國(guó)內(nèi)外產(chǎn)學(xué)研界的專(zhuān)家,與芯原一同深入探討RISC-V與生成
risc-v多核芯片在AI方面的應(yīng)用
在極低的能耗下實(shí)現(xiàn)高效的AI元器件的運(yùn)行。這對(duì)于需要長(zhǎng)時(shí)間運(yùn)行和依賴(lài)電池供電的AI設(shè)備來(lái)說(shuō)尤為重要。
其次,RISC-V的模塊化架構(gòu)允許其不同部分以模塊化的方式串在一起,從而滿(mǎn)足各種不
發(fā)表于 04-28 09:20
RISC-V有哪些優(yōu)點(diǎn)和缺點(diǎn)
新的、尚未被廣泛驗(yàn)證的技術(shù)。
需要注意的是,隨著RISC-V技術(shù)的不斷發(fā)展和生態(tài)系統(tǒng)的逐步完善,其缺點(diǎn)可能會(huì)逐漸被克服。同時(shí),RISC-V的優(yōu)點(diǎn)也使其在多個(gè)領(lǐng)域具有廣闊的應(yīng)用前景,包括服務(wù)器、物聯(lián)網(wǎng)、嵌入
發(fā)表于 04-28 09:03
RISC-V有哪些優(yōu)缺點(diǎn)?是堅(jiān)持ARM方向還是投入risc-V的懷抱?
是一個(gè)優(yōu)勢(shì)。同時(shí),這種設(shè)計(jì)也降低了制造成本,使得RISC-V在成本敏感的應(yīng)用場(chǎng)景中更具競(jìng)爭(zhēng)力。
缺點(diǎn) :
性能問(wèn)題 :雖然RISC-V設(shè)計(jì)簡(jiǎn)潔,但相對(duì)于某些專(zhuān)用ISA(如ARM),其性
發(fā)表于 04-28 08:51
解鎖RISC-V技術(shù)力量丨曹英杰:RISC-V與大模型探索
4月12日,第二期“大家來(lái)談芯|解鎖RISC-V技術(shù)力量”在上海臨港新片區(qū)頂科永久會(huì)址舉辦,本期沙龍聚焦RISC-V技術(shù),圍繞AI時(shí)代的RISC-V市場(chǎng)機(jī)會(huì)、
![解鎖<b class='flag-5'>RISC-V</b>技術(shù)力量丨曹英杰:<b class='flag-5'>RISC-V</b>與大<b class='flag-5'>模型</b>探索](https://file.elecfans.com/web2/M00/37/4D/poYBAGI62smAAPRDAAAzYJ7Ib6o943.png)
RISC-V廠(chǎng)商正在AI領(lǐng)域積極布局!
電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)在AI大浪潮的席卷下,越來(lái)越多具備多模態(tài)能力的AI大模型加速涌現(xiàn),AI推理芯片逐漸成為市場(chǎng)焦點(diǎn),以期支撐大模型
![<b class='flag-5'>RISC-V</b>廠(chǎng)商正在<b class='flag-5'>AI</b>領(lǐng)域積極布局!](https://file1.elecfans.com/web2/M00/CF/FA/wKgZomYiN5-AXhLRAAdb9IdhHhU805.png)
評(píng)論