欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

超星未來梁爽:軟硬件協(xié)同優(yōu)化,賦能AI 2.0新時代

愛云資訊 ? 2024-07-22 12:56 ? 次閱讀

近日,第三屆清華大學(xué)汽車芯片設(shè)計及產(chǎn)業(yè)應(yīng)用研討會暨校友論壇在蕪湖成功舉行。作為本次活動的特邀嘉賓,超星未來聯(lián)合創(chuàng)始人、CEO梁爽博士出席并發(fā)表主題演講《軟硬件協(xié)同優(yōu)化,賦能AI 2.0新時代》。

wKgZomad5mKAYo6FAAEo7DNFp8A410.jpg

大模型是AI 2.0時代的“蒸汽機(jī)”

AI+X應(yīng)用落地及邊緣計算將成為關(guān)鍵

自ChatGPT發(fā)布以來,大模型引爆“第四次工業(yè)革命”,成為AI 2.0時代的“蒸汽機(jī)”,驅(qū)動著千行百業(yè)智能化變革。保爾·芒圖曾說:“蒸汽機(jī)并不創(chuàng)造大工業(yè),但是它卻為大工業(yè)提供了動力”,大模型也是如此,本身不會直接創(chuàng)造新的產(chǎn)業(yè),而是與已有的行業(yè)應(yīng)用場景及數(shù)據(jù)結(jié)合創(chuàng)造價值。

WAIC 2024落幕后,有媒體評論:大模型再無新玩家,AGI下半場是計算與應(yīng)用。梁爽認(rèn)為,AGI下半場將是AI+X應(yīng)用落地和邊緣計算。AI 1.0時代,服務(wù)器側(cè)的神經(jīng)網(wǎng)絡(luò)模型,在安防、智能駕駛等應(yīng)用領(lǐng)域里逐步下沉到邊緣端,這一趨勢也一定會在AI 2.0的時代再演繹一次,并且將在智慧城市、汽車、機(jī)器人、消費電子等領(lǐng)域創(chuàng)造出更為廣闊的增量市場。

wKgZomad5mKAeuehAAJQ33RHNvE549.png

回顧AI的演進(jìn)歷史,可以看到,AI 1.0時代的主要模式是通過單一模型完成單一任務(wù),例如安防、人臉識別、語音識別,以及基于感知-決策-控制分模塊的智能輔助駕駛方案。梁爽認(rèn)為,現(xiàn)在正進(jìn)入一個“AI 1.5時代”,在智能駕駛、機(jī)器人等復(fù)雜系統(tǒng)中,統(tǒng)一用神經(jīng)網(wǎng)絡(luò)完成各個模塊功能的實現(xiàn),盡量減少人工規(guī)則,并通過數(shù)據(jù)驅(qū)動的范式提升性能,大幅降低人工處理各種長尾問題的難度。在AI 2.0時代,系統(tǒng)將由一個統(tǒng)一的通用基礎(chǔ)大模型來應(yīng)對多源數(shù)據(jù)輸入,完成多種復(fù)雜任務(wù),這一基礎(chǔ)模型應(yīng)該具備感知萬物、知曉常識和理解推理的能力,智能駕駛、機(jī)器人的基礎(chǔ)模型本質(zhì)上是同一類基礎(chǔ)模型。

端到端與大模型上車進(jìn)行時

智能汽車是邁向通用機(jī)器人的必要階段

近年來,智駕系統(tǒng)正在從傳統(tǒng)的單傳感器CNN感知,逐步升級到多傳感器CNN BEV,基于Transformer的BEV和Occupancy方案,并正在向端到端大模型演進(jìn)。隨著規(guī)控部分逐步模型化,中間沒有規(guī)則介入,因而在海量高質(zhì)量數(shù)據(jù)驅(qū)動下,性能天花板會大幅提升,并大幅降低了應(yīng)對長尾問題的人工參與度,使得軟件工程量最多可下降99%。此外,視覺大模型的上車,幫助智駕系統(tǒng)進(jìn)一步增加了對物理世界復(fù)雜語義的理解,使駕駛的行為更接近于人,提升了對未知場景的泛化處理能力。

wKgaomad5mKAYXLmAAXKre-MyIQ194.png

梁爽指出,智能汽車將是未來邁向通用機(jī)器人的一個必要階段,例如TESLA的Optimus機(jī)器人和智能汽車采用了同樣的FSD平臺,并且在系統(tǒng)配置、功能任務(wù)上相同。雖然兩者的系統(tǒng)組成和迭代升級高度相似,但機(jī)器人的維度更高、任務(wù)更復(fù)雜,大模型下沉部署到邊緣側(cè)的設(shè)備里,形成一個“Robot-Brain”,會成為行業(yè)發(fā)展的關(guān)鍵。

大模型落地邊緣側(cè)存在較大挑戰(zhàn)

軟硬件協(xié)同優(yōu)化是現(xiàn)實可行的落地路徑

過去十年被稱為AI加速器的黃金十年,CNN加速器的能效已經(jīng)提升到了100TOPS/W級別。大模型的規(guī)模以及參數(shù)增長速度遠(yuǎn)超CNN時代,大幅超出了傳統(tǒng)計算硬件的增長速度。而當(dāng)前大模型的處理器能效仍小于1TOPS/W,與邊緣側(cè)應(yīng)用需求存在兩個數(shù)量級的差距,嚴(yán)重限制了大模型的落地。

wKgZomad5mKAI9KNAAWHHXaQtvg541.png

(摘選自汪玉教授發(fā)表于2024年1月的報告《端側(cè)大模型推理,智能芯片的現(xiàn)狀與展望》)

目前很多手機(jī)端本地部署的2B以內(nèi)的“小”模型,在應(yīng)用到邊緣側(cè)場景時,通常會出現(xiàn)歷史信息遺忘等能力限制,而需求量更大、效果顯著提升的7B量級以上的大模型,通常難以部署到現(xiàn)有的邊緣側(cè)芯片上,主要原因包括:(1)傳統(tǒng)架構(gòu)矩陣算力缺口明顯,大模型中50-80%算力需求在Attention層中的各類矩陣計算,并且KV矩陣有明顯稀疏性,需要專項支持;(2)大模型的參數(shù)量和帶寬需求巨大,單7B級別的浮點模型就需要28GByte的存儲空間,且權(quán)重的局域性比較低,所以大模型計算處理的過程需要頻繁地對外存進(jìn)行讀取,每個Token的帶寬需求都會大于10GB/s;(3)當(dāng)前架構(gòu)精度類型不足,計算精度傳統(tǒng)的CNN網(wǎng)絡(luò)通常可以用INT8實現(xiàn)較好的處理效果,而大模型中的各類算子會需要諸如INT4/FP8/BF16等不同精度的計算支持,并且像激活層、Norm層等的數(shù)據(jù)動態(tài)范圍大,導(dǎo)致很多已有的量化算法也不能很好地支持。

wKgaomad5mGAdAYNAAJRSb_Im8U024.png

從提升大模型在邊緣側(cè)處理能效的方法來看,一種是通過提升工藝水平scaling down,但受摩爾定律和國際形勢的影響,很難再繼續(xù)持續(xù);另一種是通過新器件和新系統(tǒng),但應(yīng)用的成熟度還有待技術(shù)上的進(jìn)一步提升與完善。但在當(dāng)下來看最為現(xiàn)實的實現(xiàn)手段,就是針對大模型應(yīng)用來做軟硬件協(xié)同優(yōu)化,軟件上通過新的混合量化方法以及稀疏化處理,硬件上則針對大模型中常見的算法結(jié)構(gòu)進(jìn)行加速設(shè)計,從而整體上實現(xiàn)2-3個數(shù)量級的能效提升。

針對大模型任務(wù)新需求深度優(yōu)化

超星未來實現(xiàn)邊緣側(cè)AGI計算行業(yè)領(lǐng)先

超星未來主要面向各類邊緣智能場景,提供以AI計算芯片為核心、軟硬件協(xié)同的高能效計算方案,致力于成為邊緣側(cè)AGI計算的引領(lǐng)者。

「平湖/高峽」NPU:團(tuán)隊十年磨一劍,實現(xiàn)性能行業(yè)天花板

針對智能駕駛及大模型所需要的神經(jīng)網(wǎng)絡(luò)計算任務(wù),超星未來自研了高性能AI處理核心「平湖」和「高峽」?!钙胶筃PU主要針對以CNN和少量Transformer的感知類任務(wù)提供高效的計算,「高峽」NPU則是面向高階智駕以及大模型的實時處理專門設(shè)計的加速核心。

其中「平湖」NPU針對主流CNN/Transformer模型的推理延遲以及幀率均為行業(yè)最領(lǐng)先水平,與某款市場上被廣泛認(rèn)可的競品相比,單位算力的推理幀率在CNN任務(wù)上提高10倍,Transformer任務(wù)提高25倍。

「高峽」NPU架構(gòu)采用了混合粒度的指令集設(shè)計,單Cluster可實現(xiàn)40TOPS算力,支持INT4/INT8/FP8/BF16多種不同計算精度,并且在內(nèi)部緩存設(shè)計上做了優(yōu)化設(shè)計,另外針對Sparse Attention和三維稀疏卷積,設(shè)計了專用的加速結(jié)構(gòu)。通過這些優(yōu)化設(shè)計,「高峽」NPU實現(xiàn)了對典型的生成式大模型的實時計算支持,LLaMA3-8B生成速度最高可達(dá)60tokens/s。此外,「高峽」NPU可以用相較NVIDIA Orin芯片1%的計算邏輯面積,來實現(xiàn)近乎等同的三維稀疏卷積處理速率。

「驚蟄」系列芯片:已于多領(lǐng)域批量落地,最新產(chǎn)品實現(xiàn)大模型邊緣側(cè)實時計算

基于自研的NPU核心,超星未來在2022年底發(fā)布了邊緣側(cè)AI計算芯片「驚蟄R1」,NPU算力為16TOPS@INT8,典型功耗僅7-8W,從而可以支撐起各類系統(tǒng)方案的自然散熱設(shè)計?!阁@蟄R1」目前已在汽車、電力、煤礦以及機(jī)器人等領(lǐng)域?qū)崿F(xiàn)了批量落地。

「魯班」模型部署工具鏈:集成大模型優(yōu)化新方法,軟件協(xié)同實現(xiàn)40倍性能提升

在高效硬件架構(gòu)的基礎(chǔ)上,超星未來面向神經(jīng)網(wǎng)絡(luò)應(yīng)用打造深度優(yōu)化的「魯班」工具鏈,可使邊緣側(cè)推理速度提高40倍以上,具體包括:

(1)業(yè)內(nèi)領(lǐng)先的混合精度量化工具,支持PTQ/QAT/AWQ功能,支持INT4/INT8/FP8/BF16精度,量化損失小于1%;

(2)高效模型優(yōu)化工具,支持敏感度分析、蒸餾、Lora,在精度損失小于1%的情況下,模型壓縮率超10倍;

(3)高性能編譯工具,提供豐富的計算圖優(yōu)化技術(shù)及面向異構(gòu)核心的高效指令調(diào)度,推理效率可提高4-5倍以上。

特別針對大模型任務(wù),「魯班」通過特有的稀疏離群點保持和混合位寬量化的方法,可將權(quán)重位寬下探到平均2.8bit?;谙∈柩谀さ姆椒?,可實現(xiàn)在模型處理能力相當(dāng)?shù)那闆r下,將LLaMA3-8B壓縮90%以上,大幅縮減了模型的參數(shù)和計算量。

「倉頡」數(shù)據(jù)閉環(huán)平臺:實現(xiàn)數(shù)據(jù)自動化生產(chǎn),構(gòu)建應(yīng)用迭代閉環(huán)

在大模型時代,高質(zhì)量算法迭代需要功能強(qiáng)大的數(shù)據(jù)閉環(huán)工具。因此超星未來打造了「倉頡」平臺,包括數(shù)據(jù)管理、數(shù)據(jù)挖掘、數(shù)據(jù)增強(qiáng)、真值生產(chǎn)、模型生產(chǎn)和算法評測等功能,并且在多個環(huán)節(jié)都應(yīng)用了大模型來提供功能上的增強(qiáng)。

基于該平臺,通過構(gòu)建完整流程,客戶可以從環(huán)境中獲取有效數(shù)據(jù),并盡可能降低人工的參與程度,實現(xiàn)自動的數(shù)據(jù)挖掘和標(biāo)注,從而助力客戶實現(xiàn)數(shù)據(jù)驅(qū)動算法的迭代。目前「倉頡」平臺已為車企、Tier1等客戶提供了服務(wù),同時也在延伸為機(jī)器人客戶提供支持的能力。

腳踏實地,快步向前

為客戶提供高效的“AI+”

基于團(tuán)隊在AI領(lǐng)域十余年的研發(fā)與實踐經(jīng)歷,超星未來緊跟AI 1.0到AI 2.0的發(fā)展路徑,不斷打磨核心產(chǎn)品,實現(xiàn)AI+X應(yīng)用落地。

在邊緣側(cè)場景,超星未來已在電力、煤礦等泛安防領(lǐng)域?qū)崿F(xiàn)了芯片產(chǎn)品的批量落地,實現(xiàn)了規(guī)模化的營收回報,并通過落地,持續(xù)迭代產(chǎn)品相關(guān)生態(tài),形成對智能駕駛與AGI等長周期方向的反哺?!霸诋?dāng)前惡劣的市場環(huán)境下,實現(xiàn)快速的落地才是生存的王道?!?/p>wKgaomad5mKACjWGAAH8C3CI9RI536.png

在智能駕駛場景,「驚蟄」系列芯片可支持多維智駕解決方案,如智能前視一體機(jī)、雙目前視方案、5-7V高性價比行泊一體、11V1L高性能行泊一體等,并涵蓋主流的行車、泊車以及智能駕駛和機(jī)器人通用的雙目功能。相關(guān)產(chǎn)品的參考解決方案已基于實車完成了打通和工程優(yōu)化。目前,超星未來已與某行業(yè)頭部商用車OEM合作上車,同時與多家乘用車OEM客戶達(dá)成業(yè)務(wù)合作,預(yù)計最早于2025年實現(xiàn)批量上車。

在邊緣側(cè)大模型推理場景,基于「魯班」工具鏈的軟硬件協(xié)同優(yōu)化能力,超星未來最新芯片產(chǎn)品在驗證平臺上實測ChatGLM-6B可以達(dá)到超過15tokens/s的生成速度,10W量級的芯片即可支持高性能大模型的邊緣落地;「高峽」NPU平臺Stable Diffusion 1.5版本可以在3.5s內(nèi)完成圖片生成?;谝陨夏芰Γ俏磥硪雅c行業(yè)頭部的機(jī)器人客戶、大模型廠商等達(dá)成合作。

道阻且長,行則將至

共同構(gòu)建AI 2.0新時代

“我們對技術(shù)發(fā)展的預(yù)估和意識通常是低估和滯后的,技術(shù)的發(fā)展一旦突破某個閾值,就會爆炸式地增長、覆蓋,比如從ChatGPT的發(fā)布到現(xiàn)如今的‘千模大戰(zhàn)’。不論是高階的智能駕駛,還是通用機(jī)器人應(yīng)用,只要技術(shù)范式是正確的,人員與資金持續(xù)投入,‘ChatGPT時刻’就一定會到來,而且這個時刻或許會比我們想象得來得更快?!绷核硎?,“超星未來期待與各位合作伙伴攜手,從AI 1.0時代逐步邁進(jìn),共建AI 2.0的新時代?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31670

    瀏覽量

    270466
  • 汽車芯片
    +關(guān)注

    關(guān)注

    10

    文章

    875

    瀏覽量

    43503
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2593

    瀏覽量

    3208
收藏 人收藏

    評論

    相關(guān)推薦

    兆芯CPU近期軟硬件適配動態(tài)

    系統(tǒng)、應(yīng)急廣播系統(tǒng)、網(wǎng)絡(luò)信息安全、低代碼流程管理、數(shù)字孿生、實驗室管理、協(xié)同辦公、礦山管控、電力調(diào)度、生產(chǎn)風(fēng)險管理等軟硬件產(chǎn)品的適配認(rèn)證,為關(guān)鍵基礎(chǔ)行業(yè)的創(chuàng)新發(fā)展和數(shù)字化轉(zhuǎn)型提供了更多有利條件。
    的頭像 發(fā)表于 01-15 15:33 ?188次閱讀

    恩智浦?jǐn)y手RT-Thread全力智能工業(yè)與物聯(lián)網(wǎng)新時代

    本地活躍的嵌入式開源社區(qū)積極合作,全力。在日前舉辦的RT-Thread開發(fā)者大會(簡稱RDC)上,恩智浦MCU系統(tǒng)與應(yīng)用工程師牛曉東先生受邀發(fā)表了題為《NXP微控制器結(jié)合RT-Thread OS,
    的頭像 發(fā)表于 01-10 11:55 ?592次閱讀
    恩智浦?jǐn)y手RT-Thread全力<b class='flag-5'>賦</b><b class='flag-5'>能</b>智能工業(yè)與物聯(lián)網(wǎng)<b class='flag-5'>新時代</b>

    MediaTek天璣移動平臺騰訊會議端側(cè)AI人像分割模型

    MediaTek 與騰訊會議聯(lián)合優(yōu)化的端側(cè) NPU 虛擬背景功能,已在搭載 MediaTek 天璣旗艦芯的終端正式上線。作為雙方初次開展的軟硬件生態(tài)合作,此次聯(lián)合優(yōu)化旨在充分利用天璣移動平臺的
    的頭像 發(fā)表于 11-29 15:30 ?278次閱讀

    星融元與焱融科技AI分布式存儲軟硬件完成兼容性互認(rèn)證

    星融元與焱融科技AI分布式存儲軟硬件完成兼容性互認(rèn)證
    的頭像 發(fā)表于 11-20 16:36 ?224次閱讀
    星融元與焱融科技<b class='flag-5'>AI</b>分布式存儲<b class='flag-5'>軟硬件</b>完成兼容性互認(rèn)證

    國產(chǎn)精密信號鏈產(chǎn)品完整解決方案,軟硬件兼容TI和ADI

    國產(chǎn)精密信號鏈產(chǎn)品完整解決方案,軟硬件兼容TI和ADI
    的頭像 發(fā)表于 08-19 09:58 ?606次閱讀
    國產(chǎn)精密信號鏈產(chǎn)品完整解決方案,<b class='flag-5'>軟硬件</b>兼容TI和ADI

    RK3568 數(shù)字廣告,推動智能化新時代

    RK3568 數(shù)字廣告,推動智能化新時代
    的頭像 發(fā)表于 08-05 14:42 ?411次閱讀
    RK3568 <b class='flag-5'>賦</b><b class='flag-5'>能</b>數(shù)字廣告,推動智能化<b class='flag-5'>新時代</b>

    英特爾軟硬件構(gòu)建模塊如何幫助優(yōu)化RAG應(yīng)用

    軟硬件構(gòu)建模塊如何幫助優(yōu)化RAG應(yīng)用,在簡化部署和支持?jǐn)U展的同時,增強(qiáng)其上下文感知能力和實時響應(yīng)性能。 1 為您的應(yīng)用量身定制GenAI ChatGPT的面世改變了AI的發(fā)展格局。企業(yè)爭相利用這項新技術(shù)
    的頭像 發(fā)表于 07-24 15:12 ?517次閱讀
    英特爾<b class='flag-5'>軟硬件</b>構(gòu)建模塊如何幫助<b class='flag-5'>優(yōu)化</b>RAG應(yīng)用

    Wayve邁入AV 2.0新時代,生成式AI

    創(chuàng)新科技企業(yè) Wayve 研發(fā)出能在真實環(huán)境中自主決策的自動駕駛技術(shù)。   AI 技術(shù)的發(fā)展推動了 AV 2.0 的誕生,開創(chuàng)了自動駕駛汽車技術(shù)的新紀(jì)元。這種新技術(shù)依賴大型的、統(tǒng)一的全鏈條
    的頭像 發(fā)表于 06-07 15:14 ?1082次閱讀

    機(jī)器視覺系統(tǒng)讀取二維碼-軟硬件配置方案

    機(jī)器視覺系統(tǒng)讀取二維碼-軟硬件配置方案
    的頭像 發(fā)表于 05-24 00:56 ?711次閱讀
    機(jī)器視覺系統(tǒng)讀取二維碼-<b class='flag-5'>軟硬件</b>配置方案

    超星未來完成數(shù)億元Pre-B輪融資 開發(fā)新一代大模型推理芯片

    、并進(jìn)一步拓展產(chǎn)業(yè)合作。 超星未來是一家邊緣側(cè)人工智能芯片提供商,面向各類邊緣智能場景提供以 AI 計算芯片為核心、軟硬件協(xié)同的高能效計算方
    發(fā)表于 05-10 17:51 ?333次閱讀

    嵌入式系統(tǒng)軟硬件基礎(chǔ)知識大全

    制約的,只有硬件和軟件協(xié)同工作,才能使嵌入式系統(tǒng)正常運行。本文將從嵌入式系統(tǒng)的定義和特點出發(fā),詳細(xì)介紹其硬件和軟件的組成,并通過實例分析,深入剖析嵌入式系統(tǒng)的工作原理和應(yīng)用場景。通過對嵌入式系統(tǒng)
    發(fā)表于 05-09 14:12

    磐啟XNS1042軟硬件資料

    電子發(fā)燒友網(wǎng)站提供《磐啟XNS1042軟硬件資料.zip》資料免費下載
    發(fā)表于 05-06 10:35 ?6次下載

    電池管理系統(tǒng)(BMS)軟硬件介紹

    電子發(fā)燒友網(wǎng)站提供《電池管理系統(tǒng)(BMS)軟硬件介紹.pdf》資料免費下載
    發(fā)表于 03-27 09:20 ?9次下載

    NVIDIA宣布推出NVIDIA Blackwell平臺以計算新時代

    全新 Blackwell GPU、NVLink 和可靠性技術(shù)萬億參數(shù)規(guī)模的 AI 模型
    的頭像 發(fā)表于 03-20 09:44 ?689次閱讀

    數(shù)據(jù):構(gòu)建數(shù)據(jù)治理與AI協(xié)同閉環(huán)

    在數(shù)字化浪潮中,數(shù)據(jù)已成為企業(yè)的新型燃料,而AI則是提煉這種燃料的精煉廠。數(shù)據(jù)治理與AI協(xié)同作用,正在引領(lǐng)企業(yè)邁向更智能、更高效的未來。本文將展示企業(yè)如何通過將數(shù)據(jù)治理與
    的頭像 發(fā)表于 03-15 10:47 ?541次閱讀