欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

清華「計(jì)圖」現(xiàn)在支持國產(chǎn)芯片了!

旺材芯片 ? 來源:凹非寺量子位 ? 作者:明敏 ? 2021-05-20 09:43 ? 次閱讀

清華自研的深度學(xué)習(xí)框架計(jì)圖(Jittor)在動態(tài)圖推理速度上又一次完勝PyTorch。

最近,計(jì)圖團(tuán)隊(duì)完成了在寒武紀(jì)芯片MLU270上的移植。

這一次跟寒武紀(jì)的合作,使Jittor在backbone網(wǎng)絡(luò)模型中的動態(tài)圖推理速度較PyTorch平均提升了276.69倍。

從團(tuán)隊(duì)公布的實(shí)驗(yàn)結(jié)果可以看到,在寒武紀(jì)芯片上分別用計(jì)圖(Jittor)和PyTorch進(jìn)行推理。

計(jì)圖(Jittor)在16種backbone網(wǎng)絡(luò)模型中的推理速度都較PyTorch大幅提升,其中包括alexnet、vgg系列、resnet系列。

其中最快的是alexnet,提升速度達(dá)到了464.43倍,最慢的resnet50也達(dá)到了153倍。

平均提升速度達(dá)276.69倍。

660375ea-b47b-11eb-bf61-12bb97331649.jpg

6611aa8e-b47b-11eb-bf61-12bb97331649.jpg

△表1:模型具體數(shù)值

與此同時(shí),計(jì)圖的精度損失也較PyTorch大幅減少。

66332ff6-b47b-11eb-bf61-12bb97331649.jpg

△表2:resnet18的mse誤差對比

團(tuán)隊(duì)以resnet18網(wǎng)絡(luò)為例進(jìn)行對比,baseline是CPU;結(jié)果顯示:計(jì)圖的精度損失比PyTorch降低了42.53%。

還是「元算子」的功勞

性能得到如此大的提升,是怎么實(shí)現(xiàn)的呢?

要知道,在TensorFlow,PyTorch框架底層,有上千個(gè)算子;想要移植新的硬件,就必須將大量的算子復(fù)寫,這樣一來不僅工作量劇增、而且難度也會加大。

Jittor這次還是依靠他們的核心武器——元算子。

根據(jù)Jittor官方文檔定義,元算子是指神經(jīng)網(wǎng)絡(luò)所需的基本算子。

早在設(shè)計(jì)Jittor的時(shí)候,研發(fā)團(tuán)隊(duì)就定下了一個(gè)目標(biāo),即用戶只需要數(shù)行代碼,就可定義新的算子和模型。在保證易用的同時(shí),不喪失任何可定制性。

所以在Jittor中,多個(gè)元算子之間,可以相互融合成更加復(fù)雜的算子,這些復(fù)雜算子構(gòu)成了神經(jīng)網(wǎng)絡(luò)計(jì)算的多個(gè)模塊,如卷積層,歸一化層等等。

664c0422-b47b-11eb-bf61-12bb97331649.jpg

△使用元算子實(shí)現(xiàn)卷積層

這一次將Jittor移植到寒武紀(jì)上,也是同樣的原理。

研究團(tuán)隊(duì)把神經(jīng)網(wǎng)絡(luò)所需的基本算子,定義為三類共18個(gè)元算子。

讓元算子相互融合形成常用算子,這樣就能通過優(yōu)化非常少的元算子,實(shí)現(xiàn)對常用算子性能的提升。

66677d4c-b47b-11eb-bf61-12bb97331649.jpg

并且,元算子還是反向傳播閉包,所有元算子反向傳播后依舊是元算子。

所以在完成三類元算子的移植后,Jittor天然就能支持大部分常用算子的推理和簡單訓(xùn)練。

從Jittor元算子到BANG

為了能讓用戶更為簡單地操作,Jittor內(nèi)置了元算子編譯器,可以將用戶的Python代碼動態(tài)編譯成寒武紀(jì)BANG語言。

BANG語言是專門針對寒武紀(jì)產(chǎn)品架構(gòu)的一種代碼語言,它能極大優(yōu)化寒武紀(jì)芯片的通用編程能力,提升用戶編程的自由度。

并且它還有全套編譯工具鏈來提高性能。包括CNCC(Cambricon Neuware Compiler Collection )、CNAS(Cambricon Neuware Assembler)、CNLINKER(Cambricon Neuware Linker)。

Jittor內(nèi)置的元算子編譯器可以把元算子自動轉(zhuǎn)化為BANG算子。

采用動態(tài)編譯的方式,能在運(yùn)行時(shí)獲取更多的信息,比如計(jì)算圖上下文、形狀信息等,這些信息都可以進(jìn)一步提升算子的性能。

并且,Jittor還內(nèi)置了可以根據(jù)硬件設(shè)備自動對BANG語言進(jìn)行優(yōu)化的優(yōu)化編譯遍(complier pass),從而生成對硬件設(shè)備更為適合的底層算子。

用這種方法,僅僅一行Python代碼,就能表示BatchNorm算子的核心思想。

元算子編譯器再把這行代碼自動優(yōu)化成BANG語言代碼。

由于BANG語言的設(shè)計(jì)更加成熟,提供了類似于CUDA語言的線程調(diào)度模式,使得上手和調(diào)試都更加簡單;也能更好地釋放寒武紀(jì)芯片的算力。

6678e168-b47b-11eb-bf61-12bb97331649.jpg

清華自研,首個(gè)中國高校深度學(xué)習(xí)開源框架

計(jì)圖(Jittor)的開發(fā)團(tuán)隊(duì),均來自清華大學(xué)計(jì)算機(jī)系圖形學(xué)實(shí)驗(yàn)室,負(fù)責(zé)人是清華大學(xué)計(jì)算機(jī)系的胡事民教授。

而主要負(fù)責(zé)開發(fā)的,則是來自實(shí)驗(yàn)室的博士生們:梁盾、楊國燁、楊國煒、周文洋……

計(jì)圖(Jittor)與主流的深度學(xué)習(xí)框架TensorFlow、Pytorch等最大的不同在于,它是一個(gè)完全基于動態(tài)編譯(Just-in-time)、使用元算子和統(tǒng)一計(jì)算圖的深度學(xué)習(xí)框架。

它可以不像Pytorch那樣依賴tracing機(jī)制,讓用戶的操作更加簡單,同時(shí)還可以得到更好的學(xué)習(xí)訓(xùn)練效果。

對于這一次取得的成果,開發(fā)者之一梁盾透露未來有可能發(fā)表在頂會上,并且會開源給大家。

此前,計(jì)圖開源的點(diǎn)云模型庫,在多種主流模型上訓(xùn)練性能較Pytorch提升一倍以上;并發(fā)布了第一個(gè)支持金屬度、粗糙度的可微渲染庫。

最近,他們還開源了一個(gè)智能P圖神器DeepFaceEditing,可以通過草圖自由編輯人臉。

感興趣的同學(xué)可以去試試哦~

GitHub開源:

https://github.com/IGLICT/DeepFaceEditing-Jittor

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10918

    瀏覽量

    213172
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4785

    瀏覽量

    101250
  • 寒武紀(jì)
    +關(guān)注

    關(guān)注

    11

    文章

    192

    瀏覽量

    73972
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    808

    瀏覽量

    13383

原文標(biāo)題:關(guān)注 | 清華「計(jì)圖」現(xiàn)在支持國產(chǎn)芯片了!動態(tài)圖推理比PyTorch快了270倍

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    清華芯片取得新突破,邁向AI光訓(xùn)練

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近日,清華大學(xué)發(fā)布官方消息稱,清華大學(xué)電子工程系方璐教授課題組、自動化系戴瓊海院士課題組另辟蹊徑,首創(chuàng)全前向智能光計(jì)算訓(xùn)練架構(gòu),研制“太極-II”光訓(xùn)
    的頭像 發(fā)表于 08-13 01:23 ?3301次閱讀

    國產(chǎn)芯片有能替代DAC8555芯片的嘛?

    國產(chǎn)芯片有能替代DAC8555芯片的嘛?
    發(fā)表于 11-22 15:37

    基于國產(chǎn)芯片的IPMI解決方案

    基于國產(chǎn)芯片的IPMI解決方案有重要升級??! 2024年,北京啟揚(yáng)日升科技有限公司對IPMI解決方案做了兩個(gè)方面的重大升級,一是擴(kuò)展國產(chǎn)
    的頭像 發(fā)表于 11-11 18:29 ?474次閱讀
    基于<b class='flag-5'>國產(chǎn)</b><b class='flag-5'>芯片</b>的IPMI解決方案

    【「ARM MCU嵌入式開發(fā) | 基于國產(chǎn)GD32F10x芯片」閱讀體驗(yàn)】+書籍整體概況

    一、導(dǎo)言 上周收到《ARM MCU嵌入式開發(fā) | 基于國產(chǎn)GD32F10x芯片》書籍,該紙質(zhì)書籍內(nèi)容可謂是面面俱到,由“清華大學(xué)出版社”出版,印刷第1版時(shí)間為2024年6月份,總共464千字
    發(fā)表于 08-25 22:48

    國產(chǎn)芯片

    有任何國產(chǎn)芯片替代的問題都可以找我,歡迎咨詢,或者需要國產(chǎn)芯片相關(guān)資料的都可以提供。
    發(fā)表于 07-25 16:34

    目前國產(chǎn)fpga的發(fā)展有哪些趨勢

    如今國產(chǎn)fpga也是如火如荼,請問現(xiàn)在國產(chǎn)fpga芯片的發(fā)展有哪些趨勢呢?
    發(fā)表于 06-30 08:14

    世界首款!又是清華:類腦互補(bǔ)視覺芯片“天眸芯”

    近日,清華大學(xué)在類腦視覺感知芯片領(lǐng)域取得重要突破:清華大學(xué)依托精密儀器系的類腦計(jì)算研究中心施路平教授團(tuán)隊(duì),提出一種基于視覺原語的互補(bǔ)雙通路類腦視覺感知新范式,研制出世界首款類腦互補(bǔ)視覺芯片
    的頭像 發(fā)表于 06-04 08:36 ?497次閱讀
    世界首款!又是<b class='flag-5'>清華</b>:類腦互補(bǔ)視覺<b class='flag-5'>芯片</b>“天眸芯”

    國產(chǎn)RISC-V芯片性能穩(wěn)定嗎?

    想使用國產(chǎn)的RISC-V架構(gòu)的芯片做無人機(jī)投送快遞的方案,可行性高嗎?國產(chǎn)的RISC-V MCU穩(wěn)定么?
    發(fā)表于 05-20 15:43

    我國力促芯片國產(chǎn)化進(jìn)程,預(yù)計(jì)2027年實(shí)現(xiàn)整車芯片完全國產(chǎn)

    國內(nèi)消息源透露,中國工信部已經(jīng)設(shè)定宏大的目標(biāo),計(jì)劃在明年將芯片國產(chǎn)化率提升至25%,并采用積分方式來驅(qū)動國家對國產(chǎn)芯片研發(fā)的資金
    的頭像 發(fā)表于 05-15 11:21 ?2673次閱讀
    我國力促<b class='flag-5'>芯片</b><b class='flag-5'>國產(chǎn)</b>化進(jìn)程,預(yù)計(jì)2027年實(shí)現(xiàn)整車<b class='flag-5'>芯片</b>完全<b class='flag-5'>國產(chǎn)</b>化

    國產(chǎn)riscv芯片大匯總?

    請問有統(tǒng)計(jì)國產(chǎn)的riscv芯片的嗎?能匯總一下嗎?
    發(fā)表于 04-27 11:53

    清華大學(xué)研發(fā)成功大規(guī)模干涉-衍射異構(gòu)集成芯片——太極

    4月12日公布,清華大學(xué)研發(fā)出太極芯片,實(shí)現(xiàn)每瓦160TOPS的高性能通用智能計(jì)算,這是該校電子工程系與自動化系共同攻克的難題。
    的頭像 發(fā)表于 04-12 15:50 ?511次閱讀

    國產(chǎn)車規(guī)芯片發(fā)展的怎么樣,有用過的來說說嗎?

    剛看了一個(gè)最能打的國產(chǎn)芯榜單,找到一些國產(chǎn)車規(guī)芯片,看看參數(shù)介紹感覺還不錯(cuò),大家有用過的或了解的嗎?國產(chǎn)車規(guī)芯片發(fā)展處于什么水平?用過的說說
    發(fā)表于 03-22 10:25

    騰訊攜手清華港科大推出生視頻模型:Follow-Your-Click,實(shí)現(xiàn)在線物體追蹤

    月 15 日消息,騰訊與清華大學(xué)及香港科技大學(xué)聯(lián)合發(fā)布新型生視頻模型 “Follow-Your-Click”,已上線 GitHub(代碼于四月份公開)并發(fā)布相關(guān)研究論文(查閱地址:DOI:2403.08268)。
    的頭像 發(fā)表于 03-15 16:24 ?707次閱讀

    國產(chǎn)高端fpga芯片有哪些

    國產(chǎn)高端FPGA芯片有多種,以下是一些知名的國產(chǎn)FPGA芯片
    的頭像 發(fā)表于 03-15 14:01 ?2810次閱讀

    國產(chǎn)降壓芯片有哪些?

    土化生產(chǎn),可以節(jié)省進(jìn)口稅費(fèi)、運(yùn)輸成本等,同時(shí),隨著生產(chǎn)規(guī)模的擴(kuò)大,生產(chǎn)成本也有可能進(jìn)一步降低,這些因素共同作用下,國產(chǎn)芯片在價(jià)格上可能具有一定的優(yōu)勢。 政策支持:中國政府在政策上大力支持
    的頭像 發(fā)表于 02-19 09:19 ?1058次閱讀