欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

軟件生態(tài)上超越CUDA,究竟有多難?

E4Life ? 來源:電子發(fā)燒友 ? 作者:周凱揚(yáng) ? 2024-06-20 00:09 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))近日,英偉達(dá)憑借持續(xù)上漲的股價(jià),正式超過了微軟成為全球市值最高的公司,這固然離不開GPU這一AI硬件的火熱,但之所以能一舉做到世界第一,也離不開軟件的加持,真正將其推向神壇的,還是圍繞CUDA打造的一系列軟件生態(tài)。

英偉達(dá)——CUDA的絕對(duì)統(tǒng)治

相信對(duì)GPU有過一定了解的都知道,英偉達(dá)的最大護(hù)城河就是CUDA。CUDA在后端架構(gòu)上處于絕對(duì)的統(tǒng)治地位,隨著AI發(fā)展越快,英偉達(dá)GPU+CUDA的開發(fā)生態(tài)發(fā)展愈發(fā)壯大,甚至到了很多競(jìng)爭(zhēng)對(duì)手望其項(xiàng)背的水平。CUDA自2006年推出以來,即便在AI和深度學(xué)習(xí)沒有成為主流的時(shí)期,也在不斷發(fā)展并行計(jì)算,為開發(fā)者提供豐富的庫、工具和算法。

時(shí)至今日,CUDA已經(jīng)為全球開發(fā)者打造了一個(gè)龐大的社區(qū),幾乎所有的深度學(xué)習(xí)框架,包括TensorFlow、Pytorch等都對(duì)CUDA做了優(yōu)化。為了盡快切入市場(chǎng),絕大多數(shù)開發(fā)者都更傾向于選擇CUDA作為首要計(jì)算平臺(tái)。

與此同時(shí),英偉達(dá)也在圍繞著CUDA在硬件架構(gòu)上做更深入的創(chuàng)新和升級(jí),借助更先進(jìn)的工藝和封裝技術(shù)提升計(jì)算性能和效率。比如隨著Volta架構(gòu)中引入Tensor核心后,英偉達(dá)GPU的矩陣運(yùn)算得到大幅加強(qiáng),深度學(xué)習(xí)訓(xùn)練和推理的性能實(shí)現(xiàn)飛躍。兩者結(jié)合之下,使得CUDA坐穩(wěn)了第一的寶座。

在游戲軟件領(lǐng)域,英偉達(dá)的DLSS可以說是市面上最先進(jìn)的專有超分技術(shù),且得益于持續(xù)的訓(xùn)練,每一次版本升級(jí)都能帶來圖形渲染領(lǐng)域的突破。

最后是生產(chǎn)力工具相關(guān)的軟件生態(tài)上,英偉達(dá)在這塊的優(yōu)勢(shì)就更加足了,過去蘋果與AMD還在GPU上合作之際,不少生產(chǎn)力工具還是針對(duì)AMD的GPU做了不少硬件優(yōu)化的。然而隨著蘋果走向Arm架構(gòu),英偉達(dá)慢慢在這個(gè)市場(chǎng)壯大起來。

無論是Adobe旗下的多媒體處理軟件,還是一些獨(dú)立開發(fā)商打造的軟件,很多都有英偉達(dá)CUDA硬件加速的支持,甚至連英特爾的核顯在一些軟件支持上,都要好于AMD。正因如此,除了一些特效制作相關(guān)的工作外,工作站里的AMD GPU越來越少。

盡管谷歌、英特爾和高通科技巨頭也在尋找打破CUDA壟斷地位的契機(jī),但對(duì)于軟件生態(tài)而言,合作并不一定意味著共贏,最后很可能只是為市場(chǎng)提供更多的可選擇項(xiàng),但在易用性、性能等方面,仍不如沒有駐足一路狂奔的CUDA。

AMD

AMD對(duì)于其GPU軟件生態(tài)則持以較為開放的態(tài)度,且極其重視開源開發(fā)社區(qū)。AMD的ROCm對(duì)標(biāo)的正是英偉達(dá)的CUDA,但其并沒有對(duì)硬件做出限制,除了Radeon、Instinct系列的GPU外,也在擴(kuò)展至其他硬件廠商的設(shè)備。這也得益于AMD沒有在硬件內(nèi)引入Tensor核心這樣的專有硬件,但也正是因?yàn)槿绱?,?dǎo)致其ROCm在某些任務(wù)上略顯遜色。

ROCm作為開源平臺(tái),也提供多種庫和框架支持,也有一整套的開源工具鏈。正因如此,在HPC和云計(jì)算等領(lǐng)域,廠商其實(shí)更寧愿使用AMD的GPU,而不必要忍受英偉達(dá)的專用軟件棧。但苦于英偉達(dá)先行的軟件生態(tài),他們不得不首選英偉達(dá)的GPU。

AMD即便有了ROCm,整體軟件生態(tài)的成熟度依然不敵英偉達(dá),對(duì)于HPC中部分不以商業(yè)成功為目標(biāo)的項(xiàng)目而言,AMD已經(jīng)斬獲了不少份額,比如TOP500中前十的幾臺(tái)超算。但以整個(gè)TOP500榜單來看,英偉達(dá)依然占據(jù)主導(dǎo)地位。然而對(duì)于云供應(yīng)商來說,短時(shí)間內(nèi)依然沒法擺脫英偉達(dá)的統(tǒng)治,因?yàn)樽庥眠@些云服務(wù)的客戶們,更愿意在英偉達(dá)的CUDA平臺(tái)上開發(fā)。

在驅(qū)動(dòng)軟件上,尤其是針對(duì)Linux的顯卡驅(qū)動(dòng),AMD采取了開源和閉源兩條路線,持續(xù)更新閉源驅(qū)動(dòng)的同時(shí),也允許開源社區(qū)定制化開源驅(qū)動(dòng)。以基于Linux系統(tǒng)中AMD Radeon顯卡打造的Vulkan驅(qū)動(dòng)AMDVLK為例,就支持了光線追蹤。然而,盡管開源驅(qū)動(dòng)由于手動(dòng)配置和社區(qū)貢獻(xiàn)的原因,兼容性要更高一些,但如果追求的是更高的性能,那么閉源驅(qū)動(dòng)還是更具優(yōu)勢(shì)。

摩爾線程

國(guó)產(chǎn)GPU主要分為兩個(gè)方向,分別是支持圖形渲染的和不支持圖形渲染的,后者仍然想在AI領(lǐng)域內(nèi)突破,前者在推進(jìn)C端產(chǎn)品的同時(shí),也在布局B端的一系列AI GPU產(chǎn)品。在國(guó)產(chǎn)GPU產(chǎn)品中,在軟件生態(tài)上做得比較好的當(dāng)屬摩爾線程了,他們?cè)贏I和圖形渲染上的軟件支持都有喜人的進(jìn)展。

基于MUSA這一統(tǒng)一架構(gòu),摩爾線程打造了MTT S80這樣的桌面顯卡,以及面面向服務(wù)器應(yīng)用的MTT S3000等。與之配套的,是摩爾線程打造的軟件開發(fā)平臺(tái),包括AI開發(fā)平臺(tái)、MUSA SDK、MT Smart Media和MTVerse XR等。

而且摩爾線程打造的這套生態(tài)架構(gòu)中,可以充分兼容現(xiàn)有軟件生態(tài),借助MUSIFY工具實(shí)現(xiàn)代碼零成本遷移到MUSA平臺(tái)。與AMD的ROCm一樣,MUSA做的也是兼容CUDA的路線,而不是像ZLUDA一樣重新編譯二進(jìn)制代碼,所以并不違反英偉達(dá)的EULA條款。

從摩爾線程近來官方發(fā)布的消息看來,他們?cè)贏I上選擇了逐步對(duì)大模型完成適配支持的路線。在摩爾線程的夸娥千卡智算集群上,他們已經(jīng)完成了30億到700億參數(shù)的大模型訓(xùn)練和推理適配。摩爾線程的GPU在算力上對(duì)比國(guó)際大廠還是略有遜色,不過隨著未來他們?cè)贗P、硬件設(shè)計(jì)上進(jìn)一步突破,相信他們也能打造出高性能的AI算力底座。

在針對(duì)消費(fèi)級(jí)圖形顯卡的驅(qū)動(dòng)程序上,摩爾線程也在不斷更新優(yōu)化性能。以5月底發(fā)布的v260.70版本驅(qū)動(dòng)為例,除了提供對(duì)OpenGL 4.0功能的支持和優(yōu)化Blender 3.6 LTS體驗(yàn)外,也為諸多熱門游戲在DirectX 11下的性能做了明顯優(yōu)化。盡管這類驅(qū)動(dòng)更新的規(guī)模比起英偉達(dá)還有所差距,但也代表了廠商持續(xù)優(yōu)化性能表現(xiàn)的決心。

寫在最后

其實(shí)從越來越多的廠商進(jìn)軍GPU,越來越多的GPU廠商發(fā)力AI就可以看出,即便CUDA有著深厚的生態(tài)積累,但在日新月異的AI中,其他廠商仍有分一杯羹的機(jī)會(huì),甚至可能在某個(gè)應(yīng)用中后來者居上。但在圖形渲染相關(guān)的軟件生態(tài)上,廠商面臨的技術(shù)壁壘更加厚。不僅要帶著鉆研十?dāng)?shù)年的決心,還要持續(xù)打磨硬件產(chǎn)品,與產(chǎn)業(yè)軟件生態(tài)圈合作,挖掘和培養(yǎng)更多的圖形研究人才。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4787

    瀏覽量

    129415
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    121

    瀏覽量

    13698
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3854

    瀏覽量

    92071
  • 軟件生態(tài)系統(tǒng)

    關(guān)注

    0

    文章

    7

    瀏覽量

    7139
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    OpenHarmony人才生態(tài)大會(huì)南向生態(tài)社區(qū)發(fā)展論壇在武漢圓滿舉辦

    應(yīng)用市場(chǎng),表盤工具等關(guān)鍵要素,未來將解決應(yīng)用與表盤生態(tài)問題并舉辦開發(fā)者大賽;大屏領(lǐng)域正在構(gòu)建社區(qū)大屏軟件版本,已完成基本功能開發(fā),目前與康佳、KTC、創(chuàng)維、九聯(lián)開鴻、鴻合等整機(jī)廠家以及風(fēng)行、愛奇藝等
    發(fā)表于 11-29 09:54

    有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda來加速圖像處理

    有沒有大佬知道NI vision 有沒有辦法通過gpu和cuda來加速圖像處理
    發(fā)表于 10-20 09:14

    怎么在TMDSEVM6678: 6678自帶的FFT接口和CUDA提供CUFFT函數(shù)庫選擇?

    請(qǐng)教一下gpgpu上包括4個(gè)Riscv cpu和一個(gè)DPU, 沒有6678,要替換原來信號(hào)處理用的6678,該怎么在6678自帶的FFT接口和CUDA提供CUFFT函數(shù)庫選擇?
    發(fā)表于 09-27 07:20

    迅龍軟件出席2024開放原子開源生態(tài)大會(huì),共謀開源生態(tài)繁榮之路

    2024開放原子開源生態(tài)大會(huì)于9月25至27日在北京亦莊開幕。大會(huì)將以“開源賦能產(chǎn)業(yè),生態(tài)共筑未來”為主題,匯聚政、產(chǎn)、學(xué)、研、用、金等各領(lǐng)域頂尖開源力量,共同探討行業(yè)趨勢(shì),聆聽行業(yè)巨擘見解,洞悉
    的頭像 發(fā)表于 09-26 13:51 ?485次閱讀
    迅龍<b class='flag-5'>軟件</b>出席2024開放原子開源<b class='flag-5'>生態(tài)</b>大會(huì),共謀開源<b class='flag-5'>生態(tài)</b>繁榮之路

    2024年芯片行業(yè)有多難?用數(shù)據(jù)說話

    2024年芯片行業(yè)有多難?用數(shù)據(jù)說話
    的頭像 發(fā)表于 08-10 18:20 ?4777次閱讀

    打破英偉達(dá)CUDA壁壘?AMD顯卡現(xiàn)在也能無縫適配CUDA

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態(tài),是英偉達(dá)在GPU領(lǐng)域最大的護(hù)城河,尤其是隨著目前AI領(lǐng)域的發(fā)展加速,市場(chǎng)火爆,英偉達(dá)GPU+CUDA的開發(fā)
    的頭像 發(fā)表于 07-19 00:16 ?4953次閱讀

    英國(guó)公司實(shí)現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無縫運(yùn)行

    7月18日最新資訊,英國(guó)創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實(shí)現(xiàn)了英偉達(dá)CUDA軟件在AMD GPU上的無縫遷移與運(yùn)行,標(biāo)志著在GPU計(jì)算領(lǐng)域,NVIDIA長(zhǎng)期以來的市場(chǎng)壟斷地位或?qū)⒂瓉碇卮筇魬?zhàn)。
    的頭像 發(fā)表于 07-18 14:40 ?725次閱讀

    請(qǐng)問STM32F407 USB的FIFO究竟有多少空間?

    FIFO 連接。但是另一方面,在CSR存儲(chǔ)器映射圖中,一個(gè)主機(jī)通道的 FIFO地址范圍為 0x1000 (4KB),并且主機(jī)模式下有8個(gè)這樣的通道。所以真搞不明白究竟 FIFO真正有多少空間?
    發(fā)表于 07-04 07:46

    華為生態(tài)設(shè)備崛起,大中華區(qū)全面超越蘋果

    隨著科技的飛速發(fā)展和消費(fèi)者需求的日益多元化,智能手機(jī)廠商之間的競(jìng)爭(zhēng)已經(jīng)不再是單純的產(chǎn)品競(jìng)爭(zhēng),而是擴(kuò)展到了整個(gè)生態(tài)系統(tǒng)。近日,華為在中國(guó)市場(chǎng)的表現(xiàn)引起了廣泛關(guān)注,這家科技巨頭不僅在智能手機(jī)領(lǐng)域取得了顯著成就,更在生態(tài)系統(tǒng)方面實(shí)現(xiàn)了對(duì)蘋果的全面
    的頭像 發(fā)表于 06-14 17:19 ?742次閱讀

    STM32的DAC輸出有個(gè)BUFFER功能,BUFFer的驅(qū)動(dòng)能力究竟有多大,普通的運(yùn)放輸出可以嗎?驅(qū)動(dòng)LED可以嗎?

    DAC是輸出模擬電壓給外界參考,STM32的DAC輸出有個(gè)BUFFER功能,但不知這個(gè)BUFFer的驅(qū)動(dòng)能力究竟有多大,普通的運(yùn)放輸出可以嗎?驅(qū)動(dòng)LED可以嗎?有沒有人做過這塊,給個(gè)建議,因?yàn)樽罱O(shè)計(jì)個(gè)DAC輸出調(diào)節(jié)運(yùn)放輸出,希望能有個(gè)參考。 如果外接跟隨的話,用LM358可以嗎?請(qǐng)一起討論下!?。?/div>
    發(fā)表于 05-15 07:42

    共模電感選型依據(jù)究竟有哪些

    電子發(fā)燒友網(wǎng)站提供《共模電感選型依據(jù)究竟有哪些.docx》資料免費(fèi)下載
    發(fā)表于 05-06 10:26 ?1次下載

    SMT貼片加工中元器件移位的原因究竟有哪些?

    ,元器件移位的問題仍然時(shí)有發(fā)生。那么,造成SMT貼片加工中元器件移位的原因究竟有哪些呢?接下來深圳佳金源錫膏廠家來講一下:首先,貼片機(jī)吸嘴的氣壓是影響元器件位置的重要
    的頭像 發(fā)表于 04-26 16:00 ?633次閱讀
    SMT貼片加工中元器件移位的原因<b class='flag-5'>究竟有</b>哪些?

    Keil使用AC6編譯提示CUDA版本過高怎么解決?

    \' ArmClang: warning: Unknown CUDA version 10.2. Assuming the latest supported version 10.1
    發(fā)表于 04-11 07:56

    貼片功率電感究竟有沒有正負(fù)極之分

    電子發(fā)燒友網(wǎng)站提供《貼片功率電感究竟有沒有正負(fù)極之分.docx》資料免費(fèi)下載
    發(fā)表于 02-28 10:15 ?0次下載

    什么是DMA?DMA究竟有多快!

    助于提高數(shù)據(jù)傳輸速度和系統(tǒng)效率。 那么,DMA究竟有多快呢? 實(shí)踐出真知 恰好,最近有個(gè)多通道數(shù)據(jù)采集的項(xiàng)目,受限于通道數(shù)多、分辨率高,而系統(tǒng)帶寬有限,為了盡可能充分利用有限帶寬,就得想辦法優(yōu)化時(shí)序,把時(shí)間都留給數(shù)據(jù)采集和傳輸。 優(yōu)化方向就是DMA。 硬件鏈路是A
    的頭像 發(fā)表于 02-22 10:43 ?2278次閱讀
    什么是DMA?DMA<b class='flag-5'>究竟有</b>多快!