亚洲精品国产成人久久久,午夜成人爽爽爽视频在线观看

遙想兩年前，ChatGPT給了世界一記AI沖擊，而DeepSeek無疑是第二記沖擊。我們不僅對(duì)DeepSeek強(qiáng)勁的性能所震撼，也讓遠(yuǎn)在大洋彼岸的OpenAI、谷歌、META等一眾玩家感受到莫大壓力，從而紛紛繼續(xù)“卷”起來，效仿DeepSeek的“開源”模式。

對(duì)于DeepSeek本身，人們關(guān)注其如何在有限算力實(shí)現(xiàn)強(qiáng)大性能，更關(guān)注其在重重條令圍城之下的未來之路。而在最近，全世界的芯片廠商集體出動(dòng)，紛紛宣布支持DeepSeek。尤其是眾多國產(chǎn)AI芯片廠商，集體發(fā)力，為DeepSeek建立了一個(gè)堅(jiān)實(shí)的后盾。

緣起：DeepSeek成功背后

為什么DeepSeek能夠掀起如此巨浪？因?yàn)榱钊梭@訝的是，目前普遍認(rèn)為DeepSeek僅僅用了550萬美元的成本實(shí)現(xiàn)了openAI上億美元做到的事。總結(jié)起來，DeepSeek有四點(diǎn)創(chuàng)新：

第一，拉低整體成本。信息顯示，DeepSeek V3模型的訓(xùn)練總計(jì)耗用278.8萬GPU小時(shí)，相當(dāng)于在2048塊H800 GPU集群上訓(xùn)練約2個(gè)月，成本為557.6萬美元。相比之下，GPT-4o的訓(xùn)練成本約為1億美元，需使用上萬塊性能更強(qiáng)的H100 GPU。同時(shí)，DeepSeek V3的成本僅為L(zhǎng)lama 3的7%。AI專家指出，達(dá)到DeepSeek V3級(jí)別的能力需接近16000顆GPU的集群。

之所以有很低的成本，是DeepSeek的模型架構(gòu)與主流設(shè)計(jì)有所不同，采用了細(xì)顆粒度的MoE（混合專家）結(jié)構(gòu)。雖然細(xì)顆粒度MoE并非首創(chuàng)，例如阿里也在探索這一方向，但DeepSeek通過這一架構(gòu)在推理時(shí)僅激活部分參數(shù)，從而顯著降低成本。此外，DeepSeek在推理機(jī)制中引入了LLA，與市場(chǎng)上常見的多頭注意力機(jī)制不同，后者需要所有參數(shù)參與計(jì)算，而DeepSeek僅激活少量參數(shù)，進(jìn)一步提升了效率。當(dāng)前先進(jìn)模型大多采用鄧氏架構(gòu)，而DeepSeek的創(chuàng)新在于通過細(xì)顆粒度MoE和LLA實(shí)現(xiàn)了更高效的推理。

第二，訓(xùn)練方法。傳統(tǒng)方法為FP32和FP16的混合精度，DeepSeek則采用FP8參數(shù)，比較敏感的組件還是FP16。分布式混合精度目前做的比較少，訓(xùn)練方法里面也有工程優(yōu)化，之前時(shí)延導(dǎo)致GPU利用率不是很高，DeepSeek用流水線并行，高效利用通信網(wǎng)絡(luò)，提升速率。

第三，編程不同。DeepSeek采用了NVIDIA PTX指令集（Parallel Thread Execution ISA）來提升執(zhí)行效能。PTX是NVIDIA GPU最底層的控制語言，用更細(xì)顆粒度來調(diào)度底層單元，將硬件調(diào)度細(xì)化。不過，此處需要注意PTX并非是CUDA的替代品，對(duì)于大部分開發(fā)者來說學(xué)習(xí)門檻較高，所以才有了CUDA來簡(jiǎn)化開發(fā)過程。

第四，AI Infra，通常集群是三層網(wǎng)絡(luò)，DeepSeek是兩層，通信庫降低PCIe消耗，減少GPU內(nèi)存消耗增高網(wǎng)絡(luò)通信速度，HF Reduce、分布式文件系統(tǒng)、調(diào)度平臺(tái)用得比較靈活。

雖說在各種突破之下，DeepSeek的表現(xiàn)驚人。但對(duì)大多數(shù)用戶來說，也許更多的體驗(yàn)是“服務(wù)器繁忙，請(qǐng)稍后再試”，除了國外對(duì)于DeepSeek的攻擊以外，也許DeepSeek的算力真的不夠用了。

根據(jù)國泰君安證券分析師舒迪、李奇測(cè)算，假設(shè)DeepSeek日均訪問量為1億次、每次提問10次，每次提問的回復(fù)用到1000個(gè)token，1000個(gè)token大概對(duì)應(yīng)750個(gè)英文字母，則DeepSeek每秒的推理算力需求為1.6*1019TOPs。在這種普通推理情境下，假設(shè)DeepSeek采用的是FP8精度的H100卡做推理，利用率50%，那么推理端H100卡的需求為16177張，A100卡的需求為51282張。

這種情況下，AI芯片就顯得格外重要了。

后盾：國產(chǎn)芯片撐起一片天

事實(shí)上，芯片算力一直都在追著大模型奔跑。換句話說，未來算力需求一定難以滿足現(xiàn)在AI發(fā)展，DeepSeek未來會(huì)面對(duì)

據(jù)OpenAI測(cè)算，自2012年以來，AI模型訓(xùn)練算力需求每3~4個(gè)月就翻一番，每年訓(xùn)練AI模型所需算力增長(zhǎng)幅度高達(dá)10倍。而連摩爾定律中，芯片計(jì)算性能翻一番的周期為18～24個(gè)月，更何況摩爾定律已經(jīng)出現(xiàn)放緩跡象。專家預(yù)測(cè)，未來幾年OpenAI僅訓(xùn)練模型?少還需要200～300億美元的硬件，Google需要200-300億美元，Anthropic需要100-200億美元，未來幾年至少投入1000億美元純粹用到訓(xùn)練?模型。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2F0117e63dj00srfxod005wd200u000h7g00eo008e.jpg&thumbnail=660x2147483647&quality=80&type=jpg

芯片廠商當(dāng)然沒有錯(cuò)過DeepSeek這一機(jī)會(huì)，比如在春節(jié)期間，國外芯片廠商接連宣布支持DeepSeek：

1月25日，AMD將DeepSeek-V3模型集成于Instinct MI300X GPU；

1月31日，NVIDIA NIM微服務(wù)預(yù)覽版支持DeepSeek-R1模型英偉達(dá)；

1月31日，英特爾DeepSeek模型能在酷睿AIPC上離線使用；

2月1日，英特爾Gaudi 2D Al加速器支持DeepSeek Janus Pro模型。

自從AI大模型來了，英偉達(dá)喝湯喝到撐，GPU也就成了香餑餑。但在地緣政治局勢(shì)愈發(fā)緊張的現(xiàn)如今，國內(nèi)高端AI芯片不斷被圍追堵截。因此，自主可控成了不可不談的問題。近幾日，DeepSeek獲國產(chǎn)芯片廠商力挺，成為支撐DeepSeek的“天團(tuán)”。

1.華為：華為云宣布與硅基流動(dòng)聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù)；DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū)；華為DCS AI全棧解決方案中的重要產(chǎn)品—ModelEngine，全面支持DeepSeek大模型R1&V3和蒸餾系列模型的本地部署與優(yōu)化，加速客戶AI應(yīng)用快速落地；

2.沐曦：Gitee AI聯(lián)合沐曦首發(fā)全套DeepSeek R1千問蒸餾模型，全免費(fèi)體驗(yàn)；DeepSeek-V3滿血版在國產(chǎn)沐曦GPU首發(fā)體驗(yàn)上線；

3.天數(shù)智芯：成功完成與 DeepSeek R1 的適配工作，并且已正式上線多款大模型服務(wù)，其中包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等；

4.摩爾線程：基于Ollama開源框架，完成了對(duì)DeepSeek-R1-Distill-Qwen-7B蒸餾模型的部署，并在多種中文任務(wù)中展現(xiàn)了優(yōu)異的性能；

5.海光信息：DeepSeek V3和R1模型完成海光DCU適配并正式上線；海光DCU成功適配DeepSeek-Janus-Pro多模態(tài)大模型；

6.壁仞科技：DeepSeek R1在壁仞國產(chǎn)AI算力平臺(tái)發(fā)布，全系列模型一站式賦能開發(fā)者創(chuàng)新；

7.太初元碁：基于太初T100加速卡2小時(shí)適配DeepSeek-R1系列模型，一鍵體驗(yàn)，免費(fèi)API服務(wù)；

8.云天勵(lì)飛：完成 DeepEdge10 “算力積木”芯片平臺(tái)與DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Llama-8B大模型的適配，可以交付客戶使用；

9.燧原科技：完成對(duì)DeepSeek全量模型的高效適配，包括DeepSeek-R1/V3 671B原生模型、DeepSeek-R1-Distill-Qwen-1.5B/7B/14B/32B、DeepSeek R1-Distill-Llama-8B/70B等蒸餾模型。截至目前，DeepSeek的全量模型已在慶陽、無錫、成都等智算中心完成了數(shù)萬卡的快速部署；

10.昆侖芯：完成全版本模型適配，這其中包括DeepSeek MoE 模型及其蒸餾的Llama/Qwen等小規(guī)模dense模型；

11.靈汐芯片：完成了DeepSeek-R1系列模型在靈汐KA200芯片及相關(guān)智算卡的適配，助力國產(chǎn)大模型與類腦智能硬件系統(tǒng)的深度融合；

12.鯤云科技：全新一代的可重構(gòu)數(shù)據(jù)流AI芯片CAISA 430成功適配DeepSeek R1蒸餾模型推理；

13.希姆計(jì)算：僅用數(shù)小時(shí)就將DeepSeek-R1全系列蒸餾模型快速適配到自研RISC-V開源指令集的推理加速卡系列之上，并落地全國多個(gè)千卡級(jí)以上智算中心；

14.算能：算能自研RISC-V開源指令集融合服務(wù)器SRM1-20，成功適配并本地部署DeepSeek-R1-Distill-Qwen-7B/1.5B模型；

15.清微智能：可重構(gòu)計(jì)算架構(gòu)RPU芯片已完成DeepSeek-R1系列模型的適配和部署運(yùn)行；

16.龍芯中科：搭載龍芯3號(hào)CPU的設(shè)備成功啟動(dòng)運(yùn)行DeepSeek R1 7B模型，實(shí)現(xiàn)本地化部署；

17.瀚博：已完成DeepSeek-V3與R1全系列模型訓(xùn)推適配，單機(jī)可支持V3與R1 671B全量滿血版模型部署。

復(fù)盤：國產(chǎn)AI芯片發(fā)展現(xiàn)狀

前兩年，美國千方百計(jì)阻止英偉達(dá)向中國出售尖端AI芯片，不想放棄中國市場(chǎng)的英偉達(dá)，迅速推出中國特供版，但對(duì)國內(nèi)來說，卻不香了。所謂中國特供芯片，性能砍了25%，但減量不減價(jià)，國產(chǎn)廠商則紛紛點(diǎn)名華為，尤其是華為升騰910B芯片。那么，除了華為，我國還有哪些AI芯片企業(yè)值得關(guān)注？

AI芯片主要分為GPGPU（通用圖形處理器）、FPGA（可編程邏輯器件）、ASIC（專用集成電路）、存算一體和類腦芯片幾種。根據(jù)在網(wǎng)絡(luò)中的位置，又可以分為云端AI芯片、邊緣和終端AI芯片。

GPU/GPGPU：與GPU不同，GPGPU就是將GPU圖形顯示部分“摘掉”，全力走通用計(jì)算，特別適合用在深度學(xué)習(xí)訓(xùn)練方面。目前國內(nèi)GPU存在許多玩家，整個(gè)行業(yè)也經(jīng)歷過一輪洗牌。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2F54b8d398j00srfxoe00f6d200u0012ng00fe00jt.jpg&thumbnail=660x2147483647&quality=80&type=jpg

FPGA：可編程的靈活性是任何其它計(jì)算芯片無法替代的，同時(shí)它在AI領(lǐng)域也具備一定計(jì)算能力，但相對(duì)來說，F(xiàn)PGA的成本就相對(duì)高一些了，而且FPGA開發(fā)也很難，軟件生態(tài)沒有GPGPU的CUDA那么方便。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2Fff8d0298j00srfxof007vd200u000oxg00f000cg.jpg&thumbnail=660x2147483647&quality=80&type=jpg

ASIC：性能強(qiáng)、功耗低，NPU也是加入神經(jīng)單元的一種ASIC，不過針對(duì)特定算法計(jì)算，算法是無法修改的，想要做另一種算法就要再造一種ASIC芯片，前期開發(fā)需要FPGA輔助進(jìn)行。

值得一提的是，TPU，全稱Tensor Processing Unit，是一種專為處理張量運(yùn)算而設(shè)計(jì)的ASIC芯片，由谷歌自研在2016年推出首款產(chǎn)品，目前國內(nèi)也有中昊芯英這一玩家。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2Fc3c99909j00srfxog002vd200rg00hgg00dq008q.jpg&thumbnail=660x2147483647&quality=80&type=jpg

存算一體：能耗比極佳，能夠突破存儲(chǔ)墻和功耗墻，但商業(yè)化進(jìn)程加速了，而且據(jù)說ST也準(zhǔn)備在未來發(fā)布具有存算一體芯片的MCU。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2Fc60bac1bj00srfxoh009ud200pa00u0g00cn00f0.jpg&thumbnail=660x2147483647&quality=80&type=jpg

類腦計(jì)算：性能更強(qiáng)、功耗更低，算法也變成了SNN，但全世界都在研究之中，還未商業(yè)化。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2025%2F0210%2F292a309dj00srfxoi007rd200su00tmg00ef00et.jpg&thumbnail=660x2147483647&quality=80&type=jpg

可重構(gòu)計(jì)算：能夠重新配置的數(shù)據(jù)流處理器架構(gòu)，專為特定用例量身定制，可在其“計(jì)算結(jié)構(gòu)”上并行執(zhí)行經(jīng)過特殊優(yōu)化的代碼。特別是在低功耗嵌入式和邊緣計(jì)算中，并且需要支持通用編程語言的專有軟件堆棧（編譯器）。

目前，可重構(gòu)計(jì)算的玩家包括清微智能、鯤云科技、千芯科技、瀾起科技。（可參考文章：《》）

融合：千行百業(yè)正在被重塑

DeepSeek誕生的本身，也在促進(jìn)著國內(nèi)所有行業(yè)的發(fā)展，形成了一個(gè)循環(huán)的產(chǎn)業(yè)鏈。千行百業(yè)，正在因?yàn)镈eepSeek而重塑，各行各業(yè)也不斷支持DeepSeek。

1.汽車產(chǎn)業(yè)：吉利汽車、東風(fēng)汽車、東風(fēng)旗下嵐圖汽車等均宣布了接入DeepSeek，大模型“上車”已經(jīng)成為大趨勢(shì)；

2.手機(jī)：華為系統(tǒng)級(jí)智能體小藝在HarmonyOS NEXT（原生鴻蒙）上接入了DeepSeek最新的R1模型，OPPO Find N5也將接入DeepSeek；

3.云計(jì)算：阿里云、百度智能云、騰訊云、華為云已經(jīng)官宣支持 DeepSeek大模型；

4.教育應(yīng)用：網(wǎng)易有道、云學(xué)堂均宣布全面擁抱DeepSeek-R1；

5.網(wǎng)絡(luò)安全：360、奇安信、啟明星辰、安恒、北信源、天融信、國投智能、安博通、永信至誠、亞信、拓爾思、觀安信息均宣布接入DeepSeek；

6.生物醫(yī)藥：恒瑞醫(yī)藥、醫(yī)渡科技、智云健康、豫資開勒均宣布了DeepSeek的接入與部署；

7.電信運(yùn)營商：三大運(yùn)營商中國移動(dòng)、聯(lián)通、電信全面宣布接入DeepSeek；

8.軟件公司：遠(yuǎn)光軟件、安恒信息、當(dāng)虹科技、萬興科技、金慧軟件接入DeepSeek模型。

總之，DeepSeek作為一次“全民狂歡”，其意義非凡。為了契合這個(gè)話題，我們也問了DeepSeek自己對(duì)于自己誕生的意義，它的回答是：DeepSeek的誕生不僅是技術(shù)上的突破，更是對(duì)AI未來形態(tài)的積極探索。它通過開源共享、垂直應(yīng)用和AGI愿景，推動(dòng)AI從“工具”向“伙伴”演進(jìn)，同時(shí)助力中國在全球AI競(jìng)爭(zhēng)中占據(jù)更重要的戰(zhàn)略地位。其意義不僅限于商業(yè)成功，更在于為人類與AI共生的未來提供了一種可能性。

作者：EEWorld電子工程世界付斌在此特別鳴謝！

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

國產(chǎn)芯片

國產(chǎn)芯片

+關(guān)注

關(guān)注
2

文章
272

瀏覽量
29906
AI芯片

AI芯片

+關(guān)注

關(guān)注
17

文章
1909

瀏覽量
35242
算力

算力

+關(guān)注

關(guān)注
1

文章
1023

瀏覽量
14971
DeepSeek

DeepSeek

+關(guān)注

關(guān)注
1

文章
175

瀏覽量
69

評(píng)論

相關(guān)推薦

國產(chǎn)AI新星DeepSeek崛起：日活超2000萬，百萬年薪搶人，或適配國產(chǎn)GPU

電子發(fā)燒友網(wǎng)報(bào)道（文/吳子鵬）在蛇年春節(jié)期間，國產(chǎn)AI大模型DeepSeek爆火，頻繁登上國內(nèi)外的熱搜榜單，成為科技界最炙手可熱的新星。根據(jù)第三方統(tǒng)計(jì)數(shù)據(jù)，DeepSeek應(yīng)用上線僅僅

發(fā)表于 02-06 09:08 ?1264次閱讀

科華數(shù)據(jù)聯(lián)合希姆計(jì)算深耕政務(wù)場(chǎng)景，打造DeepSeek加持的政務(wù)智能體一體機(jī)

的AI芯片、編譯器、工具鏈，面向DeepSeek進(jìn)行深度優(yōu)化，迅速成功適配了Deepseek-R1系列蒸餾模型，并正式推出DeepSeek加

發(fā)表于 02-10 16:20 ?155次閱讀

科華數(shù)據(jù)聯(lián)合希姆計(jì)算深耕政務(wù)場(chǎng)景，打造<b class='flag-5'>DeepSeek</b>加持的政務(wù)智能體一體機(jī)

Gitee AI 聯(lián)合沐曦首發(fā)全套 DeepSeek R1 千問蒸餾模型，全免費(fèi)體驗(yàn)！

模型相比，較小尺寸的 DeepSeek 蒸餾版本模型更適合企業(yè)內(nèi)部實(shí)施部署，可以極大的降低落地成本。同時(shí)，這次 Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平臺(tái) ，更是實(shí)現(xiàn)了從

發(fā)表于 02-10 09:56 ?23次閱讀

Gitee <b class='flag-5'>AI</b> 聯(lián)合沐曦首發(fā)全套 <b class='flag-5'>DeepSeek</b> R1 千問蒸餾模型，全免費(fèi)體驗(yàn)！

龍芯中科與DeepSeek大模型協(xié)同適配成功

龍芯中科近日宣布了一項(xiàng)重大進(jìn)展，其自主研發(fā)的龍芯3號(hào)CPU已成功運(yùn)行DeepSeek R17B模型，實(shí)現(xiàn)了本地化高效部署。這一成就標(biāo)志著國產(chǎn)芯片與AI大模型的協(xié)同適配取得了關(guān)鍵性突破，

發(fā)表于 02-10 09:14 ?203次閱讀

部署DeepSeek R1于AX650N與AX630C平臺(tái)

背景春節(jié)前，國產(chǎn)大模型 DeepSeek 橫空出世，迅速成為AI領(lǐng)域的焦點(diǎn)。作為端側(cè)AI能效比優(yōu)異的 AX650N、AX630C 芯片平臺(tái)

發(fā)表于 02-09 09:32 ?137次閱讀

部署<b class='flag-5'>DeepSeek</b> R1于AX650N與AX630C平臺(tái)

中軟國際科創(chuàng)中心上線DeepSeek模型

DeepSeek的昇騰遷移、模型部署、模型蒸餾、模型精調(diào)、SAAS應(yīng)用、Agent開發(fā)等多樣化AI服務(wù)，推動(dòng)人工智能在各領(lǐng)域的應(yīng)用，加速國產(chǎn)化AGI產(chǎn)業(yè)發(fā)展!

發(fā)表于 02-08 18:02 ?569次閱讀

后摩漫界M30芯片成功適配DeepSeek-R1系列模型

DeepSeek開源模型的熱度席卷全球，其高效性和易用性正在成為推動(dòng)AI技術(shù)普惠化的重要力量。后摩智能作為國產(chǎn)存算一體AI芯片的領(lǐng)軍企業(yè)，自

發(fā)表于 02-08 10:42 ?119次閱讀

軟通動(dòng)力天璇MaaS融合DeepSeek-R1，引領(lǐng)企業(yè)智能化轉(zhuǎn)型

驅(qū)動(dòng)”的范式轉(zhuǎn)移，為多行業(yè)AI應(yīng)用落地開辟了新路徑。作為中國數(shù)字技術(shù)產(chǎn)品和服務(wù)創(chuàng)新的領(lǐng)軍企業(yè)，軟通動(dòng)力積極響應(yīng)這一技術(shù)變革，率先與DeepSeek-R1進(jìn)行了產(chǎn)品融合創(chuàng)新。通過將DeepSeek-R1接入軟通動(dòng)力的

發(fā)表于 02-08 09:57 ?177次閱讀

阿里否認(rèn)投資DeepSeek傳聞

近日，有關(guān)阿里巴巴投資AI大模型DeepSeek的傳聞在市場(chǎng)上流傳甚廣。然而，阿里巴巴方面迅速對(duì)此進(jìn)行了澄清，明確表示并未投資DeepSeek。據(jù)阿里相關(guān)人士透露，雖然阿里巴巴與DeepSe

發(fā)表于 02-08 09:30 ?199次閱讀

“兆瀚”算力產(chǎn)品強(qiáng)力支持DeepSeek，共筑國產(chǎn)AI新生態(tài)！

，“兆瀚”系列AI服務(wù)器及相關(guān)產(chǎn)品已全面完成與DeepSeek-R1/V3系列大模型的深度適配，以卓越性能全面支持DeepSeek加快實(shí)現(xiàn)本地化部署，為國產(chǎn)

發(fā)表于 02-07 19:37 ?135次閱讀

芯動(dòng)力神速適配DeepSeek-R1大模型，AI芯片設(shè)計(jì)邁入“快車道”！

近期，國產(chǎn)大模型 DeepSeek-R1橫空出世，迅速成為AI領(lǐng)域的焦點(diǎn)。芯動(dòng)力在24小時(shí)內(nèi)完成了與DeepSeek-R1大模型的適配。 Deep

發(fā)表于 02-07 16:55 ?172次閱讀

DeepSeek-R1全尺寸版本上線Gitee AI

繼 DeepSeek 全套蒸餾模型以及 V3 版本上線后，經(jīng)過 Gitee AI 和沐曦團(tuán)隊(duì)兩天緊鑼密鼓的適配和機(jī)器籌備，DeepSeek-R1全尺寸版本現(xiàn)在已上線 Gitee

發(fā)表于 02-07 15:25 ?323次閱讀

DeepSeek對(duì)芯片算力的影響

DeepSeek模型，尤其是其基于MOE（混合專家）架構(gòu)的DeepSeek-V3，對(duì)芯片算力的要求產(chǎn)生了深遠(yuǎn)影響。為了更好地理解這一影響，我們可以從幾個(gè)方面進(jìn)行分析。一.MOE架構(gòu)對(duì)算力的優(yōu)化MOE

發(fā)表于 02-07 10:02 ?208次閱讀

解析DeepSeek MoE并行計(jì)算優(yōu)化策略

本期Kiwi Talks將從集群Scale Up互聯(lián)的需求出發(fā)，解析DeepSeek在張量并行及MoE專家并行方面采用的優(yōu)化策略。DeepSeek大模型的工程優(yōu)化以及國產(chǎn)AI 產(chǎn)業(yè)鏈的

發(fā)表于 02-07 09:20 ?373次閱讀

云天勵(lì)飛上線DeepSeek R1系列模型

春節(jié)期間，云天勵(lì)飛芯片團(tuán)隊(duì)完成 DeepEdge10 “算力積木”芯片平臺(tái)與DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek

發(fā)表于 02-06 10:39 ?214次閱讀