欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解析英偉達(dá)成長的核心戰(zhàn)略:研發(fā)為底、生態(tài)為徑、AI為翼

jh18616091022 ? 來源:AIOT大數(shù)據(jù) ? 2023-05-26 14:47 ? 次閱讀

1、英偉達(dá):算力芯片巨頭領(lǐng)跑 AI 時代

1.1 公司簡介:全球領(lǐng)先的 GPU 龍頭廠商

公司是全球 GPU 龍頭,市場份額遙遙領(lǐng)先。英偉達(dá)(Nvidia)是一家全球 知名的技術(shù)公司,成立于 1993 年,最初以圖形處理器(GPU)起家,通過 不斷的創(chuàng)新和發(fā)展,逐漸成為了高性能計算領(lǐng)域的領(lǐng)導(dǎo)者。根據(jù) Jon Peddie Research 發(fā)布的 GPU 市場數(shù)據(jù)統(tǒng)計報告,英偉達(dá) 2022 年全年 PC GPU 出貨量高達(dá) 3034 萬塊,是 AMD 的近 4.5 倍;截至 2022 年四季度,在獨(dú)立 GPU 市場,英偉達(dá)占據(jù) 84%的市場份額,遠(yuǎn)超同業(yè)競爭公司。

英偉達(dá)的產(chǎn)品創(chuàng)新和迭代從未止步。自英偉達(dá)成立以來,其經(jīng)歷了多個重要 的發(fā)展時間點(diǎn)。其中包括 1999 年推出全球第一款 GPU、2006 年發(fā)布 Fermi 架構(gòu)、2012 年發(fā)布 Kepler 架構(gòu)、2016 年推出 AI 加速器 Tesla P100 和 Volta 架構(gòu)、以及 2020 年發(fā)布 Ampere 架構(gòu)等。這些重要時間點(diǎn)的創(chuàng)新和進(jìn)步, 為英偉達(dá)在高性能計算、人工智能、虛擬現(xiàn)實等領(lǐng)域的發(fā)展奠定了堅實的基 礎(chǔ)。

7a4b25c8-fb84-11ed-90ce-dac502259ad0.jpg

橫向拓展豐富業(yè)務(wù)產(chǎn)品線,實現(xiàn)“CPU+GPU+DPU”三芯布局。英偉達(dá)的 三芯戰(zhàn)略側(cè)重于在數(shù)據(jù)中心市場實現(xiàn) CPU、GPU和 DPU 三類硬件的布局, 旨在全面提升競爭力,滿足云計算、人工智能及機(jī)器學(xué)習(xí)等高端應(yīng)用領(lǐng)域的 需求。CPU 的加入使英偉達(dá)能夠更好地應(yīng)對各種計算任務(wù),尤其是那些需 要快速邏輯判斷和高度并行處理能力的應(yīng)用。而 DPU 則針對數(shù)據(jù)中心和網(wǎng) 絡(luò)設(shè)備的需求,具有高效處理數(shù)據(jù)包和協(xié)議的能力,為英偉達(dá)的產(chǎn)品線增添 了新的價值。通過將 CPU、GPU 和 DPU 集成到同一平臺上,英偉達(dá)可以 為客戶提供更加全面、高效的計算解決方案。目前 CPU+GPU 的產(chǎn)品組合 獲得超級計算中心的采用并即將廣泛部署于大型服務(wù)器,三芯戰(zhàn)略初顯成效。

芯片架構(gòu)是英偉達(dá)的技術(shù)核心,快速迭代的新架構(gòu)為產(chǎn)品帶來不斷的創(chuàng) 新與升級。自英偉達(dá) GPU 問世以來,其架構(gòu)經(jīng)歷了多個重要發(fā)展階段。2006 年,F(xiàn)ermi 架構(gòu)在 GPU 計算領(lǐng)域?qū)崿F(xiàn)了重大突破,Kepler 架構(gòu)進(jìn) 一步提高了能效比和 GPU 性能,并引入了動態(tài)并行處理技術(shù)。隨后, Maxwell 架構(gòu)實現(xiàn)了更加節(jié)能和高效的設(shè)計,Pascal 架構(gòu)則引入了深度 學(xué)習(xí)計算中的 Tensor Core 和 NVLink 技術(shù),以及更多的 AI 加速功能。Volta 架構(gòu)則實現(xiàn)了更高的計算能力和存儲帶寬,并引入了深度學(xué)習(xí)加速 器 Tensor Cores V100。Turing 架構(gòu)則進(jìn)一步提高了光線追蹤和圖形渲染 性能,而 Ampere 架構(gòu)則在 AI 加速、性能和能效方面實現(xiàn)了重要進(jìn)展。每一代架構(gòu)的創(chuàng)新和進(jìn)步,都為 GPU 技術(shù)在高性能計算、人工智能、虛 擬現(xiàn)實等領(lǐng)域的應(yīng)用奠定了堅實的基礎(chǔ)。

1.2 公司產(chǎn)品:多元化產(chǎn)品矩陣助力公司長期增長

英偉達(dá)產(chǎn)業(yè)布局多元化,解決客戶不同需求。GPU 產(chǎn)品為英偉達(dá)主要收入 來源,收入占比穩(wěn)定在 80%以上。相比較于 CPU,GPU 在機(jī)器學(xué)習(xí)算法有 天生的優(yōu)勢。英偉達(dá)一直專注于 GPU 的設(shè)計,同時由于 GPU 的并行計算 能力,可以通過數(shù)千個計算核心進(jìn)行深度學(xué)習(xí),英偉達(dá)開始將服務(wù)和系統(tǒng)、 軟硬件和可編程算法結(jié)合在一起,提出 CUDA 架構(gòu)。從下游應(yīng)用來看,英 偉達(dá)產(chǎn)品主要集中于游戲、專業(yè)可視化、數(shù)據(jù)中心以及自動駕駛領(lǐng)域:1)游戲市場:英偉達(dá)提供的產(chǎn)品包括 PC 游戲的 GeForce RTX 和 GeForce GTX,用于游戲和流媒體的 SHIELD 設(shè)備,用于云端游戲的 GeForce NOW, 以及用于專門控制臺游戲設(shè)備的平臺和開發(fā)服務(wù);2)專業(yè)可視化市場:英偉達(dá)除了加速 GPU 計算解決方案,同時也為汽車、 娛樂、建筑工程、石油和天然氣、醫(yī)療等行業(yè)引入新的解決方案;3)數(shù)據(jù)中心市場:英偉達(dá)使用 NVlink 技術(shù)將多個 GPU 結(jié)合在一起,加速 神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理。同時開發(fā)出 DGX 超級計算機(jī),進(jìn)行科學(xué)計算、深度 學(xué)習(xí)和機(jī)器學(xué)習(xí);4)自動駕駛市場:英偉達(dá) Drive 作為一個人工智能汽車平臺,涵蓋了從交 通擁堵到機(jī)器人出租車自動駕駛的所有領(lǐng)域。2018 年有超過 370 家自動駕 駛汽車公司開始使用 Drive,共同開發(fā)自動駕駛的人工智能系統(tǒng)。

7a54d294-fb84-11ed-90ce-dac502259ad0.jpg

游戲業(yè)務(wù):是英偉達(dá)主要產(chǎn)品線,作為基本盤見證了其里程碑式的革新。英偉達(dá)在游戲業(yè)務(wù)領(lǐng)域持續(xù)不斷的技術(shù)升級,以應(yīng)對玩家日益增長的畫質(zhì)需 求。游戲業(yè)務(wù)一直是英偉達(dá)的核心領(lǐng)域,每年都以引人注目的新產(chǎn)品展現(xiàn)其 持續(xù)的創(chuàng)新力。與前一代產(chǎn)品相比,每一代新顯卡都帶來了顯著的性能提升。從核心數(shù)量來看,英偉達(dá)顯卡產(chǎn)品的 CUDA 核心數(shù)量已從最初的 640 顆增 長到現(xiàn)在的高達(dá) 16384 顆,技術(shù)上不斷突破,包括實時光線追蹤技術(shù)等。另外,英偉達(dá)在游戲顯卡市場上有著廣泛的布局,從入門級到專業(yè)級,都提 供了相應(yīng)的產(chǎn)品。這一策略允許英偉達(dá)滿足從獨(dú)立游戲玩家到專業(yè)電競選手 的多元需求。

數(shù)據(jù)中心:持續(xù)發(fā)力,高市占率源自于英偉達(dá)持續(xù)不斷的研發(fā)與創(chuàng)新。英 偉達(dá)長期占據(jù)高端 GPU 市場的領(lǐng)導(dǎo)地位,截至目前英偉達(dá)占據(jù)全球算力芯 片 90%的市場份額。高端芯片領(lǐng)域的霸主地位主要源自于公司不斷的技術(shù) 提升所形成強(qiáng)大的技術(shù)壁壘。從 2017 到 2022 這五年間,公司先后推出了 Volta、Ampere、Hopper 等針對高性能計算和 AI 訓(xùn)練的架構(gòu),以此為基礎(chǔ) 發(fā)布了 V100、A100、H100 等高端 GPU。通過不斷的技術(shù)革新,英偉達(dá) GPU 產(chǎn)品向量雙精度浮點(diǎn)算力已從 7.8 TFLOPS 增至 30 TFLOPS。

英偉達(dá)數(shù)據(jù)中心 GPU 在 11 年間從制程工藝到核心數(shù)量,各參數(shù)全方位提 升。從 2011 年的 Tesla M2090 開始英偉達(dá)不斷更新迭代數(shù)據(jù)中心產(chǎn)品,到了 2022 年發(fā)布的英偉達(dá)全新 GPU 產(chǎn)品 NVIDIA H100,性能上已經(jīng)出現(xiàn)了 質(zhì)的飛躍。此外,英偉達(dá)在數(shù)據(jù)中心的布局不僅僅停留在 GPU,在 CPU 方 面英偉達(dá)也全面發(fā)力,在 2022 年發(fā)布了首款 CPU 產(chǎn)品 Grace。Grace 內(nèi) 臵下一代 Arm Neoverse 內(nèi)核,采用第四代 NVIDIA NVLink,從 CPU 到 GPU 連接速度超過 900GB/s,相當(dāng)于目前服務(wù)器 14 倍的帶寬速度;從 CPU 到 CPU 的速度超過 600GB/s。并且 Grace 擁有最高的內(nèi)存帶寬, 采用的新內(nèi)存 LPDDR5x 技術(shù),帶寬是 LPDDR4 的 2 倍,能源效率提高 了 10 倍,能提供更多計算能力。

7a5da68a-fb84-11ed-90ce-dac502259ad0.jpg

自動駕駛業(yè)務(wù):為英偉達(dá)提供中長期增長曲線。英偉達(dá)的自動駕駛 SoC 產(chǎn) 品線以其高性能、高能效和創(chuàng)新技術(shù)而著稱,致力于滿足不斷增長的計算需 求。英偉達(dá)推出的自動駕駛 SoC 產(chǎn)品包括先進(jìn)的 Atlan 和 Orin 芯片,它們 集成了安培架構(gòu) GPU 核心、基于 Arm 的 Grace CPU 核心、深度學(xué)習(xí)和計 算機(jī)視覺加速器單元以及 BlueField DPU 核心,以實現(xiàn)卓越的算力和性能。英偉達(dá)的 SoC 產(chǎn)品線不斷創(chuàng)新,為客戶提供卓越的性能和可靠性,幫助推 動未來智能駕駛和高度互聯(lián)的汽車發(fā)展。

最新款 Atlan SoC 算力獲得指數(shù)級提升,為自動駕駛提供充足算力。2021 年, 英偉達(dá)推出了自動駕駛 SoC Atlan,其單顆算力高達(dá) 1000TOPS,是 上一代 Orin SoC(254TOPS)的近四倍。Altan 還支持 400Gbs(40 萬兆) 網(wǎng)絡(luò)和安全網(wǎng)關(guān),可以滿足高速通信需求。同時,Atlan 可與為上一代芯片 組編寫的軟件堆棧(如 Orin 或 Xavier)兼容,使得汽車制造商和 AV 開發(fā) 人員不需要重新設(shè)計軟件就能利用新 SoC 的性能提升,大大提升使用的便 捷程度。

可視化業(yè)務(wù):技術(shù)革新助力卓越視覺與計算體驗。在過去幾年,英偉達(dá)專業(yè) 可視化業(yè)務(wù)持續(xù)推出了一系列的技術(shù)革新,包括新的GPU架構(gòu)(如Pascal、 Volta、Ampere、Ada Lovelace),更高效的顯存技術(shù)(如 GDDR6X), 以及更加智能化的軟件工具(如 RTX Studio)。這些創(chuàng)新大幅提升了英偉 達(dá)專業(yè)顯卡在高性能計算、人工智能、虛擬現(xiàn)實等領(lǐng)域的性能和可靠性,為 專業(yè)用戶提供了更加卓越的視覺體驗和計算能力。

英偉達(dá)專業(yè)顯卡技術(shù)不斷進(jìn)步,性能顯著提升。隨著英偉達(dá)專業(yè)可視化顯卡 的不斷升級,計算能力和相關(guān)性能得到了顯著提升。從最初的幾百萬個 CUDA 核心、數(shù)百 GB/s 的顯存帶寬,到現(xiàn)在的數(shù)千萬個 CUDA 核心、TB/s 級別的顯存帶寬,英偉達(dá)專業(yè)顯卡已經(jīng)成為高性能計算、人工智能、虛擬現(xiàn) 實等領(lǐng)域不可或缺的重要組成部分,為專業(yè)用戶提供了更加卓越的視覺體驗 和計算能力。

1.3 公司財務(wù):財務(wù)狀況良好,反哺研發(fā)投入上升

公司營業(yè)收入高速增長,1999-2023 財年 CAGR 24%。1996 年英偉達(dá) 的營業(yè)收入僅 391 萬美元,凈利潤虧損超過 300 萬美元。此后,英偉達(dá) 的體量快速增長,到 2023 財年營收和凈利潤分別達(dá) 270 億美元和 44 億美元,1999-2023 財年營收 CAGR 24%,凈利潤 CAGR 34%。

7a6906ba-fb84-11ed-90ce-dac502259ad0.jpg

新興市場成為英偉達(dá)主要收入來源地。分地區(qū)看,中國大陸在 2023 財 年營業(yè)收入達(dá)到 58 億美元,占總收入的 21%,而在 2003 財年中國大 陸營業(yè)收入只有 2.4 億美元,占總收入的比例僅為 13%。和中國大陸市 場一樣,亞太其他地區(qū)以及美洲其他地區(qū)都出現(xiàn)了較大的增長幅度。相 反,中國臺灣市場出現(xiàn)了較大的衰退。2003 財年,中國臺灣市場占總營 收的比例為 45%,到 2023 財年下降到 32%,而美國市場收入則保持穩(wěn) 定在 31%左右。

隨人工智能發(fā)展,數(shù)據(jù)中心業(yè)務(wù)收入增速最高,逐步成為公司最大營收 占比。從業(yè)務(wù)板塊看,英偉達(dá)下游應(yīng)用包括游戲、數(shù)據(jù)中心、專業(yè)化視 覺、汽車、OEM 及其他。其中,數(shù)據(jù)中心業(yè)務(wù)收入在 2023 財年達(dá)到 150 億美元,占據(jù)英偉達(dá)營業(yè)總收入的 56%,數(shù)據(jù)中心業(yè)務(wù)收入同比增長 41%,主要增長來源于 AI 發(fā)展及美國云服務(wù)提供商的推動。游戲業(yè)務(wù)收 入 90.7 億美元,占總營業(yè)收入的 34%,受全球游戲行業(yè)需求下行影響 同比下降 27%。汽車、代工以及專業(yè)可視化業(yè)務(wù)都保持著低速增長。

7a72a95e-fb84-11ed-90ce-dac502259ad0.jpg

英偉達(dá)凈資產(chǎn)收益率周期波動,毛利率和凈利率總體呈現(xiàn)上升趨勢。2000 財年之后,英偉達(dá)開始負(fù)責(zé) Xbox(微軟公司開發(fā)并于 2001 年發(fā) 售的一款家用電視游戲機(jī))的芯片設(shè)計工作,因為 Xbox 相比較于英偉 達(dá)其他產(chǎn)品有著相對較少的利潤率,所以 ROE 和凈利率都呈現(xiàn)下降趨 勢。在此之后英偉達(dá)依靠新產(chǎn)品的開發(fā),使得 ROE 重新上升到 34%。2008 財年英偉達(dá)已成長為全球圖像處理器行業(yè)龍頭,但因全球經(jīng)濟(jì)危機(jī) 影響,公司 ROE 和凈利率創(chuàng)新低,至 2010 財年分別達(dá)-2.69%和-2.04%。2010 年后,全球經(jīng)濟(jì)復(fù)蘇,游戲市場在新興市場蓬勃發(fā)展,英偉達(dá)游戲 部門業(yè)務(wù)及圖形處理器收入平穩(wěn)上升。2017 財年,英偉達(dá)迎來了新一輪 的增長期,產(chǎn)品全面發(fā)力,GeForce、Tesla、GRID 和 Quadro 銷售收 入相較于 2016 年都出現(xiàn)大幅度增長。

良好的營收狀況是公司增加研發(fā)投入的基本,研發(fā)投入也保障了公司營 收的持續(xù)健康成長。相比較于競爭對手 ATI 和 AMD,英偉達(dá)在競爭初期 都處于下風(fēng)。隨著研發(fā)投入的不斷增長,英偉達(dá)通過技術(shù)進(jìn)步降低成本 和產(chǎn)品價格,不斷推出新的產(chǎn)品吸引更多消費(fèi)者,優(yōu)勢逐漸凸顯。在與 ATI 競爭的周期中,英偉達(dá)的研發(fā)費(fèi)用從 1999 財年的 2507 萬美元,以 年均 55%的增長率趕上 ATI 的研發(fā)費(fèi)用,在 2005 財年達(dá)到 3.6 億美元。ATI 被 AMD 收購后,英偉達(dá)在獨(dú)立顯卡的競爭對手就變?yōu)榱?AMD。2005 年,AMD 的研發(fā)費(fèi)用為 11 億美元,是英偉達(dá)的 3.2 倍左右,而到了 2022年,英偉達(dá)的研發(fā)費(fèi)用達(dá)到了 73.4 億美元(對應(yīng) 2023 財年),是 AMD 的 1.47 倍。

研發(fā)費(fèi)用率保持高位,不斷吸引優(yōu)秀人才加入。從早期的“三團(tuán)隊-兩季 度”研發(fā)迭代模式開始,英偉達(dá)的研發(fā)目標(biāo)就一直走在市場的前端。英 偉達(dá)研發(fā)團(tuán)隊分為軟件工程、硬件工程、超大規(guī)模集成電路工程、工藝 工程、架構(gòu)和算法團(tuán)隊,負(fù)責(zé)研究開發(fā)統(tǒng)一的硬件和軟件架構(gòu),提供領(lǐng) 先市場的圖像加速技術(shù)。英偉達(dá)研發(fā)人員數(shù)量持續(xù)增長,截至 2023 財 年達(dá)到 19532 人。

2、英偉達(dá)發(fā)展歷程三部曲

2.1 1993-2000:初具規(guī)模,提升研發(fā)效率戰(zhàn)勝對手

1993 年黃仁勛、克里斯〃馬拉科夫斯基和柯蒂斯〃普利姆在美國加州創(chuàng) 立了英偉達(dá)。在創(chuàng)建之初,公司設(shè)想著個人電腦將會成為游戲、多媒體 的主流消費(fèi)設(shè)備。90 年代初,高性能圖像被使用在工作站和視頻游戲機(jī) 上,在此之后,3 件獨(dú)立事件改變了這樣的情況,推動了 3D 圖像市場 的發(fā)展:(1)微軟推出的 Windows 95 包括了視頻、音頻功能,刺激了多媒體市 場發(fā)展。3D 圖形逐漸增加的重要使得個人電腦制造商的差異性更加明顯;(2)電腦仿真渲染動畫出現(xiàn),3D 動作游戲登陸 PC 平臺;(3)在摩爾定律的推動下,IC 的集成度不斷提高,能夠?qū)⒋罅?3D 圖 形處理器放在一個芯片上。半導(dǎo)體設(shè)計和制造的不斷進(jìn)步,使得以前只 能在工作站級別獲得的高性能 3D 圖形技術(shù),現(xiàn)在能夠以合理的價格獲 得。而圖形處理器的不斷發(fā)展也帶動英偉達(dá)整體規(guī)模不斷增長。

推進(jìn)“三團(tuán)隊-兩季度”研發(fā)模式,新品不斷迭代滿足下游需求。一般圖 形市場產(chǎn)品有兩個開發(fā)周期:6-9 個月和 12-18 個月,英偉達(dá)執(zhí)行了“三 團(tuán)隊-兩季度”的運(yùn)營模式,具體方式包括三個并行開發(fā)團(tuán)隊,專注于三 個獨(dú)立的分階段產(chǎn)品開發(fā)。一個在第一年秋季,一個是在第二年春季以 及第二年秋季。這樣的運(yùn)行方式允許公司每 6 個月推出一次新產(chǎn)品,與 圖形市場產(chǎn)品周期一致,并且領(lǐng)先市場 1-2 個研發(fā)周期,從而滿足下游 需求變化。

不斷豐富產(chǎn)品矩陣滿足下游客戶不同需求。GeForce 系列是英偉達(dá)為臺 式機(jī)提供圖像處理的芯片。2002 年 11 月,英偉達(dá)推出為個人電腦市場 消費(fèi)者開發(fā)的產(chǎn)品線 GeForce FX 系列。GeForce 系列的其他產(chǎn)品,比 如 GeForce2、GeForce3、GeForce4 都能夠為不同價位的主流產(chǎn)品提 供最高的性能。

高研發(fā)帶來技術(shù)水平不斷升級,英偉達(dá)在 1996 年后接連推出旗艦產(chǎn)品, 擊敗行業(yè)競爭者。英偉達(dá)在 1996 年,推出 NV3 系列的 Riva 128 芯片, 在性能方面具有優(yōu)勢,并且芯片尺寸更小,因此結(jié)構(gòu)成本更低,通過數(shù) 據(jù)對比,RIVA128 甚至優(yōu)于下一年 Intel 推出的 i740,而且 i740 不支持 任何 OpenGL 驅(qū)動程序。在英偉達(dá)推出 RIVA TNT 時已經(jīng)沒有產(chǎn)品能夠 和其匹敵。1999 年,Intel 宣布完全退出獨(dú)立顯卡芯片組業(yè)務(wù)。而在 2000 年英偉達(dá)推出 GeForce 256,全面超過當(dāng)時行業(yè)最大競爭者 3dfx,最終 3dfx 宣布破產(chǎn)并且被英偉達(dá)收購。

7a7d884c-fb84-11ed-90ce-dac502259ad0.jpg

2.2 2001-2006:寡頭壟斷,逐步成為獨(dú)顯市場霸主

英偉達(dá)在游戲市場率先取得突破。自 1999 年 Geforce 系列推出以來, 它一直在游戲性能的創(chuàng)新和提升方面保持領(lǐng)先地位。GeForce 系列顯卡 被廣大游戲愛好者和電子競技玩家所推崇,因為它們能提供極高的圖形 渲染能力和實時光線追蹤技術(shù),以實現(xiàn)更加真實的游戲體驗。與此同時, Xbox 為代表的游戲主機(jī)興起助力了英偉達(dá)在游戲 GPU 行業(yè)的發(fā)展。英 偉達(dá)為 Xbox 視頻游戲系統(tǒng)設(shè)計的處理器利用雙處理架構(gòu)推動了其優(yōu)秀 的圖形、音頻和網(wǎng)絡(luò)功能,確立了英偉達(dá)在游戲機(jī)市場的穩(wěn)固地位。雖 然后續(xù)英偉達(dá)未能持續(xù)成為 Xbox GPU 供應(yīng)商,但是早期在 Xbox 上的 成功已經(jīng)為英偉達(dá)在游戲市場的發(fā)展奠定基礎(chǔ)。

通過收購,技術(shù)開發(fā)以及廣納人才,英偉達(dá)進(jìn)一步開拓市場,增強(qiáng)自身 實力,保持市場領(lǐng)先地位。英偉達(dá)預(yù)測未來能夠?qū)崿F(xiàn)通話和多媒體功能 的手機(jī)半導(dǎo)體將會大放異彩,因此積極通過收購移動端公司來布局移動 端圖像芯片產(chǎn)業(yè),并緊密融合 Direct3D 和 OpenGL 以最大程度地支持 第三方軟件。Direct3D 和 OpenGL 作為應(yīng)用程序編程接口,使軟件開發(fā) 人員能夠在不需要深入了解硬件特性的情況下編寫應(yīng)用程序,從而在 3D 圖形、視頻媒體通信以及超低功耗方面保持其技術(shù)的領(lǐng)先地位。為了維 護(hù)市場的領(lǐng)導(dǎo)地位,英偉達(dá)積極地招募業(yè)界經(jīng)驗豐富的 3D 圖形和通信 工程師,并持續(xù)開發(fā)新一代的 GPU、MCP 以及 UMP。

英偉達(dá)全面完善產(chǎn)品線,產(chǎn)品覆蓋高中低端下游各應(yīng)用市場。經(jīng)過了不 斷的發(fā)展,英偉達(dá)的產(chǎn)品線逐漸豐富,覆蓋了多種不同的下游應(yīng)用。首 當(dāng)其沖的是 GeForce 系列顯卡,主要針對的是個人電腦的游戲領(lǐng)域。同 時,為了滿足科研和企業(yè)市場的需求,英偉達(dá)推出了 Tesla 和 Quadro 系列的 GPU,這些產(chǎn)品被廣泛應(yīng)用于機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)、計算機(jī)視覺 等領(lǐng)域。此外,英偉達(dá)還在汽車自動駕駛等前沿領(lǐng)域推出了專門的解決 方案,如 Jetson 和 DRIVE 系列。

7a854154-fb84-11ed-90ce-dac502259ad0.jpg

2.3 2007-2023:重“芯”開始,引領(lǐng)人工智能計算

智能手機(jī)浪潮來臨,但是由于時機(jī)和定位上的失誤,英偉達(dá)錯失機(jī)遇。自蘋果系列產(chǎn)品推出后,智能手機(jī)成為一大熱點(diǎn),引領(lǐng)時代風(fēng)潮。在這樣的背景下,Intel 推出了 Atom,英偉達(dá)推出了 Tegra。然而手機(jī)芯片市 場并沒有像 PC 市場一樣被這兩個大場占領(lǐng),相反高通依靠著基帶技術(shù) 的壟斷成為了移動端市場的主流。Tegra 系列在最初是依靠英偉達(dá)在圖 像處理的優(yōu)勢為平板和游戲機(jī)研發(fā)的。當(dāng)英偉達(dá)推出 Tegra 2 系列時, 3G/4G 技術(shù)開始成為移動端市場追逐的目標(biāo)。但由于 Tegra 3 沒有能夠 整合基帶技術(shù)從而失去了占領(lǐng)市場的必要條件,而 Tegra 4 遲遲沒有發(fā) 布以及低性價比也失去了市場的青睞。

英偉達(dá)退出手機(jī)市場,轉(zhuǎn)向汽車、人工智能市場,調(diào)整競爭策略。在經(jīng) 歷了手機(jī)市場的挑戰(zhàn)后,英偉達(dá)進(jìn)行了戰(zhàn)略調(diào)整,從手機(jī)市場退出,并 將其研發(fā)重心轉(zhuǎn)向了汽車和人工智能市場。這一轉(zhuǎn)變對于英偉達(dá)來說, 不僅是其業(yè)務(wù)發(fā)展的一次機(jī)遇,更是對于行業(yè)趨勢的敏銳洞察。在汽車 市場中,英偉達(dá)通過自己的技術(shù)優(yōu)勢,推出了一系列高效能的自動駕駛 處理器,逐漸在此領(lǐng)域確立了自己的領(lǐng)導(dǎo)地位。而在人工智能市場,英 偉達(dá)的 GPU 產(chǎn)品憑借其超強(qiáng)的并行計算能力,成為了支撐深度學(xué)習(xí)和 機(jī)器學(xué)習(xí)應(yīng)用的核心設(shè)備,展現(xiàn)出強(qiáng)大的市場競爭力。

事實證明英偉達(dá)的轉(zhuǎn)型抓住了市場需求的改變,英偉達(dá) 2015-2023 年營 收增速可觀。在 2008 年全球經(jīng)濟(jì)危機(jī)爆發(fā)之后,英偉達(dá)的業(yè)務(wù)收入也 受到了經(jīng)濟(jì)危機(jī)的影響,在 2009 年和 2010 年財報中凈利潤呈現(xiàn)負(fù)值, 虧損達(dá)到三千萬和六千萬美元,但在之后的幾年中,英偉達(dá)依靠著在游 戲行業(yè)中的基礎(chǔ),繼續(xù)拓寬在可視化計算、人工智能業(yè)務(wù),并且借助于 比特幣區(qū)塊鏈對于顯卡芯片的高增長需求,在 2016 年之后,保持著 高增長的營業(yè)收入增長趨勢。高增長的凈利潤得益于英偉達(dá)每年研發(fā)費(fèi) 用的投入,使得英偉達(dá)的產(chǎn)品領(lǐng)先同行業(yè)的競爭對手,更快地拓展新業(yè) 務(wù),更早地形成進(jìn)入壁壘。而凈利潤的增長又會使得英偉達(dá)有更多的資 金進(jìn)行新產(chǎn)品的研發(fā),從而達(dá)成良性循環(huán),占據(jù)市場領(lǐng)先的地位。

7a94a414-fb84-11ed-90ce-dac502259ad0.jpg

具體從各終端來看,英偉達(dá)各方面業(yè)務(wù)保持收入增長,全面發(fā)展。從英 偉達(dá)終端用戶劃分來看,各終端產(chǎn)品收入都保持著穩(wěn)定增長。數(shù)據(jù)中心 發(fā)展加速,游戲終端依舊是英偉達(dá)重要的業(yè)務(wù)收入基礎(chǔ)。

英偉達(dá)不斷更新產(chǎn)品技術(shù), AI 市場成為主要目標(biāo),給英偉達(dá)帶來新的 增長。隨著 AI 市場的蓬勃發(fā)展,英偉達(dá)敏銳地將其定位為公司的主要發(fā) 展目標(biāo)。英偉達(dá)開發(fā)了一系列專門針對 AI 應(yīng)用的 GPU,如 Tesla、Titan 以及 Quadro 系列。這些產(chǎn)品能夠高效處理深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的大規(guī) 模并行計算,極大地推動了 AI 的發(fā)展。2020 年在 SC20 超級計算大會 上,NVIDIA 發(fā)布了新一代 DGX Station A100 以及 NVIDIA A100 80GB GPU 支持諸如 BERT Large 推理等復(fù)雜的對話式 AI 模型。此后在 2022 年 3 月,NVIDIA 又宣布推出第四代 NVIDIA DGX系統(tǒng),是全球首個 基于全新 NVIDIA H100 Tensor Core GPU 的 AI 平臺,徹底占據(jù) AI 市場 領(lǐng)先地位。

總結(jié):當(dāng) iPhone 出現(xiàn)后,全球智能手機(jī)市場的帷幕被拉開。移動端 GPU 市場逐漸成為了大家的焦點(diǎn)。但英偉達(dá)并沒有能夠在手機(jī) GPU 市場取 得較打的成功,但英偉達(dá)將手機(jī)GPU芯片Tegra用在了其他應(yīng)用領(lǐng)域, 為公司打開了新的業(yè)務(wù)市場。

3、英偉達(dá)發(fā)展歷程總結(jié),借鑒意義

3.1 深耕 GPU 算力領(lǐng)域,研發(fā)為導(dǎo)向不斷提升產(chǎn)品競爭力

采用主流 API,借助微軟推廣產(chǎn)品。從英偉達(dá)創(chuàng)立時,公司就以市場需 求為導(dǎo)向。通過匹配主流 API,不斷技術(shù)更新逐漸減低產(chǎn)品價格,達(dá)到 消費(fèi)者需求,以此來達(dá)到一家初創(chuàng)公司占領(lǐng)市場的目的。英偉達(dá)在設(shè)計 NV2 后的產(chǎn)品時,都將微軟推出的 DirectX 作為匹配的 API。憑借著微 軟 Windows 系列在操作系統(tǒng)市場占有大量份額,同時對 DirectX 和 OpenGL 加速優(yōu)化,使得英偉達(dá)的產(chǎn)品廣受歡迎。

7aa284bc-fb84-11ed-90ce-dac502259ad0.jpg

壓縮開發(fā)周期領(lǐng)先市場,為下游廠商提供更好的產(chǎn)品。英偉達(dá)把握住了 從 2D 到 3D 過渡的風(fēng)潮,通過成熟的研發(fā)體系,用速度甩開 2D 圖形廠 商。英偉達(dá)圖形業(yè)務(wù)的快速產(chǎn)品周期得益于其運(yùn)營模式。一般圖形市場 產(chǎn)品有兩個開發(fā)周期:6-9 個月和 12-18 個月,英偉達(dá)執(zhí)行了“三團(tuán)隊兩季度”的運(yùn)營模式,具體方式包括三個并行開發(fā)團(tuán)隊,專注于三個獨(dú) 立的分階段產(chǎn)品開發(fā)。一個在第一年秋季,一個是在第二年春季以及第 二年秋季。這樣的運(yùn)行方式允許公司每 6 個月推出一次新產(chǎn)品,與圖形 市場產(chǎn)品周期一致,并且領(lǐng)先市場 1-2 個研發(fā)周期。此外為解決芯片硬 件開發(fā)比軟件開發(fā)慢的問題(軟件可以快速測試并經(jīng)過調(diào)試,通常是每天或每周一次;相比之下,芯片硬件就必須構(gòu)建掩模并在進(jìn)行電子測試 之前完成初步制造),英偉達(dá)大力投資了仿真技術(shù),從而提升效率。

在產(chǎn)品布局多元化初期,用產(chǎn)品交叉服務(wù)市場。英偉達(dá)在經(jīng)歷了手機(jī)端 芯片市場開拓的失敗之后,并沒有停止 Tegra 處理器的研發(fā),而是改變 產(chǎn)品定位,將 Tegra 處理器運(yùn)用在智能汽車、智慧城市和云端服務(wù)上。于是英偉達(dá)初步奠定了“兩產(chǎn)品條線-四市場”的商業(yè)模式。兩產(chǎn)品條線 包括了英偉達(dá)傳統(tǒng)產(chǎn)品 GPU 和 Tegra 處理器,而四市場則包括了游戲、 企業(yè)級、移動端、云端。

英偉達(dá)的商業(yè)模式戰(zhàn)略很好的應(yīng)對了圖像處理器市場的發(fā)展趨勢。當(dāng)時 的圖像處理器市場產(chǎn)品細(xì)化,主要分布在游戲玩家、企業(yè)級、平板電腦 和移動端用戶,不同客戶的需求差異化明顯,針對不同下游英偉達(dá)推出 了對應(yīng)的產(chǎn)品方案:(1)游戲市場:玩家希望能夠在不同的平臺無縫的進(jìn)行游戲體驗,英 偉達(dá)為此推出了端到端的服務(wù):游戲能夠在云端運(yùn)行,不需要玩家擁有 足夠高性能的電腦。大大提高了玩家碎片時間的利用率和娛樂的靈活性。(2)企業(yè)級:產(chǎn)品則是為汽車、電影、天然氣等行業(yè)提供可視化解決 方案,目的是提高行業(yè)生產(chǎn)力。英偉達(dá)面向企業(yè)市場的產(chǎn)品包括用于工 作站的 Quadro,用于高性能計算服務(wù)器的 Tesla 和用于企業(yè) VDI 應(yīng)用 程序的 GRID。(3)移動端:英偉達(dá)不再將移動端客戶拘泥于手機(jī)端用戶,而是將移 動端擴(kuò)展到移動智能設(shè)備市場,比如智能汽車、智能家居行業(yè)。英偉達(dá) 的移動戰(zhàn)略轉(zhuǎn)變?yōu)榱藢?Tegra 應(yīng)用到需要視覺設(shè)計的設(shè)備中。(4)云端服務(wù):伴隨著計算機(jī)行業(yè)的發(fā)展也成為了可視化計算服務(wù)的 重要一環(huán)。憑借云端技術(shù),英偉達(dá)將 GPU 的應(yīng)用從 PC 端拓展到服務(wù)器 和數(shù)據(jù)中心,使得更多的用戶可以使用。英偉達(dá)開發(fā)的 GRID 使 Adobe Photoshop 遠(yuǎn)程運(yùn)行,并與應(yīng)用程序交互。

7aacd32c-fb84-11ed-90ce-dac502259ad0.jpg

英偉達(dá) AMD 雙寡頭壟斷顯卡市場。在 2009 年 Intel 取消 Larrabee 圖形 顯卡項目之后,獨(dú)立顯卡市場逐漸成為了雙寡頭市場。相較于行業(yè)的潛 在新進(jìn)入者,英偉達(dá)和 AMD 擁有更長的經(jīng)營歷史、更大的客戶基礎(chǔ)、 更全面的知識產(chǎn)權(quán)和專利保護(hù),以及更多的融資、銷售、營銷和分銷資 源,二者共同構(gòu)筑了行業(yè)新進(jìn)入者無法逾越的天塹。研發(fā)方面,2005 年,AMD 的研發(fā)費(fèi)用為 11 億美元,是英偉達(dá)的 3.2 倍左右,而到了 2022 年,英偉達(dá)的研發(fā)費(fèi)用達(dá)到了 73.4 億美元(對應(yīng) 2023 財年),是 AMD 的 1.47 倍。由于性能、構(gòu)建、價格的不同,二者逐步產(chǎn)生差異化,形成 了錯位競爭。至 2022 年第三季度,英偉達(dá)基本占據(jù) 88%市場份額,AMD 則降低至 8%。

研發(fā)投入帶給英偉達(dá)高回報,在主流游戲和顯卡天梯測評上,AMD 落 后于英偉達(dá)。英偉達(dá)在 2018 年推出的 Titan RTX 和 RTX 2080 Ti 全面 超過當(dāng)時的 Radeon VII,其采取的策略是推出比 AMD 稍高的性能和價 格。即使技術(shù)比 AMD 領(lǐng)先,也會等到 AMD 推出更高性能的產(chǎn)品之后, 才會推出,以此來獲得比 AMD 更高的收益。

專利數(shù)量方面英偉達(dá)逐步反超 AMD。AMD 此前在專利數(shù)量上一直多于 英偉達(dá),但申請的數(shù)量呈現(xiàn)下降趨勢。英偉達(dá)在 2011 年之后申請專利 數(shù)量開始爆發(fā),主要因其在 2007 年之后開始研發(fā)移動端 GPU 和深度學(xué) 習(xí)領(lǐng)域,最終給 GPU 市場帶來了新的框架和更高性能的芯片。

3.2 CUDA 自成體系:從單一產(chǎn)業(yè)到生態(tài)鏈,構(gòu)建強(qiáng)護(hù)城河

CUDA 助力英偉達(dá)成長為 AI 產(chǎn)業(yè)龍頭,構(gòu)建強(qiáng)大生態(tài)護(hù)城河壁壘。CUDA 是英偉達(dá)基于其生產(chǎn)的 GPUs 的一個并行計算平臺和編程模型, 目的是便于更多的技術(shù)人員參與開發(fā)。開發(fā)人員可以通過 C/C++、 Fortran 等高級語言來調(diào)用 CUDA 的 API,來進(jìn)行并行編程,達(dá)到高性 能計算目的。CUDA 平臺的出現(xiàn)使得利用 GPU 來訓(xùn)練神經(jīng)網(wǎng)絡(luò)等高算 力模型的難度大大降低,將 GPU 的應(yīng)用從 3D 游戲和圖像處理拓展到科 學(xué)計算、大數(shù)據(jù)處理、機(jī)器學(xué)習(xí)等領(lǐng)域。這種生態(tài)系統(tǒng)的建立讓很多開 發(fā)者依賴于 CUDA,進(jìn)一步增加了英偉達(dá)的競爭優(yōu)勢。

CUDA 的低成本和兼容性成為其最重要的吸引點(diǎn)之一。英偉達(dá)的 CUDA 是一個免費(fèi)、強(qiáng)大的并行計算平臺和編程模型。安裝過程簡單且明確, 讓開發(fā)者能夠輕松快速地啟動并行編程。CUDA 對新手極其友好,特別 是對 C 語言、C++和 Fortran 的開發(fā)者。同時為支持其他編程語言,如 JavaPython 等,CUDA 還提供第三方包裝器進(jìn)行擴(kuò)展。為廣大開發(fā)者 提供了極大的便利和高效的編程體驗。操作系統(tǒng)方面,CUDA 在多種操 作系統(tǒng)上也都有良好的兼容性,包括 Windows、Linux 和 macOS。

7ab591f6-fb84-11ed-90ce-dac502259ad0.jpg

CUDA 有著豐富的社區(qū)資源和代碼庫,為編程提供良好的支持。英偉達(dá) 的 CUDA 享有強(qiáng)大的社區(qū)資源,這個社區(qū)由專業(yè)的開發(fā)者和領(lǐng)域?qū)<医M 成,他們通過分享經(jīng)驗和解答疑難問題,為 CUDA 的學(xué)習(xí)和應(yīng)用提供了 豐富的支持。另外,CUDA 的代碼庫資源涵蓋各種計算應(yīng)用,具有極高 的參考價值,為開發(fā)者在并行計算領(lǐng)域的創(chuàng)新和實踐提供了寶貴的資源。這兩大特點(diǎn)共同推動了 CUDA 在并行計算領(lǐng)域的領(lǐng)先地位。

CUDA 借助燕尾服效應(yīng),搭配 GeForce 覆蓋多元市場。CUDA 技術(shù)最 初是為了配合 GeForce 系列芯片而推出的,利用 GeForce 在游戲市場 的廣泛覆蓋率,作為一個技術(shù)杠桿,推動 CUDA 的普及和發(fā)展。作為一 項可以幫助 GeForce 拓展新的市場的重要技術(shù),CUDA 極大地提高了視 頻和圖像應(yīng)用(如 CyberLink、Motion DSP 和 Nero)的性能,實現(xiàn)了 多倍的效率提升。

創(chuàng)業(yè)公司的大量采用使得 CUDA 應(yīng)用場景進(jìn)一步得到拓展,游戲不再是 唯一應(yīng)用領(lǐng)域。隨著時間的推移,超過一百家創(chuàng)業(yè)公司開始利用 CUDA 的強(qiáng)大計算能力,使其應(yīng)用領(lǐng)域得以擴(kuò)展,不再局限于游戲方面。在視 頻編碼領(lǐng)域,英偉達(dá)與 Elemental 公司合作,利用并行計算技術(shù)加速了 高清視頻的壓縮、上傳和存儲速度。這一成功的合作不僅體現(xiàn)了 CUDA 在各種場景下的適用性,也進(jìn)一步推動了 CUDA 技術(shù)的發(fā)展。當(dāng) Elemental 公司后被亞馬遜收購,其基于 CUDA 的視頻處理技術(shù)也成為 AWS 的服務(wù)組成部分,這一過程也讓 CUDA 的使用場景得到了進(jìn)一步 的豐富和拓寬。

CUDA 形成完整生態(tài)鏈,通過大學(xué)普及學(xué)習(xí)以推廣 CUDA。英偉達(dá)將 CUDA 引入了大學(xué)的課堂中,從源頭上擴(kuò)大了 CUDA 的使用范圍和受眾 群體。早在 2010 年,已經(jīng)有關(guān)于 CUDA 數(shù)千篇論文,超過 350 所大學(xué) 進(jìn)行 CUDA 教學(xué)課程。在此基礎(chǔ)之上,英偉達(dá)建立了 CUDA 認(rèn)證計劃、 研究中心、教學(xué)中心,不斷完善 CUDA 的生態(tài)鏈。從結(jié)果看:2008 年 僅有 100 所大學(xué)教學(xué) CUDA 課程,在 2010 年英偉達(dá)全球建立了 20 個 CUDA 研發(fā)中心后,2015 年已有 800 所大學(xué)開放 CUDA 課程。

對比 OpenCL,CUDA 是英偉達(dá) GPU 編程的更優(yōu)解。OpenCL 雖然具 有更廣的兼容性,但 CUDA 由于與英偉達(dá)的硬件緊密結(jié)合,能更有效地 利用其 GPU 的性能。同時,CUDA 的編程模型相比 OpenCL 更加簡潔, 易用,并提供完整的開發(fā)工具鏈。此外,CUDA 的社區(qū)資源豐富,代碼 庫多樣,使得在科學(xué)計算、深度學(xué)習(xí)等領(lǐng)域的應(yīng)用更為便捷。因此,對 英偉達(dá) GPU 的開發(fā)者來說,CUDA 往往是更優(yōu)的選擇。

7ac03d9a-fb84-11ed-90ce-dac502259ad0.jpg

對比 ADM 的 CTM 編程模型,CUDA 擁有更廣泛的應(yīng)用和更高的操作 性。從操作性來說,由于 CTM 更接近硬件,因此開發(fā)者需要有更深入 的硬件知識才能進(jìn)行開發(fā),但是這也意味著 CTM 能夠提供更精細(xì)的控 制和優(yōu)化。對比之下,CUDA 提供了一套完整的開發(fā)工具鏈,包括編譯 器、調(diào)試器和性能分析工具,以及豐富的庫函數(shù),為開發(fā)者提供了極大 的便利。從應(yīng)用來說,CUDA 已經(jīng)在各種領(lǐng)域獲得了廣泛的應(yīng)用,尤其 是在科學(xué)計算和深度學(xué)習(xí)等領(lǐng)域,CUDA 擁有大量的優(yōu)化庫和開發(fā)工具。而 CTM 的應(yīng)用相對較少,但是由于它提供了對硬件的低級別控制,因 此在一些特定的應(yīng)用場景中會具有優(yōu)勢。

對比微軟的 DirectCompute, CUDA 勝 在配套設(shè)施的支持。與 DirectCompute 相比,CUDA 由于其豐富的功能庫,完善的開發(fā)工具和 廣泛的應(yīng)用支持,尤其在科學(xué)計算和深度學(xué)習(xí)領(lǐng)域,具有明顯優(yōu)勢。CUDA 在英偉達(dá) GPU 上的性能優(yōu)化也更為出色。而 DirectCompute 作 為跨平臺工具,其優(yōu)勢在于與DirectX的兼容性以及對多種硬件的支持。但從英偉達(dá) GPU 的應(yīng)用廣泛度來看,使用 CUDA 才是開發(fā)者的首選??偟膩碚f,雖然 DirectCompute 的通用性更強(qiáng),但英偉達(dá)的 CUDA 在功 能、性能和應(yīng)用范圍上提供了更強(qiáng)大的支持,對于使用英偉達(dá)硬件的開 發(fā)者來說是更優(yōu)的選擇。

CUDA 的開發(fā)提升了英偉達(dá)的品牌競爭力和影響力。CUDA 的開發(fā)使英 偉達(dá)的 GPU 超越了僅用于圖形處理的傳統(tǒng)角色,轉(zhuǎn)變?yōu)橥ㄓ玫牟⑿杏?算設(shè)備,極大地提升了其在市場上的競爭力。英偉達(dá)因此能夠滿足廣泛 的高性能計算和人工智能需求,使其產(chǎn)品得以進(jìn)入新的市場領(lǐng)域。同時, 隨著 CUDA 在各類高性能計算任務(wù),特別是人工智能領(lǐng)域的廣泛應(yīng)用, 英偉達(dá)的品牌影響力得到了顯著增強(qiáng)。越來越多的人開始認(rèn)知和使用英 偉達(dá)的產(chǎn)品,這不僅加強(qiáng)了英偉達(dá)的市場地位,也為其未來的發(fā)展奠定 了堅實的基礎(chǔ)。

CUDA 促進(jìn)了英偉達(dá)的產(chǎn)品創(chuàng)新,激發(fā)更多可能性。CUDA 的開發(fā)推動 了英偉達(dá)在并行計算技術(shù)領(lǐng)域的創(chuàng)新,尤其在硬件架構(gòu)方面。這不僅體 現(xiàn)在優(yōu)化了的 GPU 架構(gòu)上,例如將流多處理器(SM)配臵為處理并行 線程的方式,也在軟件架構(gòu)上如 CUDA 自身的持續(xù)更新和優(yōu)化。為了更 有效地滿足用戶對于更高性能和更易用并行計算工具的需求,英偉達(dá)不 斷創(chuàng)新,致力于提高 CUDA 的性能和用戶體驗。這一切不僅反映出英偉 達(dá)對創(chuàng)新的重視,也為其在并行計算技術(shù)領(lǐng)域的領(lǐng)導(dǎo)地位提供了堅實的 技術(shù)支撐。

7ac90fba-fb84-11ed-90ce-dac502259ad0.jpg

英偉達(dá)的 CUDA 技術(shù)憑借其廣泛應(yīng)用和強(qiáng)大合作伙伴網(wǎng)絡(luò),鞏固了英偉 達(dá)的領(lǐng)導(dǎo)地位。CUDA 技術(shù)在眾多領(lǐng)域均有廣泛應(yīng)用,包括但不限于深 度學(xué)習(xí)、圖像和自然語言處理、天氣模擬、流體動力學(xué)、分子動力學(xué)、 量子化學(xué)以及天體物理模擬。因此,適配 CUDA 的應(yīng)用程序數(shù)量繁多, 進(jìn)而催生了對 CUDA 的廣闊需求空間。英偉達(dá)與諸如 Dell、HP、聯(lián)想 等知名 OEM 廠商,以及 Netapp、Pure Storage 等渠道合作伙伴和如埃 森哲等服務(wù)公司展開了深度合作。

CUDA 整合英偉達(dá)體系,培養(yǎng)了開發(fā)者和使用者的用戶粘性。當(dāng)開發(fā)者 融入 CUDA 的生態(tài)系統(tǒng),他們往往會被其卓越的計算性能、充裕的庫函 數(shù)和出色的易用性所吸引,因此更傾向于持續(xù)利用此技術(shù)。另一方面, 為 CUDA 優(yōu)化的代碼移植至其他平臺通常需要消耗大量的精力和時間, 這進(jìn)一步增強(qiáng)了客戶的留存度。此外,英偉達(dá)不斷推陳出新,發(fā)布新的 硬件產(chǎn)品及 CUDA 版本,從而維持用戶對其技術(shù)的關(guān)注并持續(xù)使用。這 種深度使用使得用戶在選購硬件產(chǎn)品時傾向于選擇對 CUDA 有更好支 持的英偉達(dá)產(chǎn)品,進(jìn)而建立起穩(wěn)固的客戶忠誠度。

3.3 抓住人工智能發(fā)展浪潮,順利轉(zhuǎn)型切入算力芯片領(lǐng)域

根據(jù) IDC 的測算,全球數(shù)據(jù)總量將以每年 50%的增速不斷增長,在 2025 年數(shù)據(jù)量會增加到 334ZB,在 2035 年則將達(dá)到 19267ZB。隨著 5G 落地, 應(yīng)用方案更加具象化,未來隨之出現(xiàn)的數(shù)據(jù)總量和數(shù)據(jù)分析需求將會持 續(xù)上升。增長的數(shù)據(jù)量主要來源于 IoT、移動互聯(lián)網(wǎng)、智慧城市、自動 駕駛。大數(shù)據(jù)的應(yīng)用將會從商業(yè)分析向工業(yè)、交通、政府管理、醫(yī)療、 教育等等行業(yè)滲透,并且成為產(chǎn)業(yè)供應(yīng)鏈中不可或缺的一部分。

從目前的測算來看,智能駕駛將是算力要求最高的應(yīng)用層面。一方面汽 車駕駛對于安全可靠性性要求最高,另一方面 L5 級別的汽車會攜帶的 傳感器將達(dá)到 32 個,據(jù)麥肯錫估算一輛自動駕駛汽車的數(shù)據(jù)量將達(dá)到 4TB/h,Intel 測算出的一天數(shù)據(jù)量將達(dá)到 4000GB。而英偉達(dá)的 Xavier 目前只有 1.3TFlops,還達(dá)不到處理 L5 的數(shù)據(jù)能力,自動駕駛和 ADAS 市場在接下來的 10 年之間有望保持較高增長的態(tài)勢,因此智能駕駛以 及 ADAS 存在著巨大的算力缺口。

人工智能產(chǎn)業(yè)將拉動 GPU 行業(yè)發(fā)展。根據(jù) Tractica 的數(shù)據(jù),2018 年全 球 AI 硬件市場的收入為 196 億美元,其中 GPU 的收入占 36.2%為 71 億美元。而在 2025 年將達(dá)到 2349 億美元,其中 GPU 的收入占 23.2% 為 545 億美元。盡管 GPU 市場占比出現(xiàn)下滑,但是全球 AI 硬件市場在 不斷上升,將會給 GPU 市場帶來更多的增長空間。

7ad78158-fb84-11ed-90ce-dac502259ad0.png

CPU 受到摩爾定律約束,應(yīng)用性能增幅下降。人工智能的到來沒有因為 摩爾定律的放緩而停止到來。登納德定律是通過縮小晶體管的尺寸和電 壓讓設(shè)計師在保持功率密度時提高晶體管的密度和速度。但目前受到物 理條件的限制,CPU 架構(gòu)師需要大量增加電路和能量,獲得有限的 ILP(指令級并行)。因此,在后摩爾定律時代,CPU 晶體管需要消耗更多 的性能導(dǎo)致應(yīng)用性能的小幅提高。最近幾年 CPU 的性能僅以每年 10% 的速度增長,而過去是每年 50%。

GPU 憑借超高運(yùn)算速度成為高性能計算的寵兒,相比 CPU 提高了數(shù)倍 的計算效率。在人工智能領(lǐng)域,圖形處理器(GPU)憑借其卓越的并行 計算能力和大規(guī)模處理單元,成為大數(shù)據(jù)運(yùn)算的主力。這在深度學(xué)習(xí)模 型的訓(xùn)練和推斷等任務(wù)中表現(xiàn)得尤為明顯。盡管中央處理器(CPU)在 順序化任務(wù)處理方面具有優(yōu)勢,但其并行計算性能遠(yuǎn)不如 GPU。自 2006 年亞馬遜在卷積神經(jīng)網(wǎng)絡(luò)(CNN)中首次使用 GPU,其效率就已顯著 優(yōu)于 CPU。如今,隨著技術(shù)不斷發(fā)展和更新,GPU 在運(yùn)算效率上進(jìn)一 步超越 CPU,堅定地確立了其在 AI 時代的算力核心地位。

盡管 FPGA 具有編程靈活性,但 GPU 的處理效率卻更勝一籌。FPGA 是專用集成電路(ASIC)中的一種半定制電路,被稱為現(xiàn)場可編程門陣 列,其性能介于定制電路和可編程器件之間??梢酝ㄟ^硬件描述語言 (HDL)按照特定任務(wù)或者應(yīng)用程序的需求來搭配相應(yīng)的 HDL。相比較 于 ASIC,F(xiàn)PGA 能夠使用 OpenCL 快速編程,更加具有成本效益。微 軟預(yù)測基于 FPGA 的 BrainWave 推理平臺可以在達(dá)到每秒約傳輸 500 張圖像。但是對比這兩種硬件,GPU 從效率上更顯優(yōu)勢,例如英偉達(dá)的 Tesla P4 就能夠在 75w 的能耗上一秒傳輸 1676 張圖像。

英偉達(dá)以其創(chuàng)新力和高市場份額,在全球 GPU 市場中居于領(lǐng)導(dǎo)地位。英偉達(dá) GPU 領(lǐng)域享有顯著的市場份額,在 2022 年 Q3 英偉達(dá)市場占有 率達(dá)到了歷史新高 88%。這一優(yōu)勢體現(xiàn)了其在行業(yè)中的龍頭地位。其持 續(xù)的技術(shù)創(chuàng)新和強(qiáng)大的研發(fā)實力,尤其是 CUDA 并行計算平臺的推出, 進(jìn)一步鞏固了其在市場中的優(yōu)越地位。在人工智能和機(jī)器學(xué)習(xí)的加速應(yīng) 用下,英偉達(dá)的 GPU 已成為行業(yè)內(nèi)的首選解決方案,廣泛應(yīng)用于各個 領(lǐng)域,從游戲和專業(yè)視覺應(yīng)用到數(shù)據(jù)中心和自動駕駛汽車。

回顧英偉達(dá)的發(fā)展歷程,其成功的經(jīng)驗在于以下幾點(diǎn):(1)英偉達(dá)持續(xù)十幾年深耕 GPU 高性能計算潛力,產(chǎn)品矩陣豐富,抓 住下游人工智能和 5G 浪潮,推動 GPU 市場從游戲顯卡轉(zhuǎn)變?yōu)?AI 計算 加速處理器;(2)搭建 CUDA 生態(tài),提高自身產(chǎn)品附加值,構(gòu)建強(qiáng)大的軟件護(hù)城河 壁壘。通過大學(xué)、研究院加快 CUDA 開發(fā),吸引人工智能行業(yè)人員加入 CUDA,將其打造成英偉達(dá) GPU 核心競爭力;(3)加大研發(fā)投入,強(qiáng)大的研發(fā)能力使英偉達(dá)能夠?qū)嵤﹦?chuàng)新技術(shù),不斷 更新 GPU 架構(gòu)拓展業(yè)務(wù)范圍,擴(kuò)大 GPU 市場,提高營收和利潤率,達(dá) 成產(chǎn)業(yè)鏈的良性循環(huán)。

解析復(fù)盤英偉達(dá),借鑒算力龍頭發(fā)展路徑。伴隨生成式 AI 火熱,大模型 持續(xù)發(fā)展對算力提出更高要求,英偉達(dá)進(jìn)入快速發(fā)展時期。我們認(rèn)為復(fù) 盤英偉達(dá)能夠?qū)W習(xí)海外龍頭的成長經(jīng)驗,為國產(chǎn)廠商提供發(fā)展思路。此 外,隨國內(nèi)算力行業(yè)國產(chǎn)替代進(jìn)程持續(xù)推進(jìn),看好國產(chǎn)供應(yīng)鏈廠商發(fā)展 機(jī)遇。

4、算力是 AI 底層土壤,從英偉達(dá)看國產(chǎn)發(fā)展機(jī)遇

4.1 ChatGPT 激起 AI 浪潮,大模型升級推動算力提升

AI 人工智能的發(fā)展主要依賴兩個領(lǐng)域的創(chuàng)新和演進(jìn):一是模仿人腦建立 起來的數(shù)學(xué)模型和算法,其次是半導(dǎo)體集成電路 AI 芯片。AI 的發(fā)展一 直伴隨著半導(dǎo)體芯片的演進(jìn)過程,20 世紀(jì) 90 年代,貝爾實驗室的楊立昆(Yann LeCun)等人一起開發(fā)了可以通過訓(xùn)練來識別手寫郵政編碼的 神 經(jīng) 網(wǎng) 絡(luò) , 但 在 那 個 時 期 , 訓(xùn) 練 一 個 深 度 學(xué) 習(xí) 卷 積 神 經(jīng) 網(wǎng) 絡(luò) (Convolutional Neural Network,CNN)需要 3 天的時間,因此無法實 際使用,而硬件計算能力的不足,也導(dǎo)致了當(dāng)時 AI 科技泡沫的破滅。

AI 芯片是 AI 發(fā)展的底層基石。英偉達(dá)早在 1999 年就發(fā)明出 GPU,但 直到2009年才由斯坦福大學(xué)發(fā)表論文介紹了如何利用現(xiàn)代 GPU遠(yuǎn)超過 多核 CPU 的計算能力(超過 70 倍),把 AI 訓(xùn)練時間從幾周縮短到了 幾小時。算力、模型、數(shù)據(jù)一直是 AI 發(fā)展的三大要素,而 AI 芯片所代 表的算力則是人工智能的底層基石。

ChatGPT 爆火的背后是人工智能大模型的迭代升級。ChatGPT 是基于 GPT-3.5 微調(diào)得到的新版本模型,能夠借助人類反饋的強(qiáng)化學(xué)習(xí)(RLHF) 技術(shù)來指導(dǎo)模型訓(xùn)練,實現(xiàn)模型輸出與人類預(yù)期的需求,使對話內(nèi)容更 加人性化和富有邏輯性。從 2008 年第一代生成式預(yù)訓(xùn)練模型 GPT-1 誕 生以來,GPT 系列模型幾乎按照每年一代的速度進(jìn)行迭代升級,未來隨 著大語言模型(LLM)技術(shù)的不斷突破,AI 相關(guān)應(yīng)用有望加速落地,AI 產(chǎn)業(yè)或?qū)⒂瓉硇乱惠啺l(fā)展機(jī)遇。

大模型發(fā)展將不斷降低 AI 應(yīng)用門檻,助力下游降本增效推動滲透率提 升。預(yù)訓(xùn)練大模型在海量數(shù)據(jù)的學(xué)習(xí)訓(xùn)練后具有良好的通用性和泛化性, 用戶基于大模型通過零樣本、小樣本學(xué)習(xí)即可獲得領(lǐng)先的效果,能夠顯 著降低 AI 應(yīng)用的門檻,目前主流的大模型包括 Transformer、GAN、CNN 以及 RNN 等架構(gòu)。

大語言模型(LLM)代表著 AI 領(lǐng)域的重大進(jìn)步,并有望通過習(xí)得的知 識改變該領(lǐng)域。根據(jù)英偉達(dá),在過去幾年中,LLM 的規(guī)模每年增加 10 倍,而且隨著這些模型的復(fù)雜程度和規(guī)模的增加,其性能也在不斷發(fā)展。大語言模型是一種基于深度學(xué)習(xí)的自然語言處理技術(shù),其主要目的是通 過學(xué)習(xí)大量文本數(shù)據(jù)從而自動生成符合語言規(guī)則的語句、段落甚至文章?;?Transformer 架構(gòu),大語言模型的核心思想是利用深度神經(jīng)網(wǎng)絡(luò)來 學(xué)習(xí)自然語言的語法、語義等特征,從而能夠預(yù)測下一個詞匯的出現(xiàn)概 率,并根據(jù)這些概率生成新的語句。Transformer 架構(gòu)在海量數(shù)據(jù)集上 并行處理數(shù)據(jù)排序的計算能力是大語言模型背后的最大驅(qū)動力。

基于 Transformer 架構(gòu),GPT 采用預(yù)訓(xùn)練的方法來學(xué)習(xí)語言的概率分 布模型,經(jīng)過微調(diào)后可以解決各種自然語言處理任務(wù)、生成自然流暢的 文本。其工作原理如下:1)數(shù)據(jù)收集和監(jiān)督訓(xùn)練。模型用示例提示進(jìn)行訓(xùn)練,由人類向模型演示 所需的輸出。然后由人類對模型進(jìn)行監(jiān)督和微調(diào),直到它能夠進(jìn)行滿足 所需性能水平的輸出。2)可比數(shù)據(jù)集手機(jī)和模型的獎勵訓(xùn)練。對于相同的示例,向模型演示多 個輸出并從最好到最差排序。已經(jīng)通過監(jiān)督訓(xùn)練的模型將生成盡可能接 近預(yù)期結(jié)果的輸出。用多組數(shù)據(jù)輸出來訓(xùn)練模型以生成排名最高的輸出。3)使用強(qiáng)化學(xué)習(xí)來優(yōu)化模型。當(dāng)該模型產(chǎn)生一個排名最高的輸出時,它 會得到獎勵以強(qiáng)化這種積極的結(jié)果。訓(xùn)練過的模型生成輸出后,獎勵模 型計算獎勵,如果新輸出排名較高則模型策略會自動更新。

與傳統(tǒng)人工智能不同,生成式 AI 具有創(chuàng)造性能力。傳統(tǒng)的人工智能模 型建立在具有預(yù)測性的判別統(tǒng)計模型上,其側(cè)重于從現(xiàn)有數(shù)據(jù)中識別模 式。而生成式模型則可以基于一組底層數(shù)據(jù)輸入來生成新的數(shù)據(jù)實例。生成式人工智能從底層數(shù)據(jù)集生成、創(chuàng)建新內(nèi)容,以文本、圖像、音頻、 視頻、代碼等形式生成原始想法,超越了傳統(tǒng)的模式檢測和扭曲數(shù)據(jù)分 析。生成式 AI 能夠打破人與機(jī)器之間的通信障礙,使得人類用自然語言 而不是編程語言與計算機(jī)進(jìn)行通信。

Transformer架構(gòu)已經(jīng)成為神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中最重要的架構(gòu)之一。傳統(tǒng)上, 自然語言處理領(lǐng)域中使用的大多數(shù)模型都基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN), 這些模型存在計算復(fù)雜度高、難以并行計算等眾多局限性。而 Transformer 架構(gòu)基于注意力機(jī)制,比傳統(tǒng)的 RNN 和 CNN 更快、更穩(wěn) 定,并且具有更高的準(zhǔn)確率,更容易并行化。該技術(shù)大大減少了訓(xùn)練模 型的時間和對結(jié)構(gòu)化數(shù)據(jù)集的依賴,提高了人工智能的自主學(xué)習(xí)能力。

生成式 AI 主要依賴于人工智能大模型,具有參數(shù)多、包含數(shù)據(jù)量大等 特點(diǎn)。這些模型通常包含數(shù)十億至數(shù)萬億個參數(shù),需要龐大的數(shù)據(jù)集進(jìn) 行訓(xùn)練,根據(jù)《AIGC 發(fā)展報告 2023》數(shù)據(jù),國外主要 AIGC 預(yù)訓(xùn)練模 型參數(shù)規(guī)模在 6.4 億至 5400 億之間,平均參數(shù)量高達(dá) 1541 億。未來大 模型的訓(xùn)練數(shù)據(jù)不僅限于文字,還可以包括圖像、視頻等多種形式。與 自然語言處理模型相比,多模態(tài)模型訓(xùn)練數(shù)據(jù)為圖像、視頻等,規(guī)模遠(yuǎn)大 于語言類模型,因此需要更多的計算資源和算力來支持模型的訓(xùn)練和推 理。

4.2 算力芯片快速增長,GPU 占據(jù) AI 芯片主流地位

算力需求激增,AI 應(yīng)用發(fā)展仍需跨越當(dāng)前算力鴻溝。根據(jù) OpenAI 數(shù)據(jù),2012-2018 年期間,人工智能訓(xùn)練任務(wù)中使用的算力正呈指數(shù)級增長, 速度為每3.5個月翻一倍,人們對于算力的需求增長了超過300,000倍。相比之下,摩爾定律是每 18 個月翻倍,如果是以摩爾定律的速度,這 期間只會有 12 倍的增長。根據(jù) IDC 數(shù)據(jù),中國 AI 算力規(guī)模將保持高速 增長,預(yù)計到 2026 年將達(dá) 1271.4EFLOPS,CAGRA(2022-2026 年) 達(dá) 52.3%。

算力需求的快速增長與芯片計算能力的增長形成剪刀差,推動 AI 芯片 市場規(guī)模不斷發(fā)展。當(dāng)前模型計算量的增長遠(yuǎn)超人工智能硬件算力的增 長,二者性能增長之間的不匹配,剪刀差的擴(kuò)大將帶來對算力基礎(chǔ)設(shè)施 供給需求的不斷增長,以及算力硬件供給需求的快速增長。根據(jù) Gartner 數(shù)據(jù),2025 年人工智能芯片市場規(guī)模將從 2020 年的 101 億美元增長至 726 億美元,CAGR(2020-2025)為 48.4%。

AI 芯片是 AI 算力的核心,需求有望率先擴(kuò)張。AI 芯片是用于加速人工 智能訓(xùn)練和推理任務(wù)的專用硬件,主要包括 GPU、FPGA、ASIC 等, 具有高度并行性和能夠?qū)崿F(xiàn)低功耗高效計算的特點(diǎn)。CPU 是 AI 計算的 基礎(chǔ),負(fù)責(zé)控制和協(xié)調(diào)所有的計算操作。在 AI 計算過程中,CPU 用于 讀取和準(zhǔn)備數(shù)據(jù),并將數(shù)據(jù)來傳輸?shù)?GPU 等協(xié)處理器進(jìn)行計算,最后 輸出計算結(jié)果,是整個計算過程的控制核心。根據(jù) IDC 數(shù)據(jù),CPU 在 基礎(chǔ)型、高性能型、推理型、訓(xùn)練型服務(wù)器中成本占比分別為 32%、23.3%、 25%、9.8%,是各類服務(wù)器處理計算任務(wù)的基礎(chǔ)硬件。

GPU、FPGA、ASIC 是 AI 計算的核心,作為加速芯片處理大規(guī)模并行 計算。具體來看,GPU 通用性較強(qiáng),適合大規(guī)模并行計算,且設(shè)計及制 造工藝較成熟,目前占據(jù) AI 芯片市場的主要份額;FPGA 具有開發(fā)周期 短、上市速度快、可配臵性等特點(diǎn),目前被大量應(yīng)用于線上數(shù)據(jù)處理中 心和軍工單位;ASIC 根據(jù)特定需求進(jìn)行設(shè)計,在性能、能效、成本均 極大的超越了標(biāo)準(zhǔn)芯片,非常適合 AI 計算場景,是當(dāng)前大部分 AI 初創(chuàng) 公司開發(fā)的目標(biāo)產(chǎn)品。

相比于少核心串行結(jié)構(gòu)的 CPU,多核心的并行結(jié)構(gòu) GPU 更適合處理圖 形圖像(矩陣結(jié)構(gòu))信息。CPU 通常有 4 個、8 個或 16 個強(qiáng)力 ALU 核 心(arithmetic logic unit,算術(shù)邏輯單元),適合做復(fù)雜的通用串行任務(wù)。GPU 是圖形計算的重要元件,主要用來處理與圖形圖像相關(guān)的數(shù)據(jù)。與 CPU 不同的是,GPU 有數(shù)百甚至數(shù)千個簡單 ALU 核心,單個 ALU 處 理能力相比 CPU 的更弱,但能夠?qū)崿F(xiàn)多個 ALU 并行計算,適合做簡單 特定的并行任務(wù)。因此,對于復(fù)雜的單個計算任務(wù)來說,CPU 的執(zhí)行效 率更高,通用性更強(qiáng);而對于圖形圖像這種矩陣式多像素點(diǎn)的簡單計算, 更適合用 GPU 來處理,但通用性較弱。

具有并行計算架構(gòu)的 GPU 是 AI 算力的重要支撐,相較 CPU 在 AI 研究 和開發(fā)中具有更高的效率。21 世紀(jì)初期,研究人員意識到,由于機(jī)器學(xué) 習(xí)算法通常具有與圖形處理算法相同類型的計算,因此 GPU 可以為機(jī) 器學(xué)習(xí)提供基于 CPU 計算的更有效的替代方案。GPU 能夠提供卓越的 并行性能,由此可以有效加速 AI 計算,滿足不斷發(fā)展的算力需求。GPU 提供的計算效率不僅僅能夠簡化了分析過程,還能促進(jìn)更廣泛的模型訓(xùn) 練以獲得更高的準(zhǔn)確性,擴(kuò)大了模型搜索過程的范圍以防止替代規(guī)范, 使以前無法實現(xiàn)的某些模型變得可行,并允許對替代數(shù)據(jù)集增加額外的 敏感性以確保其穩(wěn)健性。

GPU 在 AI 研究和開發(fā)中的重要性不斷增加。AI 芯片中,GPU 占據(jù)主 要市場規(guī)模。根據(jù) IDC 數(shù)據(jù),2022 年國內(nèi)人工智能芯片市場中,GPU 芯片所占市場份額達(dá) 89.0%。GPU 作為市場上 Al 計算最成熟、應(yīng)用最 廣泛的通用型芯片,應(yīng)用潛力較大,其并行計算架構(gòu)相較于其他 AI 芯片 更加適合于復(fù)雜數(shù)學(xué)計算場景,支持高度并行的工作負(fù)載。

英偉達(dá)是全球領(lǐng)先的 GPU 和 AI 芯片制造商之一。在國內(nèi) GPU 市場, 英偉達(dá)占據(jù)了主要份額。IDC 數(shù)據(jù)顯示,2020 年英偉達(dá)在國內(nèi) GPU 服 務(wù)器市場幾乎占據(jù) 95%左右的市場份額。通過研究英偉達(dá)的發(fā)展路徑和 戰(zhàn)略,能夠幫助國內(nèi)企業(yè)更好地了解 GPU 的應(yīng)用和未來趨勢,為國內(nèi) 企業(yè)提供寶貴的借鑒和啟示。

4.3 AI 芯片領(lǐng)域,***迅速崛起

全球GPU芯片市場主要由海外廠商占據(jù)壟斷地位,國產(chǎn)廠商加速布局。全球 GPU 市場被英偉達(dá)、英特爾和 AMD 三強(qiáng)壟斷,英偉達(dá)憑借其自身 CUDA 生態(tài)在 AI 及高性能計算占據(jù)絕對主導(dǎo)地位;國內(nèi)市場中,景嘉微 在圖形渲染 GPU 領(lǐng)域持續(xù)深耕,另外天數(shù)智芯、壁仞科技、登臨科技 等一批主打 AI 及高性能計算的 GPGPU 初創(chuàng)企業(yè)正加速涌入。

圖形渲染 GPU:目前國內(nèi)廠商在圖形渲染 GPU 方面與國外龍頭廠商差距不斷縮小。芯動科技的“風(fēng)華 2 號”GPU 采用 5nm 工藝制程,與 Nvidia 最新一代產(chǎn)品 RTX40 系列持平,實現(xiàn)國產(chǎn)圖形渲染 GPU 破局。景嘉微 在工藝制程、核心頻率、浮點(diǎn)性能等方面雖落后于 Nvidia 同代產(chǎn)品,但 差距正逐漸縮小。

ASIC 不同于 CPU、GPU、FPGA,目前全球 ASIC 市場并未形成明顯 的頭部廠商,國產(chǎn)廠商快速發(fā)展;通過產(chǎn)品對比發(fā)現(xiàn),目前國產(chǎn)廠商集 中采用 7nm 工藝制程,與國外 ASIC 廠商相同;算力方面,海思的昇騰 910 在 BF16 浮點(diǎn)算力和 INT8 定點(diǎn)算力方面超越 Googel 最新一代產(chǎn)品 TPUv4,遂原科技和寒武紀(jì)的產(chǎn)品在整體性能上也與 Googel 比肩。未 來國產(chǎn)廠商有望在 ASIC 領(lǐng)域繼續(xù)保持技術(shù)優(yōu)勢,突破國外廠商在 AI 芯 片的壟斷格局。

4.4 國產(chǎn)算力公司梳理

龍芯中科:國產(chǎn) CPU 設(shè)計標(biāo)桿,自主研發(fā) GPGPU

公司主要從事處理器(CPU)及配套芯片的研制、銷售及服務(wù)。主要產(chǎn) 品包括龍芯 1 號、龍芯 2 號、龍芯 3 號三大系列處理器芯片及橋片 等配套芯片,系列產(chǎn)品在電子政務(wù)、能源、交通、金融、電信、教育等 行業(yè)領(lǐng)域已獲得廣泛運(yùn)用。

龍芯成功構(gòu)建獨(dú)立信息技術(shù)體系的 CPU,不斷推出基于 LoongArch 架 構(gòu)的芯片。龍芯基于自主指令系統(tǒng),決心構(gòu)建獨(dú)立于 Wintel 和 AA 體系 的開放信息技術(shù)體系的 CPU。龍芯技術(shù)上的持續(xù)積累使其成功地建立了 自己的指令系統(tǒng)架構(gòu) LoongArch。在 2021 年和 2022 年,公司相繼推出 了多款基于 LA 架構(gòu)的芯片產(chǎn)品,目前已經(jīng)擁有 9 顆基于 LA 架構(gòu)的芯片 產(chǎn)品。

海光信息:國產(chǎn)高端處理器龍頭,CPU+DCU 雙輪驅(qū)動

公司主營產(chǎn)品包括海光通用處理器(CPU)和海光協(xié)處理器(DCU)。海光 CPU 主要面向復(fù)雜邏輯計算、多任務(wù)調(diào)度等通用處理器應(yīng)用場景 需求,兼容國際主流 x86 處理器架構(gòu)和技術(shù)路線。從應(yīng)用場景看,海 光 CPU 分為 7000、5000、3000 三個系列,分別定位于高端服務(wù)器、 中低端服務(wù)器和邊緣計算服務(wù)器。海光 DCU 是公司基于 GPGPU 架構(gòu) 設(shè)計的一款協(xié)處理器,目前以 8000 系列為主,面向服務(wù)器集群或數(shù)據(jù) 中心。海光 DCU 全面兼容 ROCm GPU 計算生態(tài),能夠較好地適配國 際主流商業(yè)計算軟件,解決了產(chǎn)品推廣過程中的軟件生態(tài)兼容性問題。

CPU 與 DPU 持續(xù)迭代,性能比肩國際主流廠商。CPU 方面,目前海光 一號和海光二號已經(jīng)實現(xiàn)量產(chǎn),海光三號已經(jīng)正式發(fā)布,海光四號目前 進(jìn)入研發(fā)階段。海光 CPU 的性能在國內(nèi)處于領(lǐng)先地位,但與國際廠商 在高端產(chǎn)品性能上有所差距,接近 Intel 中端產(chǎn)品水平;DCU 方面,深 算一號已實現(xiàn)商業(yè)化應(yīng)用,深算二號已于 2020 年 1 月啟動研發(fā)。在典 型應(yīng)用場景下,公司深算一號指標(biāo)達(dá)到國際上同類型高端產(chǎn)品的水平。

寒武紀(jì):國產(chǎn) AI 芯片領(lǐng)先者

寒武紀(jì)是 AI 芯片領(lǐng)域的獨(dú)角獸。公司成立于 2016 年 3 月 15 日, 專注于人工智能芯片產(chǎn)品的研發(fā)與技術(shù)創(chuàng)新,產(chǎn)品廣泛應(yīng)用于消費(fèi)電子、 數(shù)據(jù)中心、云計算等諸多場景。公司是 AI 芯片領(lǐng)域的獨(dú)角獸:采用公 司終端智能處理器 IP 的終端設(shè)備已出貨過億臺;云端智能芯片及加速 卡也已應(yīng)用到國內(nèi)主流服務(wù)器廠商的產(chǎn)品中,并已實現(xiàn)量產(chǎn)出貨;邊緣 智能芯片及加速卡的發(fā)布標(biāo)志著公司已形成全面覆蓋云端、邊緣端和終 端場景的系列化智能芯片產(chǎn)品布局。

人工智能的各類應(yīng)用場景,從云端溢出到邊緣端,或下沉到終端,都離 不開智能芯片的高效支撐。公司面向云端、邊緣端、終端推出了三個系 列不同品類的通用型智能芯片與處理器產(chǎn)品,分別為終端智能處理器 IP、 云端智能芯片及加速卡、邊緣智能芯片及加速卡。

復(fù)旦微電:國內(nèi) FPGA 領(lǐng)軍企業(yè),多元化產(chǎn)品打開增長空間

24 年潛心鉆研,高端芯片國產(chǎn)化的開創(chuàng)性先鋒。公司成立兩年后就成為 國內(nèi)首家上市的 IC 設(shè)計公司,二十余年發(fā)展過程中又陸續(xù)成為首家獲得 IC 制造商的國際注冊代碼,推出國內(nèi)首個非接觸卡等產(chǎn)品,打破國外廠 商壟斷并在諸多領(lǐng)域取得突破。目前,復(fù)旦微的 RFID 芯片、智能卡芯 片、EEPROM、智能電表 MCU 等多類產(chǎn)品市占率都位列前茅。此外, 復(fù)旦微推出的億門級 FPGA 產(chǎn)品已實現(xiàn)供貨,填補(bǔ)了國產(chǎn)高端 FPGA 的 空白,具有取代進(jìn)口 FPGA 產(chǎn)品的巨大潛力。

復(fù)旦微電產(chǎn)品應(yīng)用廣泛,獲得業(yè)內(nèi)認(rèn)可。作為國內(nèi)頂尖的集成電路設(shè)計 企業(yè),公司以二十多年的深厚積淀構(gòu)建了多元化的產(chǎn)品線。其 RFID 芯 片、智能卡芯片、EEPROM 以及智能電表 MCU 等多種產(chǎn)品在市場上享 有領(lǐng)先地位,獲得了三星、LG、VIVO 等海內(nèi)外知名廠商的高度認(rèn)可。

FPGA 芯片國內(nèi)技術(shù)領(lǐng)軍者,國產(chǎn)替代種子選手。復(fù)旦微在國內(nèi) FPGA 領(lǐng)域處于領(lǐng)先地位,目前可提供千萬門級、億門級 FPGA 芯片以及嵌入 式可編程芯片等系列產(chǎn)品。研發(fā)方面,當(dāng)前一方面基于 14/16nm 工藝制 程開發(fā) 10 億門級產(chǎn)品,另一方面豐富 28nm 制程的 FPGA 及 PSoC 芯 片種類,繼續(xù)保持在國產(chǎn) FPGA 技術(shù)的領(lǐng)先地位。

安路科技:民用 FPGA 領(lǐng)先廠商,國產(chǎn)替代正當(dāng)時

安路科技是國內(nèi)領(lǐng)先的 FPGA 芯片設(shè)計企業(yè)。安路科技成立于 2011 年, 自成立至今,公司一直專注于 FPGA 芯片設(shè)計領(lǐng)域,通過多年的技術(shù)累 積,公司在 FPGA 芯片設(shè)計技術(shù)、SoC 系統(tǒng)集成技術(shù)、FPGA 專用 EDA 軟 件技術(shù)、FPGA 芯片測試技術(shù)和 FPGA 應(yīng)用解決方案等領(lǐng)域均有技術(shù)突破。公司主要專注于 FPGA 芯片和專用 EDA 軟件的研發(fā)、設(shè)計和銷售。產(chǎn)品的 主要下游應(yīng)用領(lǐng)域主要包括工業(yè)控制、網(wǎng)絡(luò)通信、消費(fèi)電子和數(shù)據(jù)中心 等。

公司主要向客戶提供 FPGA 產(chǎn)品,包括 FPGA 芯片和專用 EDA 軟件兩部 分。基于目前的核心技術(shù)體系,公司成功構(gòu)建了由 ELF 系列、EAGLE 系 列和 PHOENIX 系列 FPGA 芯片和 TangDynasty 系列專用 EDA 軟件組成的 產(chǎn)品矩陣,2021 年,公司 FPSoC 產(chǎn)品新增了面向工業(yè)和視頻接口的低功 耗 SWIFT 系列。公司產(chǎn)品覆蓋 28nm-55nm 的工藝制程,形成了多種邏輯 規(guī)模 FPGA 芯片和軟件的全產(chǎn)品線覆蓋,并持續(xù)致力于高容量、高性能的 FPGA 和 FPSoC 芯片的研發(fā)與拓展。公司目前已成為國內(nèi)領(lǐng)先的 FPGA 芯 片供應(yīng)商,產(chǎn)品已廣泛應(yīng)用于工業(yè)控制、網(wǎng)絡(luò)通信、數(shù)據(jù)中心、消費(fèi)電 子等產(chǎn)業(yè)中。

布局卡位打造軟硬件生態(tài)體系行業(yè)壁壘較高,公司未來成長邏輯清晰。公司立足于中低端 CPLD 產(chǎn)品起步,產(chǎn)品從幾十、幾百 K 的高性價比產(chǎn) 品到目前 400K 的中高端產(chǎn)品全覆蓋,客戶積累深厚。公司采用軟硬件 協(xié)同模式,軟件配套構(gòu)建良好生態(tài),其自主開發(fā)的 FPGA 專用 EDA 軟 件擁有較高技術(shù)水平,是國內(nèi)目前擁有最多客戶的國產(chǎn) EDA 廠商,可以 立足于廣大的客戶群體,不斷反饋完善自身軟件和配套的生態(tài)體系,打 造自身軟硬件護(hù)城河。正是因為 FPGA 芯片行業(yè)需要廠商同時具備較高 的硬件芯片設(shè)計能力以及軟件開發(fā)能力,行業(yè)進(jìn)入壁壘較高。公司作為 目前國產(chǎn) FPGA 芯片行業(yè)的領(lǐng)先廠商,立足 FPGA 行業(yè)快速增長,擁有 廣闊國產(chǎn)替代空間,提前布局卡位未來競爭優(yōu)勢明顯,稀缺性成長性兼 備,伴隨中高端產(chǎn)品放量,未來成長邏輯清晰。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31711

    瀏覽量

    270507
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3854

    瀏覽量

    92076
  • 算力芯片
    +關(guān)注

    關(guān)注

    0

    文章

    47

    瀏覽量

    4592

原文標(biāo)題:解析英偉達(dá)成長的核心戰(zhàn)略:研發(fā)為底、生態(tài)為徑、AI為翼

文章出處:【微信號:AIOT大數(shù)據(jù),微信公眾號:AIOT大數(shù)據(jù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    smart與元戎啟行達(dá)成戰(zhàn)略合作 布局智能駕駛AI大模型

    “含AI量”夠不夠?已經(jīng)成為2025年消費(fèi)者衡量汽車是否值得購買的重要標(biāo)準(zhǔn)。 ? 近日,smart與人工智能企業(yè)元戎啟行宣布達(dá)成戰(zhàn)略合作,率先搶跑AI賽道,
    發(fā)表于 01-17 09:26 ?415次閱讀
    smart與元戎啟行<b class='flag-5'>達(dá)成</b><b class='flag-5'>戰(zhàn)略</b>合作 布局智能駕駛<b class='flag-5'>AI</b>大模型

    美銀分析師:英偉達(dá)加大“物理AI”投入明智之舉

    近日,美國銀行的分析師對英偉達(dá)在“物理AI”領(lǐng)域的最新動向發(fā)表了評論。分析師指出,英偉達(dá)決定加大對“物理AI”的投入,是其在人工智能領(lǐng)域發(fā)展的合乎邏輯的下一步舉措。 “物理
    的頭像 發(fā)表于 01-08 10:51 ?246次閱讀

    雷鳥創(chuàng)新與阿里云達(dá)成戰(zhàn)略合作,引領(lǐng) AI大模型與AR眼鏡融合新紀(jì)元

    大模型與AI眼鏡硬件廠商開展的深度定制合作,阿里云通義系列大模型將為雷鳥創(chuàng)新的AI眼鏡提供全套AI技術(shù)和產(chǎn)品支持。這也是阿里云在AI眼鏡領(lǐng)域的首個戰(zhàn)
    發(fā)表于 01-03 13:45 ?144次閱讀
    雷鳥創(chuàng)新與阿里云<b class='flag-5'>達(dá)成</b><b class='flag-5'>戰(zhàn)略</b>合作,引領(lǐng) <b class='flag-5'>AI</b>大模型與AR眼鏡融合新紀(jì)元

    英偉達(dá)收購AI初創(chuàng)公司Run:ai

    :ai作為一家專注于AI云計算軟件平臺開發(fā)的初創(chuàng)公司,其產(chǎn)品以高效利用高性能GPU資源核心,致力于用戶提供更快速、更便捷的機(jī)器學(xué)習(xí)加速方
    的頭像 發(fā)表于 12-31 10:46 ?238次閱讀

    安謀科技與智源研究院達(dá)成戰(zhàn)略合作,共建開源AI“芯”生態(tài)

    12月25日,安謀科技(中國)有限公司(以下簡稱“安謀科技”)與北京智源人工智能研究院(以下簡稱“智源研究院”)正式簽署戰(zhàn)略合作協(xié)議,雙方將面向多元AI芯片領(lǐng)域開展算子庫優(yōu)化與適配、編譯器與工具鏈
    發(fā)表于 12-26 17:06 ?237次閱讀
    安謀科技與智源研究院<b class='flag-5'>達(dá)成</b><b class='flag-5'>戰(zhàn)略</b>合作,共建開源<b class='flag-5'>AI</b>“芯”<b class='flag-5'>生態(tài)</b>

    支付寶與華為終端達(dá)成戰(zhàn)略合作

    近日,支付寶與華為終端正式宣布達(dá)成戰(zhàn)略合作,共同致力于鴻蒙生態(tài)與碰一下生態(tài)的深度融合與發(fā)展。
    的頭像 發(fā)表于 11-11 14:46 ?438次閱讀

    英偉達(dá)年度研發(fā)支出超120億美元,AMD的兩倍之多

    研發(fā)費(fèi)用被視為預(yù)示未來收入增長的關(guān)鍵高質(zhì)量指標(biāo)之一,而英偉達(dá)(NVIDIA)因其不斷上調(diào)的未來季度營收預(yù)期,在研發(fā)領(lǐng)域的領(lǐng)先地位超越包括AMD在內(nèi)的競爭對手,實屬意料之中。   在截至7月
    的頭像 發(fā)表于 10-15 15:53 ?729次閱讀

    vivo發(fā)布藍(lán)心智能AI戰(zhàn)略

    在2024年的vivo開發(fā)者大會上,vivo隆重推出了全新的AI戰(zhàn)略——“藍(lán)心智能”。該戰(zhàn)略核心是利用AI技術(shù)重構(gòu)系統(tǒng)體驗,
    的頭像 發(fā)表于 10-10 16:57 ?466次閱讀

    安全獲數(shù)千萬元深創(chuàng)投獨(dú)家投資

    網(wǎng)絡(luò)安全領(lǐng)域再添融資喜訊,萬安全近日宣布完成數(shù)千萬元新一輪增資,由深創(chuàng)投獨(dú)家投資。自2013年成立以來,萬安全作為網(wǎng)絡(luò)安全行業(yè)的佼佼者,始終秉持“AI+YAK”
    的頭像 發(fā)表于 09-27 11:49 ?434次閱讀

    英偉達(dá)與阿聯(lián)酋G42合作開發(fā)天氣預(yù)測AI模型

    英偉達(dá)近期宣布與阿聯(lián)酋的領(lǐng)先AI應(yīng)用開發(fā)企業(yè)G42達(dá)成戰(zhàn)略合作,共同探索天氣預(yù)測技術(shù)的新前沿。雙方將整合各自的技術(shù)優(yōu)勢,依托英偉達(dá)的Eart
    的頭像 發(fā)表于 09-24 15:41 ?331次閱讀

    英偉達(dá)擬收購軟件初創(chuàng)公司Shoreline,強(qiáng)化AI軟件生態(tài)

    近日,據(jù)知情人士透露,全球領(lǐng)先的圖形處理器制造商英偉達(dá)已達(dá)成協(xié)議,將收購面向軟件開發(fā)人員的初創(chuàng)公司Shoreline.io。這次收購對Shoreline的估值達(dá)到了約1億美元,標(biāo)志著英偉達(dá)在A
    的頭像 發(fā)表于 06-19 14:34 ?749次閱讀

    非夕科技與西門子達(dá)成戰(zhàn)略合作協(xié)議,正式加入西門子Xcelerator生態(tài)

    近日,F(xiàn)lexiv非夕科技與西門子達(dá)成戰(zhàn)略合作協(xié)議,正式加入西門子 Xcelerator 生態(tài),雙方將聯(lián)合打造面向多行業(yè)的自適應(yīng)機(jī)器人應(yīng)用解決方案。
    的頭像 發(fā)表于 05-24 14:49 ?908次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    能,加速模型的訓(xùn)練和推理過程。 2. 生成式 AI 解決方案 與英偉達(dá) Grace CPU、新一代網(wǎng)絡(luò)芯片等產(chǎn)品一起,面向生成式 AI 共同組成完整解決方案,數(shù)據(jù)中心提供強(qiáng)大的計算能
    發(fā)表于 05-13 17:16

    越南FPT與英偉達(dá)達(dá)成AI全面戰(zhàn)略合作,投資2億美元興建AI工廠

    根據(jù)聲明,F(xiàn)PT將借助英偉達(dá)技術(shù)推動AI研發(fā),并為越南及全球客戶提供相關(guān)服務(wù);而英偉達(dá)則助力FPT深度挖掘AI在汽車以及數(shù)字化轉(zhuǎn)型領(lǐng)域的價值
    的頭像 發(fā)表于 04-23 16:39 ?690次閱讀

    OPPO發(fā)布1+N智能體生態(tài)戰(zhàn)略

    OPPO近日在全球科技界掀起了波瀾,正式發(fā)布了其獨(dú)特的1+N智能體生態(tài)戰(zhàn)略,標(biāo)志著這家科技巨頭在人工智能領(lǐng)域的全新布局。該戰(zhàn)略核心在于兩大組件:A
    的頭像 發(fā)表于 02-21 10:36 ?783次閱讀