電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI框架是一種底層開發(fā)工具,是集深度學習核心訓練和推理框架、基礎模型庫、端到端開發(fā)套件、豐富的工具組件于一體的平臺。
有了AI框架,工程師在工作時調(diào)試算法,就可以更快速、更高效。通俗一點講,AI框架相當于是AI時代的操作系統(tǒng),如同PC時代Windows,移動互聯(lián)網(wǎng)時代的iOS和安卓。
AI框架發(fā)展現(xiàn)狀和趨勢
AI框架的歷史并不算長,從2010年誕生的Theano算起,至今不過十二年時間。2017年后,早期的Theano、Caffe、Torch等框架逐漸銷聲匿跡,2016年前后出現(xiàn)的TensorFlow(谷歌)、PyTorch(Facebook)、飛槳(百度)逐漸占據(jù)市場。
從目前市場占有情況看,產(chǎn)業(yè)界以TensorFlow為主,學術界以PyTorch為主。與TensorFlow過于注重工業(yè),PyTorch專注學界不同,飛槳的特性在于工業(yè)學界兩手抓,通過動態(tài)圖自動解析編譯靜態(tài)圖的技術,兼顧了學界的靈活,同時也實現(xiàn)了產(chǎn)業(yè)界希望的高效。
除了TensorFlow、PyTorch、飛槳,深度學習框架還包括由Amazon設計研發(fā)并開源的MXNet、微軟在github上開源的CNTK、華為推出的MindSpore、北京一流科技有限公司開發(fā)的OneFlow,以及清華大學自研的Jittor,和騰訊、字節(jié)跳動、360開源的Angel、BytePS、TensorNet。
過去這些年,AI框架已形成較為完整的技術體系,當前主流AI框架的核心技術演化出三大層次,分為基礎層、組件層和生態(tài)層,其中基礎層實現(xiàn)AI框架最基礎核心的功能,具體包括編程開發(fā)、編譯優(yōu)化以及硬件使能三個子層。
從技術生態(tài)體系中的功能定位看,AI框架對下調(diào)用底層硬件計算資源,對上支撐AI應用算法模型搭建,提供算法工程化實現(xiàn)的標準環(huán)境,是AI技術體系的關鍵核心。
AI框架技術持續(xù)演進,歷經(jīng)萌芽階段、成長階段、穩(wěn)定階段,當前已進入深化階段。AI框架正向著超大規(guī)模AI、全場景支持、安全可信等技術特性深化探索。
AI框架面臨的挑戰(zhàn)
然而在這個探索的過程中,面臨諸多挑戰(zhàn)。在超大規(guī)模AI方面,當前超大規(guī)模AI成為新的深度學習范式。OpenAI于2020年5月發(fā)布GPT-3模型,包含1750億參數(shù),數(shù)據(jù)集達到45T,在多項NLP任務中超越了人類水平。這種超大規(guī)模的模型參數(shù)及超大規(guī)模的數(shù)據(jù)集的AI大模型范式,實現(xiàn)了深度學習新的突破。
產(chǎn)業(yè)界和學術界看到這種新型范式的潛力后紛紛入局,繼OpenAI后,華為基于MindSpore框架發(fā)布了盤古大模型、智源發(fā)布了悟道模型、阿里發(fā)布了M6模型、百度發(fā)布了文心模型等。超大規(guī)模AI正成為下一代人工智能的突破口,也是最有潛力的強人工智能技術。
超大規(guī)模AI需要大模型、大數(shù)據(jù)、大算力的三重支持,這就對AI框架提出了新的挑戰(zhàn),比如內(nèi)存墻,大模型訓練過程中需要存儲參數(shù)、激活、梯度、優(yōu)化器狀態(tài),鵬程 . 盤古一個模型的訓練就需要近4TB的內(nèi)存。算力墻,以鵬程 . 盤古2000億參數(shù)量的大模型為例,需要3.6EFLOPS的算力支持,要求必須構建大規(guī)模的異構AI計算集群才能滿足這樣的算力需求,同時算力平臺要滿足智能調(diào)度來提升算力資源的利用率。還有通信墻、調(diào)優(yōu)墻、部署墻等。
在全場景支持方面,隨著云服務器、邊緣設備、終端設備等人工智能硬件運算設備的不斷涌現(xiàn),以及各類人工智能運算庫、中間表示工具以及編程框架的快速發(fā)展,人工智能軟硬件生態(tài)呈現(xiàn)多樣化發(fā)展趨勢。但主流框架訓練出來的模型卻不能通用,學術科研項目間難以合作延伸,造成了深度學習框架的“碎片化”。
目前業(yè)界并沒有統(tǒng)一的中間表示層標準,導致各硬件廠商解決方案存在一定差異,以致應用模型遷移不暢,增加了應用部署難度。因此,基于AI框架訓練出來的模型進行標準化互通將是未來的挑戰(zhàn)。
然而即使面臨諸多挑戰(zhàn),過去兩年,行業(yè)一直在持續(xù)探索,并取得一定突破,如2020年華為推出昇思MindSpore,在全場景協(xié)同、可信賴方面有一定的突破;曠視推出天元MegEngine,在訓練推理一體化方面深度布局等。
整體而言,在人工智能體系中,AI框架處于貫通上下的腰部位置,下接芯片、上承應用,是一個關鍵樞紐,是推動AI應用大規(guī)模落地的關鍵力量。因此對于企業(yè)來說,克服AI框架當前面臨的挑戰(zhàn),不斷探索新趨勢,進行技術創(chuàng)新,完善技術、功能和生態(tài)是關鍵。
有了AI框架,工程師在工作時調(diào)試算法,就可以更快速、更高效。通俗一點講,AI框架相當于是AI時代的操作系統(tǒng),如同PC時代Windows,移動互聯(lián)網(wǎng)時代的iOS和安卓。
AI框架發(fā)展現(xiàn)狀和趨勢
AI框架的歷史并不算長,從2010年誕生的Theano算起,至今不過十二年時間。2017年后,早期的Theano、Caffe、Torch等框架逐漸銷聲匿跡,2016年前后出現(xiàn)的TensorFlow(谷歌)、PyTorch(Facebook)、飛槳(百度)逐漸占據(jù)市場。
從目前市場占有情況看,產(chǎn)業(yè)界以TensorFlow為主,學術界以PyTorch為主。與TensorFlow過于注重工業(yè),PyTorch專注學界不同,飛槳的特性在于工業(yè)學界兩手抓,通過動態(tài)圖自動解析編譯靜態(tài)圖的技術,兼顧了學界的靈活,同時也實現(xiàn)了產(chǎn)業(yè)界希望的高效。
除了TensorFlow、PyTorch、飛槳,深度學習框架還包括由Amazon設計研發(fā)并開源的MXNet、微軟在github上開源的CNTK、華為推出的MindSpore、北京一流科技有限公司開發(fā)的OneFlow,以及清華大學自研的Jittor,和騰訊、字節(jié)跳動、360開源的Angel、BytePS、TensorNet。
過去這些年,AI框架已形成較為完整的技術體系,當前主流AI框架的核心技術演化出三大層次,分為基礎層、組件層和生態(tài)層,其中基礎層實現(xiàn)AI框架最基礎核心的功能,具體包括編程開發(fā)、編譯優(yōu)化以及硬件使能三個子層。
從技術生態(tài)體系中的功能定位看,AI框架對下調(diào)用底層硬件計算資源,對上支撐AI應用算法模型搭建,提供算法工程化實現(xiàn)的標準環(huán)境,是AI技術體系的關鍵核心。
AI框架技術持續(xù)演進,歷經(jīng)萌芽階段、成長階段、穩(wěn)定階段,當前已進入深化階段。AI框架正向著超大規(guī)模AI、全場景支持、安全可信等技術特性深化探索。
AI框架面臨的挑戰(zhàn)
然而在這個探索的過程中,面臨諸多挑戰(zhàn)。在超大規(guī)模AI方面,當前超大規(guī)模AI成為新的深度學習范式。OpenAI于2020年5月發(fā)布GPT-3模型,包含1750億參數(shù),數(shù)據(jù)集達到45T,在多項NLP任務中超越了人類水平。這種超大規(guī)模的模型參數(shù)及超大規(guī)模的數(shù)據(jù)集的AI大模型范式,實現(xiàn)了深度學習新的突破。
產(chǎn)業(yè)界和學術界看到這種新型范式的潛力后紛紛入局,繼OpenAI后,華為基于MindSpore框架發(fā)布了盤古大模型、智源發(fā)布了悟道模型、阿里發(fā)布了M6模型、百度發(fā)布了文心模型等。超大規(guī)模AI正成為下一代人工智能的突破口,也是最有潛力的強人工智能技術。
超大規(guī)模AI需要大模型、大數(shù)據(jù)、大算力的三重支持,這就對AI框架提出了新的挑戰(zhàn),比如內(nèi)存墻,大模型訓練過程中需要存儲參數(shù)、激活、梯度、優(yōu)化器狀態(tài),鵬程 . 盤古一個模型的訓練就需要近4TB的內(nèi)存。算力墻,以鵬程 . 盤古2000億參數(shù)量的大模型為例,需要3.6EFLOPS的算力支持,要求必須構建大規(guī)模的異構AI計算集群才能滿足這樣的算力需求,同時算力平臺要滿足智能調(diào)度來提升算力資源的利用率。還有通信墻、調(diào)優(yōu)墻、部署墻等。
在全場景支持方面,隨著云服務器、邊緣設備、終端設備等人工智能硬件運算設備的不斷涌現(xiàn),以及各類人工智能運算庫、中間表示工具以及編程框架的快速發(fā)展,人工智能軟硬件生態(tài)呈現(xiàn)多樣化發(fā)展趨勢。但主流框架訓練出來的模型卻不能通用,學術科研項目間難以合作延伸,造成了深度學習框架的“碎片化”。
目前業(yè)界并沒有統(tǒng)一的中間表示層標準,導致各硬件廠商解決方案存在一定差異,以致應用模型遷移不暢,增加了應用部署難度。因此,基于AI框架訓練出來的模型進行標準化互通將是未來的挑戰(zhàn)。
然而即使面臨諸多挑戰(zhàn),過去兩年,行業(yè)一直在持續(xù)探索,并取得一定突破,如2020年華為推出昇思MindSpore,在全場景協(xié)同、可信賴方面有一定的突破;曠視推出天元MegEngine,在訓練推理一體化方面深度布局等。
整體而言,在人工智能體系中,AI框架處于貫通上下的腰部位置,下接芯片、上承應用,是一個關鍵樞紐,是推動AI應用大規(guī)模落地的關鍵力量。因此對于企業(yè)來說,克服AI框架當前面臨的挑戰(zhàn),不斷探索新趨勢,進行技術創(chuàng)新,完善技術、功能和生態(tài)是關鍵。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
AI
+關注
關注
87文章
31711瀏覽量
270515
發(fā)布評論請先 登錄
相關推薦
NVIDIA分析金融行業(yè)AI技術趨勢
NVIDIA 2025 年全球金融服務業(yè) AI 現(xiàn)狀與趨勢調(diào)研報告發(fā)現(xiàn),企業(yè)正在利用 AI 來增加收入、降低成本并開辟新業(yè)務。
英飛凌AI服務器機架PSU的趨勢和功率演進
人工智能(AI)的迅猛發(fā)展推動了數(shù)據(jù)中心處理能力的顯著增長。如圖1所示,英飛凌預測單臺GPU的功耗將呈指數(shù)級上升,預計到2030年將達到約2000W [1],而AI服務器機架的峰值功耗將突破驚人
![英飛凌<b class='flag-5'>AI</b>服務器機架PSU的<b class='flag-5'>趨勢</b>和功率<b class='flag-5'>演進</b>](https://file1.elecfans.com/web3/M00/07/A9/wKgZPGepmK2ABF7RAAAevfGSXV4055.png)
探索 RK3576 方案:卓越性能與靈活框架,誠邀開發(fā)定制合作!
。領先的 AI 智能分析實力集成 10 路 AI 功能,搭載 6TOPs NPU(神經(jīng)網(wǎng)絡處理器),支持視覺 Transformer 等先進算法。這使得它在監(jiān)控場景中能夠進行精準的智能分析,大大提高
發(fā)表于 02-05 15:21
AI開發(fā)框架集成介紹
隨著AI應用的廣泛深入,單一框架往往難以滿足多樣化的需求,因此,AI開發(fā)框架的集成成為了提升開發(fā)效率、促進技術創(chuàng)新的關鍵路徑。以下,是對AI
大語言模型開發(fā)框架是什么
大語言模型開發(fā)框架是指用于訓練、推理和部署大型語言模型的軟件工具和庫。下面,AI部落小編為您介紹大語言模型開發(fā)框架。
探索手機震動馬達的種類與應用:技術演進與市場趨勢
手機震動馬達,作為手機中不可或缺的一個組件,扮演著提醒、通知和反饋的重要角色。然而,隨著技術的不斷發(fā)展和市場需求的變化,手機震動馬達也在不斷演進和多樣化。本文將深入分析手機震動馬達的種類、技術特點以及應用場景,為讀者呈現(xiàn)手機震動馬達領域的最新動態(tài)。
![<b class='flag-5'>探索</b>手機震動馬達的種類與應用:技術<b class='flag-5'>演進</b>與市場<b class='flag-5'>趨勢</b>](https://file1.elecfans.com/web2/M00/06/E3/wKgZombrzYuAdmfoAACZ1Dvz4bA924.png)
簡述微處理器的發(fā)展歷史
微處理器的發(fā)展歷史是一部充滿創(chuàng)新與突破的技術演進史,它見證了計算機技術的飛速發(fā)展和人類社會的巨大變革。以下是對微處理器發(fā)展歷史的詳細回顧,內(nèi)容將涵蓋其關鍵節(jié)點、重要里程碑以及技術演進
英偉達推出Flextron AI框架:賦能靈活高效的AI模型部署
在人工智能與機器學習領域,隨著技術的不斷演進,模型的高效部署與適應性成為研究的新熱點。近日,英偉達與德克薩斯大學奧斯汀分校攜手宣布了一項重大突破——推出了一種名為FLEXTRON的新型靈活模型架構及訓練后優(yōu)化框架,這一創(chuàng)新成果為AI
AI算法/模型/框架/模型庫的含義、區(qū)別與聯(lián)系
在人工智能(Artificial Intelligence,簡稱AI)的廣闊領域中,算法、模型、框架和模型庫是構成其技術生態(tài)的重要基石。它們各自承擔著不同的角色,但又緊密相連,共同推動著AI技術的不斷發(fā)展。以下是對這四者含義、區(qū)
ai大模型和ai框架的關系是什么
AI大模型和AI框架是人工智能領域中兩個重要的概念,它們之間的關系密切且復雜。 AI大模型的定義和特點 AI大模型是指具有大量參數(shù)的深度學習
AI大模型與AI框架的關系
在探討AI大模型與AI框架的關系時,我們首先需要明確兩者的基本概念及其在人工智能領域中的角色。AI大模型通常指的是具有極大規(guī)模、高度復雜性和強大能力的人工智能系統(tǒng),它們能夠處理復雜的任
CubeIDE生成的代碼框架會卡在MX_X_CUBE_AI_Process()函數(shù)中是怎么回事?
當我將網(wǎng)絡模型部署到STM32F407VGT6中時,CubeIDE生成的代碼框架會卡在MX_X_CUBE_AI_Process()函數(shù)中是怎么回事?CUbeAI庫的版本是9.0。期待您的回復,謝謝
發(fā)表于 05-30 06:11
評論