在過去幾年中,我們目睹了數(shù)據(jù)生成、處理和進(jìn)一步利用以獲取額外價值和智能的方式發(fā)生了巨大變化,所有這些都受到基于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)應(yīng)用的新計算模型出現(xiàn)的影響。這種深刻的變化始于數(shù)據(jù)中心,深度學(xué)習(xí)技術(shù)被用于提供對海量數(shù)據(jù)的洞察,主要用于分類和/或識別圖像,啟用自然語言或語音處理,或者理解、生成或成功學(xué)習(xí)如何玩復(fù)雜的游戲。策略游戲。這一變化還帶來了一波更節(jié)能的計算設(shè)備(基于 GP-GPU 和 FPGA),專門針對這類問題創(chuàng)建,后來包括完全定制的 ASIC,
大數(shù)據(jù)和快速數(shù)據(jù)
大數(shù)據(jù)應(yīng)用程序使用專業(yè)的 GP-GPU、FPGA 和 ASIC 處理器通過深度學(xué)習(xí)技術(shù)分析大型數(shù)據(jù)集,并揭示趨勢、模式和關(guān)聯(lián),從而實現(xiàn)圖像識別、語音識別等。因此,大數(shù)據(jù)主要基于過去的信息,或通常駐留在云中的剩余數(shù)據(jù)。大數(shù)據(jù)分析的一個常見結(jié)果是“訓(xùn)練有素”的神經(jīng)網(wǎng)絡(luò)能夠執(zhí)行特定任務(wù),例如識別和標(biāo)記圖像或視頻序列中的所有面部。語音識別也展示了神經(jīng)網(wǎng)絡(luò)的力量。
該任務(wù)最好由專門的引擎(或推理引擎)執(zhí)行,這些引擎直接駐留在邊緣設(shè)備上并由快速數(shù)據(jù)應(yīng)用程序領(lǐng)導(dǎo)(圖 1)。通過處理在邊緣本地捕獲的數(shù)據(jù),F(xiàn)ast Data 利用源自大數(shù)據(jù)的算法來提供實時決策和結(jié)果。由于大數(shù)據(jù)提供了從“發(fā)生了什么”到“可能發(fā)生什么”(預(yù)測分析)得出的見解,F(xiàn)ast Data 提供了可以改進(jìn)業(yè)務(wù)決策、運營和減少低效率的實時行動,這些行動總是會影響底線結(jié)果。這些方法可能適用于各種邊緣和存儲設(shè)備,例如相機、智能手機和 SSD。
計算數(shù)據(jù)
新的工作負(fù)載基于兩個場景:(1)在特定工作負(fù)載上訓(xùn)練大型神經(jīng)網(wǎng)絡(luò),例如圖像或語音識別;(2) 在邊緣設(shè)備上應(yīng)用經(jīng)過訓(xùn)練(或“擬合”)的神經(jīng)網(wǎng)絡(luò)。這兩種工作負(fù)載都需要大量并行數(shù)據(jù)處理,包括大型矩陣的乘法和卷積。這些計算函數(shù)的最佳實現(xiàn)需要對大型向量或數(shù)據(jù)數(shù)組進(jìn)行操作的向量指令。RISC-V是一個非常適合此類應(yīng)用程序的架構(gòu)和生態(tài)系統(tǒng),因為它提供了一個由開源軟件支持的標(biāo)準(zhǔn)化流程,使開發(fā)人員能夠完全自由地采用、修改甚至添加專有矢量指令。圖 1 概述了突出的 RISC-V 計算架構(gòu)機會。
移動數(shù)據(jù)
邊緣快速數(shù)據(jù)和計算的出現(xiàn)產(chǎn)生了一個事實結(jié)果,即將所有數(shù)據(jù)來回移動到云端進(jìn)行計算分析效率不高。首先,它涉及通過移動網(wǎng)絡(luò)和以太網(wǎng)長距離傳輸相對較大的數(shù)據(jù)延遲,這對于必須實時運行的圖像或語音識別應(yīng)用程序來說并不是最佳選擇。其次,邊緣計算允許更多可擴展的架構(gòu),其中圖像和語音處理或 SSD 上的內(nèi)存計算操作可以以可擴展的方式執(zhí)行。因此,每個添加的邊緣設(shè)備都會帶來所需計算能力的增量增加。數(shù)據(jù)移動方式和時間的優(yōu)化是新架構(gòu)可擴展性的關(guān)鍵因素。
【圖1 | 大數(shù)據(jù)、快速數(shù)據(jù)和 RISC-V 機會]
在圖 1a 中,云數(shù)據(jù)中心服務(wù)器使用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對大型大數(shù)據(jù)集進(jìn)行訓(xùn)練來執(zhí)行機器學(xué)習(xí)。在圖 1b 中,邊緣的安全攝像頭使用經(jīng)過大數(shù)據(jù)訓(xùn)練的推理引擎,并實時識別圖像(快速數(shù)據(jù))。在圖 1c 中,智能 SSD 設(shè)備使用推理引擎進(jìn)行數(shù)據(jù)識別和分類,有效利用了設(shè)備的帶寬。由于圖 1 顯示了 RISC-V 內(nèi)核的潛在機會,它可以自由添加專有和未來標(biāo)準(zhǔn)化矢量指令,這些指令有助于處理深度學(xué)習(xí)和推理技術(shù)。
數(shù)據(jù)移動和訪問方式的另一個類似且重要的趨勢存在于大數(shù)據(jù)端和云中(圖 2)。傳統(tǒng)的計算機架構(gòu)(圖 2a)利用連接到許多其他設(shè)備(例如專用機器學(xué)習(xí)加速器、顯卡、快速 SSD、智能網(wǎng)絡(luò)控制器等)的慢速外圍總線。慢速總線通過限制它們自身、主 CPU 和主要的、潛在的持久內(nèi)存之間的通信能力來影響設(shè)備利用率。這類新的計算設(shè)備也不可能在它們之間或與主 CPU 共享內(nèi)存,這會導(dǎo)致通過慢速總線的浪費和有限的數(shù)據(jù)移動。
關(guān)于如何改善不同計算設(shè)備(例如 CPU 和計算和網(wǎng)絡(luò)加速器)之間的數(shù)據(jù)移動,以及如何在內(nèi)存或快速存儲中訪問數(shù)據(jù),出現(xiàn)了幾個重要的行業(yè)趨勢。這些新趨勢專注于開放標(biāo)準(zhǔn)化工作,以提供更快、更低延遲的串行結(jié)構(gòu)和更智能的邏輯協(xié)議,從而實現(xiàn)對共享內(nèi)存的一致訪問。
下一代以數(shù)據(jù)為中心的計算
未來的架構(gòu)將需要為連接到計算加速器的持久內(nèi)存和支持緩存一致性的快速總線(例如TileLink、RapidIO、OpenCAPI和Gen-Z)部署開放接口,不僅可以顯著提高性能,還可以使所有設(shè)備能夠共享內(nèi)存并減少不必要的數(shù)據(jù)移動。
【圖2 | 計算架構(gòu)中的數(shù)據(jù)移動和訪問]
在圖 2a 中,由于用于快速存儲和計算加速設(shè)備的外圍總線速度較慢,傳統(tǒng)計算架構(gòu)已達(dá)到其極限。在圖 2b 中,未來的計算架構(gòu)部署開放接口,提供平臺中所有計算資源對共享持久內(nèi)存的統(tǒng)一緩存一致訪問(稱為以數(shù)據(jù)為中心的架構(gòu))。在圖 2c 中,部署的設(shè)備能夠利用相同的共享內(nèi)存,從而減少不必要的數(shù)據(jù)復(fù)制。
CPU 非核心和網(wǎng)絡(luò)接口控制器的作用將成為移動數(shù)據(jù)的關(guān)鍵推動力。CPU 非核心組件必須支持關(guān)鍵內(nèi)存和持久內(nèi)存接口(例如 NVDIMM-P),以及靠近 CPU 的內(nèi)存。還需要實施用于計算加速器、智能網(wǎng)絡(luò)和遠(yuǎn)程持久內(nèi)存的智能和快速總線??偩€上的任何設(shè)備(例如 CPU、通用或?qū)S糜嬎慵铀倨?、網(wǎng)絡(luò)適配器、存儲或內(nèi)存)都可以包含自己的計算資源,并能夠訪問共享內(nèi)存(圖 2b 和 2c)。
為了優(yōu)化數(shù)據(jù)移動,RISC-V 技術(shù)可以成為關(guān)鍵推動因素,因為它將在所有計算加速器設(shè)備上為新的機器學(xué)習(xí)工作負(fù)載實施矢量指令。它啟用了支持開放內(nèi)存和智能總線接口的開源 CPU 技術(shù),并實現(xiàn)了具有連貫共享內(nèi)存的新的以數(shù)據(jù)為中心的架構(gòu)。
用 RISC-V 解決挑戰(zhàn)
大數(shù)據(jù)和快速數(shù)據(jù)帶來了未來的數(shù)據(jù)移動挑戰(zhàn),為 RISC-V 指令集架構(gòu) (ISA) 及其開放的模塊化方法鋪平了道路,非常適合作為以數(shù)據(jù)為中心的計算架構(gòu)的基礎(chǔ)。它提供了以下能力:
擴展邊緣計算設(shè)備的計算資源
添加新指令,例如用于關(guān)鍵機器學(xué)習(xí)工作負(fù)載的向量指令
將小型計算核心定位在非常靠近存儲和內(nèi)存介質(zhì)的位置
啟用新的計算范式和模塊化芯片設(shè)計
啟用以數(shù)據(jù)為中心的新架構(gòu),其中所有處理元素都可以連貫地訪問共享持久內(nèi)存,優(yōu)化數(shù)據(jù)移動
RISC-V由超過一百個組織的成員開發(fā),包括一個軟件和硬件創(chuàng)新者的協(xié)作社區(qū),他們可以使 ISA 適應(yīng)特定目的或項目。加入該組織的任何人都可以根據(jù)伯克利軟件分發(fā) (BSD) 許可設(shè)計、制造和/或銷售 RISC-V 芯片和軟件。
最后的想法
為了實現(xiàn)其價值和可能性,需要捕獲、保存、訪問和轉(zhuǎn)換數(shù)據(jù)以充分發(fā)揮其潛力。具有大數(shù)據(jù)和快速數(shù)據(jù)應(yīng)用程序的環(huán)境已經(jīng)超過了通用計算架構(gòu)的處理能力。未來以數(shù)據(jù)為中心的極端應(yīng)用程序需要專門構(gòu)建的處理,以開放的方式支持?jǐn)?shù)據(jù)資源的獨立擴展。
擁有一個以存儲在持久內(nèi)存中的數(shù)據(jù)為中心的通用開放計算機架構(gòu),同時允許所有設(shè)備發(fā)揮計算作用,是這些新的可擴展架構(gòu)的關(guān)鍵推動因素,這些架構(gòu)由一類新的機器學(xué)習(xí)計算工作負(fù)載驅(qū)動??缢性坪瓦吘壊糠值南乱淮鷳?yīng)用程序?qū)⑿枰@種新型的低能耗處理,因為專業(yè)計算加速處理器專注于手頭的任務(wù),減少移動數(shù)據(jù)的浪費時間,或執(zhí)行與數(shù)據(jù)。人、社區(qū)和我們的星球通過數(shù)據(jù)的力量、潛力和可能性而蓬勃發(fā)展。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19440瀏覽量
231334 -
芯片
+關(guān)注
關(guān)注
457文章
51292瀏覽量
427865 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8449瀏覽量
133131
發(fā)布評論請先 登錄
相關(guān)推薦
評論