關(guān)于智算中心高性能網(wǎng)絡(luò)
你需要知道的...
以GPT-4和Llama3為代表的大語(yǔ)言模型實(shí)現(xiàn)了突破性進(jìn)展,引爆了高性能計(jì)算。由于大語(yǔ)言模型爆炸增長(zhǎng)的存儲(chǔ)和算力需求,其分布式計(jì)算需要芯片間進(jìn)行高頻通信,網(wǎng)絡(luò)流量急劇增加。所以對(duì)通信網(wǎng)絡(luò)提出超大規(guī)模組網(wǎng)、超高帶寬、超低時(shí)延、超高穩(wěn)定性和網(wǎng)絡(luò)自動(dòng)化部署新需求,典型網(wǎng)絡(luò)架構(gòu)轉(zhuǎn)向多核心、少收斂形態(tài)。
以下這些關(guān)鍵詞帶你更快了解高性能網(wǎng)絡(luò)的通信及互聯(lián)需求。
RDMA技術(shù)解析
RDMA(RemoteDirect Memory Access)技術(shù)全稱遠(yuǎn)程直接內(nèi)存訪問(wèn),就是為了解決網(wǎng)絡(luò)傳輸中服務(wù)器端數(shù)據(jù)處理的延遲而產(chǎn)生的。RDMA技術(shù)能直接通過(guò)網(wǎng)絡(luò)接口訪問(wèn)內(nèi)存數(shù)據(jù),無(wú)需操作系統(tǒng)內(nèi)核的介入。這允許高吞吐、低延遲的網(wǎng)絡(luò)通信,尤其適合在大規(guī)模并行計(jì)算機(jī)集群中使用。
RDMA的三大分類
目前支持RDMA的網(wǎng)絡(luò)協(xié)議主要有三種,Infiniband, RoCE和iWARP。Infiniband是一種專為RDMA設(shè)計(jì)的網(wǎng)絡(luò),從硬件級(jí)別保證可靠傳輸,技術(shù)先進(jìn),但是成本高昂。
iWARP和RoCE都是基于以太網(wǎng)的RDMA技術(shù),但是iWARP是基于TCP/IP協(xié)議,相比于基于硬件的RoCE解決方案有更高的性能損失,在高性能網(wǎng)絡(luò)的環(huán)境表現(xiàn)中不如RoCE。
高速、超低延時(shí)、極低CPU使用率的基于RoCE的RDMA技術(shù)部署在目前使用最廣泛的以太網(wǎng)上。RoCE協(xié)議有RoCEv1和RoCEv2兩個(gè)版本,RoCEv1基于以太網(wǎng)鏈路層,使用以太網(wǎng)幀進(jìn)行數(shù)據(jù)傳輸。RoCEv1沒(méi)有IP層,因此在傳輸數(shù)據(jù)時(shí)不使用IP地址,而RoCEv2基于IP層,使用UDP/IP進(jìn)行數(shù)據(jù)傳輸。
RoCEv2將RDMA流量封裝在UDP包中,并使用標(biāo)準(zhǔn)的IP地址進(jìn)行路由。這使得RoCEv2可以在路由器和交換機(jī)之間穿越,使其更適用于大規(guī)模的數(shù)據(jù)中心環(huán)境。
關(guān)于異構(gòu)計(jì)算
高性能計(jì)算類應(yīng)用的發(fā)展,驅(qū)動(dòng)算力需求不斷攀升,但目前單一計(jì)算類型和架構(gòu)的處理器已經(jīng)無(wú)法處理日趨復(fù)雜、多樣化的計(jì)算任務(wù)。數(shù)據(jù)中心如何在增強(qiáng)算力和性能的同時(shí),具備應(yīng)對(duì)多種類型任務(wù)的處理能力,成為全球性的技術(shù)難題。在計(jì)算領(lǐng)域芯片企業(yè)的不斷探索和研究中,異構(gòu)計(jì)算成為公認(rèn)的算力突破“抓手”。
DSA 領(lǐng)域特定加速
隨著人工智能及高性能計(jì)算的高速發(fā)展,模型的訓(xùn)練需要大量的存儲(chǔ)資源和計(jì)算資源,這些硬件資源的利用率需要通過(guò)有效的任務(wù)分配和數(shù)據(jù)處理來(lái)優(yōu)化。在分布式人工智能及高性能計(jì)算系統(tǒng)中,多個(gè)計(jì)算節(jié)點(diǎn)之間需要頻繁通信,要求網(wǎng)絡(luò)具有低延遲和高帶寬,以避免通信瓶頸。針對(duì)網(wǎng)絡(luò)加速的DSA專用單元對(duì)任務(wù)卸載、加速,減少節(jié)點(diǎn)之間的數(shù)據(jù)延遲,提升數(shù)據(jù)傳輸效率,使CPU,GPU,NPU專注于核心計(jì)算任務(wù),加速各項(xiàng)計(jì)算、存儲(chǔ)任務(wù)。
-
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7546瀏覽量
88690 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
7600瀏覽量
89284 -
人工智能
+關(guān)注
關(guān)注
1796文章
47734瀏覽量
240411 -
RDMA
+關(guān)注
關(guān)注
0文章
78瀏覽量
8983
原文標(biāo)題:KiwiLab 集合篇 | 關(guān)于智算中心高性能網(wǎng)絡(luò),你需要知道這些...
文章出處:【微信號(hào):奇異摩爾,微信公眾號(hào):奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
[討論]提高網(wǎng)站關(guān)鍵詞排名的28個(gè)SEO小技巧
網(wǎng)站定位之關(guān)鍵詞的選取
亞馬遜代運(yùn)營(yíng) amazon Search term 關(guān)鍵詞填寫的“神技”
HanLP關(guān)鍵詞提取算法分析詳解
基于Cortex-M處理器的高精度關(guān)鍵詞識(shí)別實(shí)現(xiàn)
關(guān)鍵詞優(yōu)化有哪些實(shí)用的方法
百度關(guān)鍵詞排名掉完了怎么辦
可分離卷積神經(jīng)網(wǎng)絡(luò)在 Cortex-M 處理器上實(shí)現(xiàn)關(guān)鍵詞識(shí)別
#2023,你的 FPGA 年度關(guān)鍵詞是什么? #
基于強(qiáng)度熵解決中文關(guān)鍵詞識(shí)別
![基于強(qiáng)度熵解決中文<b class='flag-5'>關(guān)鍵詞</b>識(shí)別](https://file.elecfans.com/web2/M00/49/66/poYBAGKhwK2AWD62AAAUXGhRbzc463.jpg)
基于自動(dòng)關(guān)鍵詞抽取方法
![基于自動(dòng)<b class='flag-5'>關(guān)鍵詞</b>抽取方法](https://file.elecfans.com/web2/M00/49/84/poYBAGKhwMGAGcNDAAAbA2MVSGs336.jpg)
三大“關(guān)鍵詞”來(lái)了解AI
融合BERT詞向量與TextRank的關(guān)鍵詞抽取方法
![融合BERT<b class='flag-5'>詞</b>向量與TextRank的<b class='flag-5'>關(guān)鍵詞</b>抽取方法](https://file.elecfans.com/web1/M00/E6/7D/pIYBAGBWr1KAdDvcAACpwbu_UCQ617.png)
評(píng)論