今日和文檔君一起學(xué)習(xí)技術(shù)名詞:
全調(diào)度以太網(wǎng)技術(shù)(Global Scheduling Ethernet,GSE)——基于報文容器PKTC轉(zhuǎn)發(fā)和負載均衡,并實現(xiàn)全局調(diào)度。
什么是全調(diào)度以太網(wǎng)GSE?
GSE(Global Scheduling Ethernet),即全調(diào)度以太網(wǎng)技術(shù)。GSE是由中國移動聯(lián)合產(chǎn)業(yè)合作伙伴共同提出的一種以太網(wǎng)技術(shù)架構(gòu),是在現(xiàn)有以太網(wǎng)的基礎(chǔ)上進行了優(yōu)化和創(chuàng)新,以滿足智算中心高性能網(wǎng)絡(luò)技術(shù),旨在突破傳統(tǒng)以太網(wǎng)的技術(shù)瓶頸,打造無阻塞、高帶寬、低時延的新型智算中心網(wǎng)絡(luò)。
為什么需要GSE?
在AI訓(xùn)練中,我們常用RDMA協(xié)議來高速傳輸數(shù)據(jù)。但RDMA對丟包非常敏感,哪怕只丟了一點點數(shù)據(jù)包,網(wǎng)絡(luò)的有效傳輸速度就會大幅下降。
而AI大模型訓(xùn)練需要多個計算設(shè)備一起工作,它們之間需要頻繁通信和同步,這對網(wǎng)絡(luò)的要求就特別高?,F(xiàn)在AI模型越來越大,智算中心的網(wǎng)絡(luò)性能就得更強才行,需要無阻塞、“0”丟包、低延遲。
傳統(tǒng)的以太網(wǎng)在大規(guī)模、高速度的數(shù)據(jù)傳輸時,容易出現(xiàn)網(wǎng)絡(luò)擁塞等問題。這就像是一條高速公路,車一多就容易堵。
智算中心的網(wǎng)絡(luò)中數(shù)據(jù)流雖然不多,但每個流的數(shù)據(jù)量都很大,傳統(tǒng)的負載均衡方式就容易出問題,導(dǎo)致數(shù)據(jù)包丟失,動態(tài)時延增大等問題,從而影響AI訓(xùn)練的效率。
GSE技術(shù)就像是給去往某個目的地的多條高速公路裝上了智能導(dǎo)航系統(tǒng),它能主動控制車流選擇最優(yōu)路徑,避免堵車,更高效地轉(zhuǎn)發(fā)數(shù)據(jù)包。這樣一來,丟包就少了,網(wǎng)絡(luò)延遲也低了,整體傳輸速度就更高了,AI訓(xùn)練效率也就提升了。
GSE技術(shù)特點
1. 從“流”分發(fā)轉(zhuǎn)變?yōu)椤皥笪摹狈职l(fā)。傳統(tǒng)ECMP 負載均衡會導(dǎo)致鏈路負載不均以及哈希極化,可能引起擁塞和丟包。
GSE設(shè)備會將數(shù)據(jù)包進行邏輯分組,組裝成長度較長的“定長”容器,并基于報文容器轉(zhuǎn)發(fā)和動態(tài)負載均衡,實現(xiàn)單條流在多路徑上均勻地負載分擔(dān),提升有效帶寬。
如果把報文當(dāng)作貨物,報文容器就好像載貨能力一樣的貨車,每輛貨車拉著同樣重量的貨物(數(shù)量可以不一樣),大量貨車被均勻地調(diào)度到去往同個目的地的多條高速路上,可以最大程度利用道路資源。
2. 從被動擁塞控制到主動流控,引入“授權(quán)請求”和“全局調(diào)度機制”,通過構(gòu)建基于全局動態(tài)調(diào)度隊列(DGSQ)的擁塞控制機制,本設(shè)備發(fā)送流量速率由最終的設(shè)備出口、途經(jīng)的設(shè)備統(tǒng)一進行全網(wǎng)端到端授權(quán),確保了流量負載不超過網(wǎng)絡(luò)的承載能力,有效避免了網(wǎng)絡(luò)擁塞而丟包。
這就好像貨車在出發(fā)前先詢問了目的地的庫房是否具備接收能力,根據(jù)目的地的收貨能力以及沿途路況來決定發(fā)出多少貨物,確保貨物能準確送達并接收。
由于AI大模型訓(xùn)練時任意一輪計算的結(jié)束均依賴最后一個結(jié)果的返回,降低網(wǎng)絡(luò)長尾時延可有效提升訓(xùn)練完成時間。
交換網(wǎng)絡(luò)整體轉(zhuǎn)發(fā)時延和轉(zhuǎn)發(fā)路徑上中間節(jié)點的擁塞情況正相關(guān),消除中間節(jié)點的擁塞就可消除長尾時延。GSE技術(shù)實現(xiàn)了精細化調(diào)度和和高負載均衡,可有效降低長尾時延,提升訓(xùn)練效率。
GSE支持GSE-N2N和GSE-E2E兩大技術(shù)場景,GSE-N2N通過網(wǎng)絡(luò)設(shè)備實現(xiàn)全部GSE功能,支持計算與網(wǎng)絡(luò)設(shè)備的解耦;GSE-E2E將部分GSE能力延伸至服務(wù)器網(wǎng)卡,借助端網(wǎng)協(xié)同實現(xiàn)高性能集群互聯(lián)。QGSE vs RoCEv2 vs InfiniBand
GSE | RoCEv2 | InfiniBand | |
網(wǎng)絡(luò)設(shè)備 | GSE交換機 | 以太交換機 | IB交換機 |
性能 | 組網(wǎng)性能相較傳統(tǒng)RoCEv2可提升40%已上 | 經(jīng)過調(diào)優(yōu)可接近IB | 優(yōu) |
兼容性 | 優(yōu),基于以太網(wǎng)改造,有開放標準 | 優(yōu),增強以太網(wǎng) | 封閉,不兼容以太網(wǎng) |
產(chǎn)業(yè)生態(tài) | 中國移動攜手國內(nèi)智算生態(tài)企業(yè)共同發(fā)布產(chǎn)品及標準。 | 多種芯片方案,大量網(wǎng)絡(luò)設(shè)備廠家 | Nvidia為主等少量海外廠商 |
易用性 | 無需復(fù)雜的網(wǎng)絡(luò)參數(shù)配置 | 需要調(diào)節(jié)各種網(wǎng)絡(luò)參數(shù),較復(fù)雜,自動化部署正在完善中 | 集中式管理機制,由子網(wǎng)管理器負責(zé)整個網(wǎng)絡(luò)轉(zhuǎn)發(fā)表的計算與分發(fā)等工作 |
成熟度 | 新技術(shù),持續(xù)完善中 | 成熟,還在持續(xù)演進完善 | 成熟 |
注:RoCEv2(RDMA over Converged Ethernet,融合以太網(wǎng)承載RDMA)
GSE有哪些應(yīng)用場景?
GSE主要面向無損、高帶寬、低時延等高性能網(wǎng)絡(luò)需求業(yè)務(wù)場景,如AI大模型訓(xùn)練的智算中心網(wǎng)絡(luò)。
GSE業(yè)界應(yīng)用進展
在2023年9月的中國網(wǎng)絡(luò)大會上,中國移動研究院攜手合作伙伴發(fā)布業(yè)界首款“全調(diào)度以太網(wǎng)(GSE)”樣機。
在2023年11月21日的開放數(shù)據(jù)中心委員會(ODCC)冬季全會會議上,正式成立全調(diào)度以太網(wǎng)(GSE)技術(shù)特設(shè)組并召開第一次工作組會議。
在2024年9月27日的中國算力大會上,中國移動攜手國內(nèi)智算生態(tài)企業(yè)共同發(fā)布了全調(diào)度以太網(wǎng)(GSE)全套技術(shù)標準及首套商用產(chǎn)品。
2024.11,中國移動聯(lián)合云豹智能共同研發(fā)首顆GSE DPU芯片--“智算琢光”。
2024.12,中國移動聯(lián)合中興共同研發(fā)首顆可完整支持GSE功能的大容量高性能交換芯片
-
以太網(wǎng)
+關(guān)注
關(guān)注
40文章
5463瀏覽量
172802 -
AI
+關(guān)注
關(guān)注
87文章
31628瀏覽量
270446 -
容器
+關(guān)注
關(guān)注
0文章
499瀏覽量
22130 -
負載均衡
+關(guān)注
關(guān)注
0文章
113瀏覽量
12395
原文標題:【秒懂承載】熱點技術(shù)名詞 -“全調(diào)度以太網(wǎng)GSE”
文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
工業(yè)以太網(wǎng)技術(shù)說明
以太網(wǎng)技術(shù)基本原理
探討工業(yè)以太網(wǎng)技術(shù)(一)
探討工業(yè)以太網(wǎng)技術(shù)~(二)
《以太網(wǎng)技術(shù)開發(fā)資料精選》
工業(yè)以太網(wǎng)技術(shù)手冊
工業(yè)以太網(wǎng)技術(shù)及其發(fā)展
以太網(wǎng)技術(shù)基本原理
![<b class='flag-5'>以太網(wǎng)技術(shù)</b>基本原理](https://file1.elecfans.com//web2/M00/A5/2F/wKgZomUMN0yAEMsNAAAIw--roAU514.gif)
以太網(wǎng)(Etherner).以太網(wǎng)技術(shù)標準有哪些?
以太網(wǎng)技術(shù)聯(lián)盟發(fā)布了800千兆位以太網(wǎng)的規(guī)范
千兆以太網(wǎng)發(fā)展現(xiàn)狀 千兆以太網(wǎng)技術(shù)優(yōu)勢
![千兆<b class='flag-5'>以太網(wǎng)</b>發(fā)展現(xiàn)狀 千兆<b class='flag-5'>以太網(wǎng)技術(shù)</b>優(yōu)勢](https://file.elecfans.com/web1/M00/E6/04/o4YBAGBWvWSARSdwAAC_H5atQ6c686.png)
評論