欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

在ZTR無配置大規(guī)模中實現(xiàn)的縮放零接觸RoCE技術

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-14 14:15 ? 次閱讀

NVIDIA Zero Touch RoCE ( ZTR )使數(shù)據(jù)中心能夠無縫部署 聚合以太網(wǎng)上的 RDMA ( RoCE ) ,而無需任何特殊交換機配置。直到最近, ZTR 還僅適用于中小型數(shù)據(jù)中心。同時,大規(guī)模部署傳統(tǒng)上依賴于顯式擁塞通知( ECN )來啟用 RoCE 網(wǎng)絡傳輸,這需要交換機配置。

新的 NVIDIA 擁塞控制算法往返時間擁塞控制( RTTCC ) – 允許 ZTR 在不影響性能的情況下擴展到數(shù)千臺服務器。通過使用 ZTR 和 RTTCC ,數(shù)據(jù)中心運營商可以在無需任何交換機配置的情況下,享受部署和操作的便利性,以及大規(guī)模遠程直接內(nèi)存訪問( RDMA )的卓越性能。

這篇文章描述了以前在大規(guī)模和小型 RoCE 部署中推薦的 RoCE 擁塞控制。然后介紹了一種新的擁塞控制算法,該算法允許 ZTR 的無配置大規(guī)模實現(xiàn),其性能類似于支持 ECN 的 RoCE 。

具有數(shù)據(jù)中心量化擁塞通知的 RoCE 部署

在典型的基于 TCP 的環(huán)境中,分布式內(nèi)存請求需要許多步驟和 CPU 周期,這會對應用程序性能產(chǎn)生負面影響。 RDMA 消除了服務器之間內(nèi)存數(shù)據(jù)傳輸?shù)乃?CPU 參與,大大加快了對存儲數(shù)據(jù)的訪問和應用程序性能。

RoCE 在以太網(wǎng)環(huán)境中提供 RDMA ,這是數(shù)據(jù)中心的主要網(wǎng)絡結(jié)構。以太網(wǎng)需要高級擁塞控制機制來支持 RDMA 網(wǎng)絡傳輸。數(shù)據(jù)中心量化擁塞通知( DCQCN )是一種擁塞控制算法,能夠響應擁塞通知并動態(tài)調(diào)整流量傳輸速率。

DCQCN 的實現(xiàn)需要啟用顯式擁塞通知( ECN ),這需要配置網(wǎng)絡交換機。 ECN 將交換機配置為設置擁塞經(jīng)歷( CE )位,以指示即將發(fā)生的擁塞。

具有無功擁塞控制的零接觸 RoCE

NVIDIA 開發(fā)的 ZTR 技術允許 RoCE 部署,無需配置交換機基礎設施。 ZTR 根據(jù) InfiniBand Trade Association ( IBTA ) RDMA 標準構建,完全符合 RoCE specifications ,支持 RoCE 的無縫部署。 ZTR 還擁有與傳統(tǒng)交換機啟用的 RoCE 相當?shù)男阅埽⑶颐黠@優(yōu)于傳統(tǒng)的基于 TCP 的內(nèi)存訪問。此外,通過 ZTR , RoCE 網(wǎng)絡傳輸服務在普通 TCP / IP 環(huán)境中與非 RoCE 通信并行運行。

正如 NVIDIA 零接觸 RoCE 技術為 Microsoft Azure Stack HCI 實現(xiàn)了云經(jīng)濟 文章中所指出的,微軟已經(jīng)為其 Azure Stack HCI 平臺驗證了 ZTR ,該平臺通??蓴U展到幾十個節(jié)點。在這樣的環(huán)境中, ZTR 依賴于隱式丟包通知,這對于小規(guī)模部署來說已經(jīng)足夠了。通過添加新的基于往返計時器( RTT )的擁塞控制算法, ZTR 變得更加健壯和可擴展,而無需依賴丟包來通知服務器網(wǎng)絡擁塞。

引入往返時間擁塞控制

新的 NVIDIA 擁塞控制算法 RTTCC 主動監(jiān)控網(wǎng)絡 RTT ,以便在丟棄數(shù)據(jù)包之前主動檢測并適應擁塞的發(fā)生。 RTTCC 使用基于硬件的反饋環(huán)路實現(xiàn)動態(tài)擁塞控制,與基于軟件的擁塞控制算法相比,該反饋環(huán)路提供了顯著優(yōu)越的性能。 RTTCC 還支持更快的傳輸速率,可以在更大范圍內(nèi)部署 ZTR 。帶有 RTTCC 的 ZTR 現(xiàn)在作為測試版功能提供, GA 計劃在 2022 年下半年推出。

ZTR-RTTCC 的工作原理

ZTR-RTTCC 通過基于硬件 RTT 的擁塞控制算法擴展了 RoCE 網(wǎng)絡中的 DCQCN 。

圖 1 服務器之間的往返計時

定時數(shù)據(jù)包(上圖中的綠色網(wǎng)絡數(shù)據(jù)包)定期從啟動器發(fā)送到目標。立即返回定時數(shù)據(jù)包,從而能夠測量往返延遲。 RTTCC 測量數(shù)據(jù)包發(fā)送和啟動器接收數(shù)據(jù)包之間的時間間隔。差異(接收時間–發(fā)送時間)衡量往返延遲,這表明路徑擁塞。未壓縮流繼續(xù)傳輸數(shù)據(jù)包,以最佳利用可用網(wǎng)絡路徑帶寬。延遲增加的流意味著路徑擁塞, RTTCC 會對流量進行節(jié)流,以避免緩沖區(qū)溢出和數(shù)據(jù)包丟失。

隨著擁塞的減少或增加,網(wǎng)絡流量可以實時地向上或向下調(diào)整。主動監(jiān)控和應對擁塞的能力對于使 ZTR 能夠主動管理擁塞至關重要。這種主動速率控制還可以減少數(shù)據(jù)包的重新傳輸,提高 RoCE 性能。使用 ZTR-RTTCC ,數(shù)據(jù)中心節(jié)點不會等待數(shù)據(jù)包丟失的通知;相反,它們主動識別擁塞 prior to 數(shù)據(jù)包丟失并作出相應反應,通知啟動器調(diào)整傳輸速率。

如前所述, ZTR 的一個關鍵優(yōu)勢是能夠提供 RoCE 功能,同時在普通 TCP / IP 流量中與非 RoCE 通信同時運行。 ZTR 提供 RoCE 網(wǎng)絡功能的無縫部署。通過添加 RTTCC 主動監(jiān)控擁塞, ZTR 提供數(shù)據(jù)中心范圍內(nèi)的操作,無需交換機配置。請繼續(xù)閱讀,看看它的性能如何。

具有 RTTCC 性能的 ZTR

如圖 2 所示,當通過網(wǎng)絡結(jié)構配置 ECN 和 PFC 時,帶有 RTTCC 的 ZTR 提供了與 RoCE 相當?shù)膽贸绦蛐阅堋_@些測試是在最壞的多對一( in-cast )情況下進行的,以模擬擁擠條件下的吞吐量。

結(jié)果表明,具有 RTTCC 的 ZTR 不僅可以擴展到數(shù)千個節(jié)點,而且其性能與目前可用的最快 RoCE 解決方案相當。

在小規(guī)模( 256 個連接及以下)下,具有 RTTCC 的 ZTR 在啟用 ECN 擁塞控制(傳統(tǒng) RoCE )的 RoCE 的 99% 范圍內(nèi)執(zhí)行。

通過 16000 多個連接,具有 RTTCC 吞吐量的 ZTR 是傳統(tǒng) RoCE 吞吐量的 98% 。

帶有 RTTCC 的 ZTR 在不需要任何開關配置的情況下,提供了與傳統(tǒng) RoCE 幾乎相同的性能。

圖 2 連接不斷增加的應用程序帶寬

配置 ZTR

要使用新的 RTTCC 算法配置 ZTR , 下載 并為 NVIDIA 網(wǎng)絡接口卡安裝最新固件和工具,請執(zhí)行以下步驟。

配置 ZTR

要使用新的 RTTCC 算法配置 ZTR , 下載 并為 NVIDIA 網(wǎng)絡接口卡安裝最新固件和工具,請執(zhí)行以下步驟。

使用mlxconfig(持續(xù)配置)啟用可編程擁塞控制:

mlxconfig -d /dev/mst/mt4125_pciconf0 -y s
ROCE_CC_LEGACY_DCQCN=0

使用mlxfwreset重置設備或重新啟動主機:

mlxfwreset -d /dev/mst/mt4125_pciconf0 -l 3 -y r

完成這些步驟后,當 RDMA-CM 用于增強連接建立( ECE , MLNX _ OFED 版本 5.1 支持)時,將使用 ZTR-RTTCC 。

如果出現(xiàn)錯誤,無論 RDMA-CM 同步狀態(tài)如何,都可以強制使用 ZTR-RTTCC :

mlxreg -d /dev/mst/mt4125_pciconf0 --reg_id 0x506e --reg_len
0x40 --set "0x0.0:8=2,0x4.0:4=15" -y

總結(jié)

NVIDIA RTTCC 是 ZTR 的新?lián)砣刂扑惴?,在?shù)據(jù)中心范圍內(nèi)提供卓越的 RoCE 性能,無需對交換機基礎設施進行任何特殊配置。此增強功能使數(shù)據(jù)中心能夠在現(xiàn)有和新的數(shù)據(jù)中心基礎架構中無縫實現(xiàn) RoCE ,并從即時的應用程序性能改進中獲益。

關于作者

Aviv Barnea 是 NVIDIA 網(wǎng)絡軟件工程的高級主管。他監(jiān)督網(wǎng)絡適配器 RDMA 軟件和擁塞控制機制的開發(fā),實現(xiàn)高速、低延遲的數(shù)據(jù)中心連接。 Aviv 是 RDMA 和 RoCE 通信協(xié)議方面的專家,擁有該領域的多項專利,在推動 RDMA / RoCE 在業(yè)界的發(fā)展方面發(fā)揮了重要作用,在客戶和合作伙伴大規(guī)模部署加速網(wǎng)絡解決方案時與他們密切合作,并實現(xiàn)了無與倫比的性能和易用性。 Aviv 擁有特拉維夫大學工商管理碩士學位和理工學院物理與電氣工程學士學位。

Itay Ozery 是 NVIDIA 網(wǎng)絡產(chǎn)品營銷總監(jiān)。他為 Mellanox 的云網(wǎng)絡解決方案推動戰(zhàn)略性產(chǎn)品營銷和產(chǎn)品管理計劃。 Itay 在網(wǎng)絡安全領域領導了大規(guī)模的業(yè)務和項目,并與數(shù)據(jù)中心和電信服務提供商在 IT 系統(tǒng)和網(wǎng)絡工程領域擔任過多個職位。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 接口
    +關注

    關注

    33

    文章

    8718

    瀏覽量

    152032
  • NVIDIA
    +關注

    關注

    14

    文章

    5082

    瀏覽量

    103833
收藏 人收藏

    評論

    相關推薦

    小米澄清年底大規(guī)模裁員傳聞

    近日,網(wǎng)絡上流傳著一條關于小米公司將在年底進行大規(guī)模裁員的傳聞,引起了廣泛關注。針對這一傳聞,小米集團公關部總經(jīng)理王化個人社交平臺上進行了正式回應,以澄清事實。 王化指出,有關小米年底將進行大規(guī)模
    的頭像 發(fā)表于 12-26 10:46 ?241次閱讀

    RoCE與IB對比分析(二):功能應用篇

    在上一篇,我們對RoCE、IB的協(xié)議棧層級進行了詳細的對比分析,二者本質(zhì)沒有不同,但基于實際應用的考量,RoCE開放性、成本方面更勝一籌。本文我們將繼續(xù)分析
    的頭像 發(fā)表于 11-15 14:03 ?447次閱讀
    <b class='flag-5'>RoCE</b>與IB對比分析(二):功能應用篇

    RoCE與IB對比分析(一):協(xié)議棧層級篇

    AI 算力建設, RDMA 技術是支持高吞吐、低延遲網(wǎng)絡通信的關鍵。目前,RDMA技術主要通過兩種方案實現(xiàn):Infiniband和
    的頭像 發(fā)表于 11-15 13:58 ?1372次閱讀
    <b class='flag-5'>RoCE</b>與IB對比分析(一):協(xié)議棧層級篇

    VPS600超大規(guī)模透鏡顯微成像芯片獲“中國芯”芯火新銳產(chǎn)品獎

    2024國微電子產(chǎn)業(yè)促進大會暨第十九屆“中國芯”優(yōu)秀產(chǎn)品征集結(jié)果發(fā)布儀式于11月6-8日橫琴粵澳深度合作區(qū)舉行。南京威派視半導體技術有限公司VPS600超大規(guī)模
    的頭像 發(fā)表于 11-08 13:26 ?414次閱讀
    VPS600超<b class='flag-5'>大規(guī)模</b><b class='flag-5'>無</b>透鏡顯微成像芯片獲“中國芯”芯火新銳產(chǎn)品獎

    FPGA仿真黑科技\"EasyGo Vs Addon \",助力大規(guī)模電力電子系統(tǒng)仿真

    可以輕松地將其與各種硬件和協(xié)議連接,增強測試系統(tǒng)的靈活性。二、產(chǎn)品亮點▍超強FPGA芯片與接口配置,助力大規(guī)模電力電子系統(tǒng)仿真EasyGo Vs Addon支持的PXIe 7891搭載全新
    發(fā)表于 10-23 18:18

    云平臺大規(guī)模設備管理和數(shù)據(jù)分析的作用

    在當代數(shù)字化轉(zhuǎn)型的浪潮,云平臺作為信息技術基礎設施的核心組件,扮演著無可替代的角色,尤其大規(guī)模設備管理和數(shù)據(jù)分析領域,其重要性和影響力日益凸顯。本文旨在深入探討云平臺如何通過其獨特
    的頭像 發(fā)表于 09-19 17:22 ?361次閱讀
    云平臺<b class='flag-5'>在</b><b class='flag-5'>大規(guī)模</b>設備管理和數(shù)據(jù)分析<b class='flag-5'>中</b>的作用

    使用DSPLIB FFT實現(xiàn)實現(xiàn)實際輸入,無需數(shù)據(jù)縮放

    電子發(fā)燒友網(wǎng)站提供《使用DSPLIB FFT實現(xiàn)實現(xiàn)實際輸入,無需數(shù)據(jù)縮放.pdf》資料免費下載
    發(fā)表于 09-19 11:27 ?0次下載
    使用DSPLIB FFT<b class='flag-5'>實現(xiàn)實現(xiàn)</b>實際輸入,無需數(shù)據(jù)<b class='flag-5'>縮放</b>

    labview實現(xiàn)DBC界面加載配置

    labview實現(xiàn)DBC界面加載配置
    發(fā)表于 08-19 14:27 ?27次下載

    大規(guī)模語言模型:從理論到實踐】- 每日進步一點點

    非常推薦大家去讀 【大規(guī)模語言模型:從理論到實踐】這本書,系統(tǒng)的講解了大模型的前世今生,對各個環(huán)節(jié)知識進行了普及。 今天跟我一起學習歸一化的部分。 大模型訓練的歸一化是一個關鍵步驟,旨在提高模型
    發(fā)表于 05-31 19:54

    奧比光攜最新3D視覺感知相機亮相日本最大規(guī)模AI展

    5月22日-24日,日本最大規(guī)模人工智能展——AI EXPO Japan東京有明國際展覽中心盛大開幕,匯聚全球尖端的AI技術和創(chuàng)新應用。
    的頭像 發(fā)表于 05-28 09:32 ?384次閱讀

    摩爾線程與問芯穹國產(chǎn)GPU上首次實現(xiàn)大模型實訓

    近日,摩爾線程與問芯穹共同宣布,雙方已正式完成基于國產(chǎn)全功能GPU千卡集群的3B規(guī)模大模型實訓。這款名為“MT-infini-3B”的模型,摩爾線程夸娥(KUAE)千卡智算集群與
    的頭像 發(fā)表于 05-27 10:59 ?711次閱讀

    Arm計劃2025年大規(guī)模銷售AI芯片

    軟銀集團旗下的英國芯片巨頭Arm近日公布了其雄心勃勃的AI芯片銷售計劃。該公司宣布,計劃到2025年實現(xiàn)AI芯片的大規(guī)模銷售,以進一步鞏固其全球芯片市場的領先地位。
    的頭像 發(fā)表于 05-20 10:48 ?694次閱讀

    深度解讀RoCE v2的核心技術原理

    RoCE v2是一種專為實現(xiàn)以太網(wǎng)環(huán)境下低延遲、高吞吐量數(shù)據(jù)傳輸而設計的RDMA協(xié)議。相較于涉及多重處理層次的傳統(tǒng)數(shù)據(jù)傳輸方式,RoCE v2實現(xiàn)了系統(tǒng)間的直接內(nèi)存訪問機制,最大限度地
    發(fā)表于 04-29 10:32 ?5105次閱讀
    深度解讀<b class='flag-5'>RoCE</b> v2的核心<b class='flag-5'>技術</b>原理

    專用集成電路都是大規(guī)模的嗎為什么呢

    的集成度和性能優(yōu)勢。然而,并非所有專用集成電路都是大規(guī)模的,因為集成度的大小取決于設計和制造的要求。 探討專用集成電路是否大規(guī)模之前,我們首先需要了解什么是大規(guī)模集成電路(Very
    的頭像 發(fā)表于 04-21 09:15 ?598次閱讀

    專用集成電路都是大規(guī)模的嗎為什么

    Integrated Circuit, GPIC)相比,ASIC針對特定的應用程序進行了優(yōu)化和定制,以實現(xiàn)更高的性能、更低的功耗和更小的面積。 專用集成電路之所以通常是大規(guī)模的,是因為它們需要集成
    的頭像 發(fā)表于 04-14 10:48 ?650次閱讀