NVIDIA BLUVELD-2 數(shù)據(jù)處理器( DPU )提供了不匹配的軟件定義網(wǎng)絡(luò)( SDN )性能、可編程性和可擴(kuò)展性。它集成了八個(gè) Arm CPU 內(nèi)核、安全的高級(jí) ConnectX-6 Dx 云網(wǎng)絡(luò)接口和硬件加速器,這些硬件加速器共同卸載、加速和隔離 SDN 功能,執(zhí)行連接跟蹤、流匹配和高級(jí)數(shù)據(jù)包處理。
這篇文章概述了精確SDN性能基準(zhǔn)的基本原理,并演示了在NVIDIA CONTROX-6DX 上實(shí)現(xiàn)的實(shí)際結(jié)果。 BlueField-2 和下一代 BlueField-3 DPU 包括額外的加速功能,并為更廣泛的用例提供更高的性能。
SDN 性能基準(zhǔn)最佳實(shí)踐
BlueField DPU 或 ConnectX SmartNICs 的任何 SDN 性能評(píng)估都應(yīng)充分利用硬件加速器的全部功能。 BLUBELFIED-2 的分組處理動(dòng)作是通過(guò)NVIDIA ASAP 編程的2(加速交換和數(shù)據(jù)包處理)引擎。 BlueField DPU 和 ConnectX SmartNICs 上的 SDN 加速器都依賴于 ASAP2以及其他可編程硬件加速器,以實(shí)現(xiàn)線速率網(wǎng)絡(luò)性能。
NVIDIA 盡快2支持已集成到上游 Linux 內(nèi)核和數(shù)據(jù)平面開發(fā)工具包( DPDK )框架中,并可在一系列 Linux 操作系統(tǒng)發(fā)行版和云管理平臺(tái)中隨時(shí)獲得。
從 Linux 內(nèi)核 5.6 開始,可以使用連接跟蹤加速。最佳實(shí)踐是使用現(xiàn)代企業(yè) Linux 操作系統(tǒng),例如 Ubuntu 20.04 、 Red Hat enterprise Linux 8.4 等等。這些較新的內(nèi)核包括對(duì) SDN 的收件箱支持,以及對(duì) ConnectX-6 Dx SmartNICs 和 BlueField-2 DPU 的連接跟蹤加速?;趦?nèi)核過(guò)時(shí)的 Linux 系統(tǒng),通過(guò)連接跟蹤對(duì) SDN 進(jìn)行基準(zhǔn)測(cè)試可能會(huì)產(chǎn)生誤導(dǎo)。
最后,要使任何 SDN 基準(zhǔn)有效,它必須代表在現(xiàn)實(shí)世界的云數(shù)據(jù)中心中實(shí)現(xiàn)的 SDN 管道,而在現(xiàn)實(shí)世界中,數(shù)十萬(wàn)個(gè)連接是常態(tài)。 ConnectX-6 Dx SmartNICs 和 BlueField-2 DPU 都是為超規(guī)模環(huán)境而設(shè)計(jì)和部署的,并在云級(jí)別提供突破性的網(wǎng)絡(luò)性能。
加速 SDN 性能
看看NVIDIA CONTROX-6DX 性能。以下基準(zhǔn)測(cè)試顯示了啟用連接跟蹤硬件加速的 SDN 管道性能的吞吐量和延遲。我們使用與其他報(bào)告結(jié)果類似的系統(tǒng)設(shè)置、測(cè)試工具和程序進(jìn)行測(cè)試。我們運(yùn)行了 Open VSwitch ( OVS ) DPDK ,以便在 ConnectX-6 Dx SmartNIC 上無(wú)縫地實(shí)現(xiàn)連接跟蹤加速。
以下圖表描述了使用 iperf3 工具對(duì) 4 個(gè)和 16 個(gè) iperf 實(shí)例(每個(gè)實(shí)例一個(gè)流)觀察到的 SDN 性能。
圖 1 。使用 iperf3 工具觀察了 4 個(gè)實(shí)例的 SDN 性能 s
圖 2 。使用 16 個(gè) iperf 實(shí)例觀察 SDN 性能 s
主要發(fā)現(xiàn):
ConnectX-6 Dx 提供了更高的吞吐量,對(duì)于所有測(cè)試的數(shù)據(jù)包大小, 4 個(gè)和 16 個(gè)實(shí)例的吞吐量分別高達(dá) 120% 和 150% 。
ConnectX-6 Dx 對(duì)于小到 1 KB 的數(shù)據(jù)包的傳輸速率大于 90% ,而其他產(chǎn)品的傳輸速率為 8 KB 。
下表顯示了在同一系統(tǒng)設(shè)置上具有 32 個(gè)實(shí)例的 SDN 管道的觀察性能。結(jié)果表明,隨著流量的增加, ConnectX-6 Dx 提供了更好的可擴(kuò)展性,吞吐量提高了 4 倍。
圖 3 。 使用 32 個(gè) iperf 實(shí)例觀察 SDN 性能 s
以下基準(zhǔn)測(cè)試使用 sockperf 測(cè)量延遲。結(jié)果表明,對(duì)于測(cè)試的所有數(shù)據(jù)包大小,與其他產(chǎn)品相比, ConnectX-6 Dx 的延遲降低了約 20-30% 。
圖 4 。 觀察到帶有連接跟蹤的 SDN 管道的單向延遲
非加速連接跟蹤實(shí)現(xiàn)會(huì)在主機(jī) CPU 上造成瓶頸。將連接跟蹤轉(zhuǎn)移到片上加速器意味著在這些基準(zhǔn)測(cè)試中實(shí)現(xiàn)的性能并不強(qiáng)烈依賴于主機(jī) CPU 或其驅(qū)動(dòng)測(cè)試臺(tái)的能力。這些結(jié)果也表明了集成了 ConnectX-6 Dx 的 BlueField-2 DPU 可實(shí)現(xiàn)的性能。
BlueField-3 支持更高的性能級(jí)別
NVIDIA 歡迎有機(jī)會(huì)測(cè)試和展示 ConnectX-6 Dx 和 BlueField-2 的性能,同時(shí)遵守行業(yè)最佳實(shí)踐和操作標(biāo)準(zhǔn)。本文中顯示的數(shù)據(jù)將 ConnectX-6 Dx 的性能基準(zhǔn)測(cè)試結(jié)果與其他地方報(bào)告的結(jié)果進(jìn)行了比較。與其他產(chǎn)品相比, ConnectX-6 Dx 的吞吐量提高了 4 倍,延遲降低了 30% 。這些基準(zhǔn)測(cè)試結(jié)果證明了NVIDIA 在 SDN 加速技術(shù)中的領(lǐng)導(dǎo)地位。
BlueField-3 是下一代 NVIDIA DPU ,集成了先進(jìn)的 ConnectX-7 適配器和其他加速引擎。 BlueField-3 提供 400 Gb / s 的網(wǎng)絡(luò)、更強(qiáng)大的 Arm CPU 內(nèi)核和高度可編程的數(shù)據(jù)路徑加速器( DPA ),提供更高級(jí)別的性能和可編程性,以解決大規(guī)模數(shù)據(jù)中心中最苛刻的工作負(fù)載。使用 DOCA 在 BlueField-2 上構(gòu)建的現(xiàn)有 DPU 加速 SDN 應(yīng)用程序?qū)⑹芤嬗?BlueField-3 帶來(lái)的性能增強(qiáng),而無(wú)需任何代碼更改。
關(guān)于作者
Tal Roll 是 NVIDIA 網(wǎng)絡(luò)產(chǎn)品營(yíng)銷總監(jiān)。好未來(lái)在云基礎(chǔ)設(shè)施、網(wǎng)絡(luò)安全和 HPC / AI 領(lǐng)域擁有 20 多年的經(jīng)驗(yàn),在定義和推出成功產(chǎn)品方面有著良好的業(yè)績(jī)記錄。 Tal 擁有 IDC 大學(xué)和沃頓大學(xué)的工商管理 MBA 學(xué)位,以及特拉維夫大學(xué)的電氣工程和計(jì)算機(jī)科學(xué)理學(xué)學(xué)士學(xué)位。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19440瀏覽量
231326 -
cpu
+關(guān)注
關(guān)注
68文章
10914瀏覽量
213153 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5082瀏覽量
103833
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論