欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CPU共享資源隔離的利器MPAM特性介紹

Linux閱碼場 ? 來源:openEuler ? 作者:汪少博 ? 2021-04-20 11:23 ? 次閱讀

MPAM(Memory System Resource Partitioning and Monitoring)[1]特性用于解決混部業(yè)務(wù)時由于共享資源競爭帶來的性能下降問題,MPAM 作為繼 x86 RDT[2]技術(shù)后的另一個針對 CPU 訪存系統(tǒng)資源隔離的全新特性倍受關(guān)注,相比其他架構(gòu)的類似特性,Arm64 架構(gòu)下的 MPAM 特性采用全新的確定性流控方式,控制手段更加豐富,控制對象覆蓋更廣,目前在鯤鵬服務(wù)器上的應(yīng)用取得了良好的結(jié)果。openEuler kernel 已于 openEuler 21.03 創(chuàng)新版本支持 MPAM,成為首個同時支持 x86 RDT 和 MPAM 的開源平臺;MPAM 項目組聯(lián)合下游各大廠商及研究機(jī)構(gòu)在 POC 場景上做了驗證,使能 MPAM 并在云場景下進(jìn)行了多個測試點的適配和測試,解決了不同虛擬機(jī)因為 Cache 和訪存干擾帶來的性能干擾問題,目前已具備相當(dāng)?shù)某墒於?;為支撐下游廠商使用 MPAM,構(gòu)建完整端到端基礎(chǔ)軟件棧,項目組后續(xù)還會在 openEuler 推出一系列配套調(diào)測工具和部署軟件。

特性介紹

如何處理諸如 L3 Cache 等內(nèi)存系統(tǒng)資源競爭的問題一直是業(yè)界研究的焦點,例如 Kpart[3],DICER[4],dcat[5],這些研究為工業(yè)界應(yīng)用共享資源隔離技術(shù)打下了基礎(chǔ)。MPAM 是 Arm Architecture v8.4 的 Extension 特性,其目的是用于解決服務(wù)器系統(tǒng)中,混部不同類型業(yè)務(wù)時,由于 CPU 訪存過程中共享資源的競爭帶來的某些關(guān)鍵應(yīng)用性能下降或者系統(tǒng)整體性能下降的問題。

e81ae754-a100-11eb-8b86-12bb97331649.jpg

MPAM 系統(tǒng)框架參考圖 1,相比其他架構(gòu)的類似特性,MPAM 設(shè)計上參考了更多前沿技術(shù),MPAM 最顯著的特征是:

提供更多控制手段,針對 Cache 資源以及訪存通道,增加了對訪存流的優(yōu)先級控制和完全隔離控制;

按照 Cache way 為粒度,以 bitmap 的形式分配 Cache way,不要求所分配的 Cache way 在 bitmap 中連續(xù);

MPAM 支持在虛擬機(jī)內(nèi)部劃分共享資源;

MPAM 增加了對 SMMU 的支持,可以限制 IO 設(shè)備對 Cache 和相關(guān)內(nèi)存系統(tǒng)資源的使用;

從體系結(jié)構(gòu)角度優(yōu)化·最佳配置,在對訪存流的限制上,MPAM 流控方式可精確控制訪存流百分比,可以確定性地保障訪存敏感型業(yè)務(wù)的性能。

e83288be-a100-11eb-8b86-12bb97331649.jpg

圖 2 MPAM 和 RDT L3 Cache 控制方式異同 如圖 2,MPAM 規(guī)定配置 Cache 主要有兩種方式,一種是通過優(yōu)先級配置,這種情況下,優(yōu)先級高的業(yè)務(wù)流將優(yōu)先使用 Cache 的使用權(quán);第二種是以 Cache way 為粒度,按照 bitmap 形式隔離不同業(yè)務(wù)對 Cache 的使用,不要求 Cache way 分配連續(xù),這也是目前鯤鵬 920 采取的控制方式。x86 RDT 目前僅支持第二種,且大部分型號要求 Cache way 分配連續(xù)[6]。圖 3 為鯤鵬 920 和常用 x86 型號 RDT 特性對流量控制的比較,對比其他架構(gòu)的類似特性,MPAM 在流量控制上的最大特點是參考當(dāng)前 DDR 通道的傳輸能力,從而對業(yè)務(wù)流限制一個明確的上下限,若當(dāng)前受控流量超過該 DDR 通道設(shè)定百分比對應(yīng)的上限流量時,則限制到該百分比以下,同時在小于下限流量時享有優(yōu)先訪問權(quán)。對比 x86 RDT,其限制流量的動作發(fā)生在 L2 和 L3 之間,使用給受控流量主動加時延的方式降低目標(biāo)流量[6]。

e84aa1a6-a100-11eb-8b86-12bb97331649.jpg

圖 3 鯤鵬 920 MPAM 與 x86 RDT 流量限制上的異同 除此之外,MPAM 協(xié)議規(guī)定了額外兩種流量控制方式,如圖 4 所示,一種是采用 bitmap 的方式完全隔離開不同的業(yè)務(wù)流,被隔離的業(yè)務(wù)流將會按照 bitmap 劃分的時間片分區(qū)間輪詢使用訪存通道;第二種,在第一種方式的基礎(chǔ)上,還可使用優(yōu)先級方式調(diào)整業(yè)務(wù)流的優(yōu)先級,在發(fā)生訪存擁擠時,同一時刻高優(yōu)先級業(yè)務(wù)流將優(yōu)先享有該 DDR 通道。

e88eb378-a100-11eb-8b86-12bb97331649.jpg

圖 4 MPAM 帶寬的完全隔離和優(yōu)先級控制方式 MPAM 可以在更多維度靈活配置業(yè)務(wù)對 Cache 和帶寬的使用,適應(yīng)更多的應(yīng)用場景,易于獲得更大的優(yōu)化空間。

特性使能

硬件支持:鯤鵬 920[7]

BIOS 支持:Taishan 170 及更新版本

內(nèi)核支持:openEuler 21.03 或 openEuler 20.03 LTS SP1[8]

用戶手冊:https://gitee.com/openeuler/openRSO/blob/master/docs/manual/arm_mpam_resctrlfs_user_interface.md

鯤鵬 920 已支持 MPAM 特性的部分功能,如圖 5 所示:

e8c0ca8e-a100-11eb-8b86-12bb97331649.jpg

圖 5 鯤鵬 920 MPAM 所使能功能

cpbm: Cache Portion Bit Map,按照位圖控制分配特定容量和特定位置的 L3 Cache,其中每個 bit 代表一條 Cache way;

max: Memory Bandwidth Maximum Partition,按照能夠通過受控 DDR 通道最大帶寬的百分比進(jìn)行訪存流量限制;

min: Memory Bandwidth Minimum Partition,提供最小帶寬百分比表示允許通過受控 DDR 通道的容量,小于最小百分比將享受較高優(yōu)先級的通過權(quán);

hdl: Memory Bandwidth Hard Limit,開啟會使得分區(qū)的帶寬使用率降至最大帶寬控制的范圍之內(nèi),參考 Max,否則,只有在通道擁擠時才會做適當(dāng)限制;

Monitoring: Cache/Memory Bandwidth monitoring,對 L3 Cache 占用大小和訪存帶寬大小進(jìn)行實時監(jiān)控。

性能測試

硬件平臺:鯤鵬 920 @CORE 96 2.6GHZ

DDR:Configured Memory Speed: 2666 MT/s

OS:openEuler 21.03

BIOS:Taishan 170

基礎(chǔ)功能指標(biāo)

e8cd24e6-a100-11eb-8b86-12bb97331649.jpg

圖 6 實驗一 MPAM 單 workload L3 Cache 分配和監(jiān)控實驗一

workload: numactl –m 0 bw_mem –P 8 –N 4 128M rd如圖 6 所示,啟動一個 workload,workload 也可自行選擇,對 L3 Cache 按 cpbm 分配,通過 MPAM 的 monitor 查看 workload 占用的 L3 Cache 容量變化,可見 workload 真實占用的 Cache 容量和理論大小基本一致。

e8d9a342-a100-11eb-8b86-12bb97331649.jpg

圖 7 實驗二 MPAM 雙 workload Cache 隔離實驗二

workload1: numactl –m 0 stress-ng –cache 10 --aggressive workload2: numactl –m 0 bw_mem –P 8 –N 4 128M rd如圖 7 所示,啟動兩個 workload,使用 cpbm 方式對兩個 workload 做 Cache 隔離測試,通過 MPAM 的 monitor 查看 workload 占用的 L3 Cache 容量變化,該測試分為兩部分,前四組為 Cache way 完全隔離測試,后兩組為 overlap 測試,可見 Cache 隔離效果與理論值基本一致,后兩組實際效果與 workload 對 Cache 的占用強(qiáng)度有關(guān)。

e8e5fea8-a100-11eb-8b86-12bb97331649.jpg

圖 8 實驗三帶寬最大百分比調(diào)控實驗三

workload: numactl –m 0 bw_mem –P 8 –N 4 128M rd如圖 8 所示,在大流量下和中小流量下(當(dāng)前 DDR 通道最大帶寬約為 75MB/S)對帶寬做最大百分比調(diào)控,通過 MPAM monitor 查看 workload 對應(yīng)流量大小變化,可見流量控制效果基本與預(yù)期相符,鯤鵬 920 上 MPAM 設(shè)定的帶寬控制有效百分比約在 20%-80%。

spec CPU 2006 測試

選用 spec CPU 2006 omnet 測試套和 spec CPU 2006 milc,分析 Cache 干擾:cpu+內(nèi)存型業(yè)務(wù)混合部署場景下,通過 CPBM 隔離 L3 Cache 可以削弱不同業(yè)務(wù)對 Cache 的競爭,提升性能,如圖 9 所示,非隔離時兩種業(yè)務(wù)之的 Cache 實際占用大小波動非常大,這是造成性能下降的主要原因。

e9169932-a100-11eb-8b86-12bb97331649.jpg

圖 9 MPAM spec 2006 L3 Cache 隔離測試[9] 通過對兩組業(yè)務(wù)的 Cache 進(jìn)行完全隔離,可以看到隔離后的業(yè)務(wù) Cache 實際占用大小波動明顯減少,對比不做隔離的情況,omnet 業(yè)務(wù)最終獲得了 10+%的性能提升,milc 業(yè)務(wù)性能也略有提升。

DPDK 隔離帶寬干擾

裸機(jī)場景下,使用 pktgen+DPDK 進(jìn)行試驗,并對 DPDK 施加帶寬壓力,使用 MPAM 對比隔離前后 DPDK 性能變化:

solo加壓加壓+MPAM限制帶寬20%

每秒平均指令數(shù)2E+09 + 5E+071.7E+092E+09 + 4E+07

指令數(shù)下降比NA22%0.7%

dpdk性能下降NA≈21%≈0

如表 1 所示,可知加壓后導(dǎo)致性能退化 22%左右,加壓參數(shù)參考[9],使用 MPAM 限制壓力程序 20%帶寬,DPDK 性能恢復(fù)正常。

e926fa16-a100-11eb-8b86-12bb97331649.jpg

圖 10 RDT 和 MPAM DPDK 場景測試[10][11]

內(nèi)存大頁+Cache 隔離

如圖 11 所示,網(wǎng)絡(luò)轉(zhuǎn)發(fā)業(yè)務(wù)選用 2G 內(nèi)存大頁,左圖不同線程之間存在穩(wěn)定的 Cache 干擾,右圖表示性能下降比例,通過隔離 Cache 可消除該干擾,保證關(guān)鍵業(yè)務(wù)的性能。

e93291c8-a100-11eb-8b86-12bb97331649.jpg

圖 11 內(nèi)存大頁和 MPAM Cache 隔離測試網(wǎng)絡(luò)轉(zhuǎn)發(fā)業(yè)務(wù)[9]

開放生態(tài)

資源隔離是 OS 中非常重要的一個組成部分,針對 cpu 核訪存?zhèn)鹊母綦x技術(shù)又是資源隔離中的一個重要組成部分,如何規(guī)劃好未來對內(nèi)存系統(tǒng)資源的高效使用,對保障業(yè)務(wù)在更加復(fù)雜的平臺上穩(wěn)定運轉(zhuǎn)至關(guān)重要。為減少跨平臺成本,豐富調(diào)試手段,提升業(yè)務(wù)部署效率,我們希望歸一化不同架構(gòu)的輸出接口,開放應(yīng)用端到端統(tǒng)一部署框架,針對不同場景定制化通用化的資源隔離調(diào)度引擎,構(gòu)建一整套應(yīng)用資源管理基礎(chǔ)軟件棧。

e93be6ec-a100-11eb-8b86-12bb97331649.jpg

圖 12 共享資源調(diào)控基礎(chǔ)軟件框架我們計劃在 openEuler 開源一套共享資源調(diào)控基礎(chǔ)軟件框架,用于跨平臺統(tǒng)一管理業(yè)務(wù)使用 Cache 及相關(guān)內(nèi)存系統(tǒng)資源,通過引入豐富、實用的調(diào)試工具幫助用戶排查相關(guān)性能問題,并增加通用資源調(diào)度引擎處理針對不同場景下的資源動態(tài)調(diào)控問題,按照部署業(yè)務(wù)的層級整合和編排共享資源的使用,方便用戶部署業(yè)務(wù)和整合系統(tǒng)資源分配。針對 MPAM 技術(shù),目前已和通信行業(yè)、電商、云服務(wù)商等合作領(lǐng)域企業(yè)進(jìn)行溝通合作,并已在部分場景上取得成效,歡迎業(yè)界專家建言獻(xiàn)策,共同打造實用,穩(wěn)固,開放的底層資源隔離基礎(chǔ)軟件底座。

原文標(biāo)題:openEuler 21.03 特性解讀 | CPU 共享資源隔離的利器 - MPAM

文章出處:【微信公眾號:Linuxer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10918

    瀏覽量

    213164

原文標(biāo)題:openEuler 21.03 特性解讀 | CPU 共享資源隔離的利器 - MPAM

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    hyper-v共享,Hyper-V 共享:Hyper-V的資源共享設(shè)置

    的解決方案。今天就為大家介紹Hyper-V共享:Hyper-V的資源共享設(shè)置。 ? ?在Hyper-V虛擬化環(huán)境中,資源共享是實現(xiàn)高效管理和靈活部署的關(guān)鍵功能之一。Hyper-V提供了
    的頭像 發(fā)表于 02-07 10:26 ?70次閱讀
    hyper-v<b class='flag-5'>共享</b>,Hyper-V <b class='flag-5'>共享</b>:Hyper-V的<b class='flag-5'>資源共享</b>設(shè)置

    hyper-v共享,hyper-v共享:實現(xiàn)主機(jī)與虛擬機(jī)之間高效文件共享的最佳實踐

    :實現(xiàn)主機(jī)與虛擬機(jī)之間高效文件共享的最佳實踐。 ? ?在企業(yè)級虛擬化環(huán)境中,實現(xiàn)主機(jī)與虛擬機(jī)之間的高效文件共享是提升資源利用率和協(xié)作效率的關(guān)鍵。Hyper-V提供了多種文件共享方法,能
    的頭像 發(fā)表于 01-24 14:23 ?235次閱讀
    hyper-v<b class='flag-5'>共享</b>,hyper-v<b class='flag-5'>共享</b>:實現(xiàn)主機(jī)與虛擬機(jī)之間高效文件<b class='flag-5'>共享</b>的最佳實踐

    N32G401系列芯片關(guān)鍵特性,定貨型號及資源,封裝尺寸等信息

    電子發(fā)燒友網(wǎng)站提供《N32G401系列芯片關(guān)鍵特性,定貨型號及資源,封裝尺寸等信息.pdf》資料免費下載
    發(fā)表于 01-22 15:41 ?0次下載
    N32G401系列芯片關(guān)鍵<b class='flag-5'>特性</b>,定貨型號及<b class='flag-5'>資源</b>,封裝尺寸等信息

    上海貝嶺數(shù)字隔離器產(chǎn)品介紹

    數(shù)字隔離器作為二十一世紀(jì)新推出的隔離技術(shù),以其更高的可靠性、簡化的外圍器件,高集成特性,已被廣泛用于工業(yè)控制、汽車、儀表、醫(yī)療等應(yīng)用。
    的頭像 發(fā)表于 12-19 17:24 ?286次閱讀
    上海貝嶺數(shù)字<b class='flag-5'>隔離</b>器產(chǎn)品<b class='flag-5'>介紹</b>

    林業(yè)巡檢新利器:頂堅單北斗定位手持終端助力資源保護(hù)

    林業(yè)巡檢是一項至關(guān)重要的工作,它對于保護(hù)森林資源、維護(hù)生態(tài)平衡具有不可估量的價值。隨著科技的不斷發(fā)展,頂堅單北斗定位手持終端作為一種新型的巡檢工具,正逐漸成為林業(yè)巡檢的新利器,為資源保護(hù)提供了強(qiáng)有力
    的頭像 發(fā)表于 11-13 14:25 ?228次閱讀
    林業(yè)巡檢新<b class='flag-5'>利器</b>:頂堅單北斗定位手持終端助力<b class='flag-5'>資源</b>保護(hù)

    RISC-V內(nèi)核是如何與FPGA內(nèi)核進(jìn)行資源共享的?

    我們知道RISC-V內(nèi)核支持的精簡指令集,F(xiàn)PGA又是要求性能相對比較高的模塊,這兩者在同一個產(chǎn)品中可否共存?若能,兩者的資源又是通過哪些接口進(jìn)行傳輸共享的呢?
    發(fā)表于 10-27 17:05

    標(biāo)準(zhǔn)數(shù)字隔離器主要特性和應(yīng)用---騰恩科技

    在現(xiàn)代電子系統(tǒng)中,不同電路部分之間需要可靠的隔離,尤其是在高壓環(huán)境或必須保持敏感信號完整性的情況下。一種這樣的解決方案是使用標(biāo)準(zhǔn)數(shù)字隔離器。這些組件在電路的不同部分之間提供電氣隔離,確保安全、降噪和可靠的信號傳輸。本文深入探討了
    的頭像 發(fā)表于 10-25 15:13 ?211次閱讀

    如何限制容器可以使用的CPU資源

    默認(rèn)情況下容器可以使用的主機(jī) CPU 資源是不受限制的。和內(nèi)存資源的使用一樣,如果不對容器可以使用的 CPU 資源進(jìn)行限制,一旦發(fā)生容器內(nèi)程
    的頭像 發(fā)表于 10-24 17:04 ?337次閱讀
    如何限制容器可以使用的<b class='flag-5'>CPU</b><b class='flag-5'>資源</b>

    Xilinx ZYNQ 7000系列SoC的功能特性

    本文介紹下Xilinx ZYNQ 7000系列SoC的功能特性、資源特性、封裝兼容性以及如何訂購器件。
    的頭像 發(fā)表于 10-24 15:04 ?1372次閱讀
    Xilinx ZYNQ 7000系列SoC的功能<b class='flag-5'>特性</b>

    智能駕駛在共享出行中的作用

    智能駕駛在共享出行中發(fā)揮著至關(guān)重要的作用,它不僅改變了傳統(tǒng)的出行方式,還提高了出行效率、安全性和用戶體驗。以下是對智能駕駛在共享出行中作用的介紹: 一、提高出行效率 智能調(diào)度與路線規(guī)劃 : 智能駕駛
    的頭像 發(fā)表于 10-24 09:09 ?605次閱讀

    傳感器的動態(tài)特性和靜態(tài)特性參數(shù)介紹

    傳感器的特性可以分為靜態(tài)特性和動態(tài)特性兩大類,這兩類特性分別描述了傳感器在不同輸入條件下的輸出響應(yīng)特點。下面將詳細(xì)介紹這兩類
    的頭像 發(fā)表于 09-29 16:24 ?2918次閱讀

    多倫科技旗下金電科技亮相北京充換電展 引領(lǐng)綠色出行新紀(jì)元

    多倫科技旗下金電科技在發(fā)展過程中始終注重綠色生態(tài)的構(gòu)建,堅持開放合作,通過共享資源、成果共創(chuàng)等方式,共同推動新能源汽車充電技術(shù)的快速發(fā)展與普及。
    的頭像 發(fā)表于 08-15 15:44 ?508次閱讀
    多倫科技旗下金電科技亮相北京充換電展 引領(lǐng)綠色出行新紀(jì)元

    互斥鎖和自旋鎖的實現(xiàn)原理

    互斥鎖和自旋鎖是操作系統(tǒng)中常用的同步機(jī)制,用于控制對共享資源的訪問,以避免多個線程或進(jìn)程同時訪問同一資源,從而引發(fā)數(shù)據(jù)不一致或競爭條件等問題。 互斥鎖(Mutex) 互斥鎖是一種基本的同步機(jī)制,用于
    的頭像 發(fā)表于 07-10 10:07 ?636次閱讀

    AMD Radeon RX 7000M系列顯卡特性分析

    AMD RDNA 3架構(gòu) – 新的計算單元在渲染、AI和光線追蹤之間共享資源,以更有效地利用每個晶體管,實現(xiàn)快速又高效的性能。
    發(fā)表于 04-15 11:31 ?746次閱讀
    AMD Radeon RX 7000M系列顯卡<b class='flag-5'>特性</b>分析

    如何在Semaphore(信號量)和Mutex(互斥)之間做選擇?

    在單CPU系統(tǒng)中,處理器是一個共享資源。在多個進(jìn)程之間共享處理器時,處理器的使用由調(diào)度程序控制,不存在競爭問題。
    的頭像 發(fā)表于 03-05 11:35 ?1054次閱讀
    如何在Semaphore(信號量)和Mutex(互斥)之間做選擇?