欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探究一種新的可配置處理器的異構(gòu)多核線程級動態(tài)調(diào)度模型

電子工程師 ? 來源:中國集成電路 ? 作者:胡泊 付宇卓 ? 2021-04-27 18:20 ? 次閱讀

本文針對基于可配置處理器的異構(gòu)多核結(jié)構(gòu),提出一種新的線程級動態(tài)調(diào)度模型。此類異構(gòu)多核系統(tǒng)中每個核分別針對某一應(yīng)用做指令集擴展,調(diào)度器通過線程、處理器核以及指令集間的映射關(guān)系,動態(tài)調(diào)度線程至適合的處理器核,從而在沒有大幅增加芯片面積的前提下,達(dá)到與每個核都

1.概述

多核處理器從結(jié)構(gòu)上可以分為同構(gòu)多核和異構(gòu)多核兩類。同構(gòu)多核使用多個相同的處理核,通過并行處理提高系統(tǒng)性能;異構(gòu)多核使用多個不同的處理核,增加并行性的同時還可針對特定應(yīng)用做硬件加速,因此具有更好的加速比。不過,由于異構(gòu)多核的核間指令集存在差異,動態(tài)調(diào)度較難實現(xiàn)。

本文針對基于可配置處理器的異構(gòu)多核結(jié)構(gòu),提出一種新的線程級動態(tài)調(diào)度模型。此類異構(gòu)多核系統(tǒng)中每個核分別針對某一應(yīng)用做指令集擴展,調(diào)度器通過線程、處理器核以及指令集間的映射關(guān)系,動態(tài)調(diào)度線程至適合的處理器核,從而在沒有大幅增加芯片面積的前提下,達(dá)到與每個核都具有全擴展指令集相近似的加速比,此外該模型還可以有效減少編程模型的復(fù)雜度。

2.新模型的數(shù)學(xué)描述

2.1 現(xiàn)有異構(gòu)多核分析

同構(gòu)多核核間無差異,因此動態(tài)調(diào)度容易實現(xiàn),而異構(gòu)多核動態(tài)調(diào)度可行與否取決于指令集結(jié)構(gòu)設(shè)計?,F(xiàn)有異構(gòu)多核指令集結(jié)構(gòu)設(shè)計大致可分為三類:

● 指令集完全不同

此類設(shè)計中,設(shè)計者選擇不同功能導(dǎo)向的處理器核組成異構(gòu)多核系統(tǒng),每一種核針對某一類處理都具有較強功能,核之間的指令集存在巨大差異,因此動態(tài)調(diào)度在此類設(shè)計中無法實現(xiàn),只能通過靜態(tài)調(diào)度的方式完成任務(wù)指派[3]。

● 指令集完全相同

此類設(shè)計中,設(shè)計者選取具有相同指令集但硬件配置上有所不同的處理器核,組成異構(gòu)多核系統(tǒng)[2]。

● 指令集部分相同

此類設(shè)計中,處理核心是一組可配置處理器,所有的處理核心具有一個公共的指令集,每個核心都可以根據(jù)應(yīng)用增加一些擴展指令,以增強對應(yīng)用某一方面的處理能力[4]。

2.2. 新模型的數(shù)學(xué)描述

本文提出的調(diào)度模型即針對基于可配置處理器的異構(gòu)多核。該模型成立基于以下假設(shè),每個核的指令集配置完成于芯片設(shè)計階段,芯片一旦生產(chǎn),任意一個核的指令集配置都不可修改。實際上,動態(tài)可配置指令集對芯片面積及功耗都會帶來巨大消耗,因此現(xiàn)在市場上絕大部分可配置處理器都符合上述假設(shè)。為描述簡單起見,下文中一個處理器核被稱為core。

首先定義模型中使用的三個集合。

集合 C= {Xi|Xi是系統(tǒng)中某個core}

集合 I={Yi|Yi是系統(tǒng)中某種指令集}

集合 T={Zi|Zi是系統(tǒng)中某個線程}

對于上述集合,存在映射關(guān)系

f :C→∪Ii,Ii.I且Ii≠φ,即任意一個core必然存在一個I的非空子集Im與之對應(yīng),其實際意義表示該core可以運行集合Im所包含的指令。根據(jù)模型的成立條件,core的指令集在系統(tǒng)運行時不可修改,因此不同core對應(yīng)的Im可能相同,但是每個core僅對應(yīng)一個Im,故f是單射,即XIi∈C,Im.I,且Im ≠φ,f(Xi)=Im (式1)類似的。

還存在映射關(guān)系g:T→∪Ii,Ii.I且Ii≠φ,即任意一個線程必然存在一個I的非空子集In與之對應(yīng),其實際意義表示該線程必須運行在具有指令集In 的處理器上。任意一個時刻每個線程僅有一個In與之對應(yīng),此外不同的線程對應(yīng)的In可能相同,故g也是單射,即Zi∈T,In.I,且In≠φ,g(Zi)=In (式2)根據(jù)上述公式,對任意的Xi,可以得到一個Im,任意的Zi,可以得到一個In,則公式(3)成立。

這是模型中的調(diào)度函數(shù),當(dāng)線程所需指令集是core指令集的子集,match(Im,In)值為1,表示線程Zi可以運行在處理器核Xi上。

3. 模型實現(xiàn)

上述模型可以有多種實現(xiàn)方式,本文參考位圖的思想完成其中一種實現(xiàn)。

3.1. 三個集合的確定

考慮常用多核規(guī)模,32 種指令集已可滿足指令集種類數(shù)量要求,因此該實現(xiàn)將無符號二進制32位整數(shù)的每一位對應(yīng)一種指令集,其最低有效位為20,記為ISA1,最高有效位為231,記為ISA32,若可以運行指令集ISAm,則該無符號整數(shù)的第m位為1,故集合I在基于位圖的實現(xiàn)中定義為I={ISAm無符號整數(shù)第m-1位為1,1≤m≤32}。

任意I中幾個元素,對其依次做或運算(OR)得到一個新整數(shù),該整數(shù)即可表示由這幾個元素構(gòu)成的I的子集。系統(tǒng)中所有的core具有公共指令集,將此指令集記為ISA1。

系統(tǒng)中每個core具有一個唯一編號,因此集合C= {0, 1, ……, n.1},n為系統(tǒng)中core的數(shù)量。

此外,根據(jù)線程的定義,不同的線程不能具有相同的線程句柄,因此T={所有線程句柄}。

3.2. 三個公式的實現(xiàn)

定義一個二維的無符號整數(shù)數(shù)組cpu_isa_map,數(shù)組每行第一個元素為core的編號,第二個元素為I的一個非空子集,表示該core可以運行的所有指令集,最后一行用于循環(huán)結(jié)束,第一個元素為無窮大(0xFFFFFFFF),第二個元素為空集。以core的編號對該數(shù)組遍歷查詢即可實現(xiàn)公式1。圖1為該數(shù)組的一個例子。

POSIX線程標(biāo)準(zhǔn)中,每個線程具有pthread_attr_t結(jié)構(gòu)體類型的屬性參數(shù),為了兼容POSIX標(biāo)準(zhǔn),擴展該結(jié)構(gòu)體,添加一個無符號整數(shù)變量runnable_isa,表示該線程可以運行的指令集集合。創(chuàng)建線程時需要顯示設(shè)置runnable_isa,如果沒有設(shè)置,該變量默認(rèn)值為公共指令集ISA1,這樣就實現(xiàn)了公式2。

對于公式3,首先根據(jù)調(diào)度器當(dāng)前運行的core編號查詢cpu_isa_map獲得core支持的指令集core_isa,然后遍歷線程調(diào)度器的就緒線程隊列,將每個線程的runnable_isa屬性與core_isa做與操作(AND),若結(jié)果不為0且runnable小于等于core_isa,則說明該core的指令集配置滿足線程所需的運行要求。

即match(Im,In)為1,線程可以被運行,如果所有線程均無法運行在該核上,則返回空指針。圖2為此算法實現(xiàn),其中HEAD(state)為獲得就緒線程隊列的頭指針,該隊列尾指針的next指針為空指針。至此,模型已經(jīng)全部實現(xiàn)完畢。

4. 實驗結(jié)果

本文使用基于Xtensa處理器組成的異構(gòu)多核系統(tǒng),以Motion-JPEG作為測試程序?qū)υ撃P瓦M行實驗分析。

4.1. 實驗平臺簡介

Xtensa處理器是Tensilica公司推出的一種可配置處理器,該處理器除了具有一組固定的指令集之外,還可以通過TIE功能擴展指令集以加速程序運行。Tensilica公司提供了該處理器基于SystemC的仿真模型。本文的實驗平臺是由3個Xtensa處理器仿真模型組成的異構(gòu)多核系統(tǒng),分別記為core0,core1,core2。

本文節(jié)選自:中國集成電路

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19445

    瀏覽量

    231335
  • 仿真模型
    +關(guān)注

    關(guān)注

    1

    文章

    28

    瀏覽量

    12341
  • 多核處理器
    +關(guān)注

    關(guān)注

    0

    文章

    109

    瀏覽量

    19994
收藏 人收藏

    評論

    相關(guān)推薦

    QorIQ?T1042多核處理器

    QorIQ?T1042多核處理器T1042 QorIQ高級多核處理器綜合了數(shù)據(jù)網(wǎng)絡(luò)、電信/數(shù)據(jù)通訊、無線網(wǎng)絡(luò)基礎(chǔ)設(shè)施和國防軍事/航天工程應(yīng)用所需要的性能卓越數(shù)據(jù)線路加速及網(wǎng)絡(luò)和外圍總線
    發(fā)表于 01-10 08:48

    基于全志T113-i多核異構(gòu)處理器的全國產(chǎn)嵌入式核心板簡介

    、嵌入式核心板產(chǎn)品介紹 基于全志公司的T113-i處理器精心設(shè)計的多核異構(gòu)處理器、工業(yè)ECK
    的頭像 發(fā)表于 10-25 13:40 ?528次閱讀

    一種簡單高效配置FPGA的方法

    本文描述了一種簡單高效配置FPGA的方法,該方法利用微處理器從串行外圍接口(SPI)閃存配置FPGA設(shè)備。這種方法減少了硬件組件、板空間和成本。
    的頭像 發(fā)表于 10-24 14:57 ?842次閱讀
    <b class='flag-5'>一種</b>簡單高效<b class='flag-5'>配置</b>FPGA的方法

    ai模型訓(xùn)練需要什么配置

    較小的數(shù)據(jù)集和簡單的計算任務(wù),如數(shù)據(jù)預(yù)處理、模型評估等。因此,選擇款高性能的CPU對于提高AI模型訓(xùn)練的整體效率至關(guān)重要。 推薦選擇Intel Core i7或更高性能的
    的頭像 發(fā)表于 10-17 18:10 ?2087次閱讀

    【米爾NXP i.MX 93開發(fā)板試用評測】1、異構(gòu)核心通信的技術(shù)內(nèi)容

    前言 很多異構(gòu)核心使用的是標(biāo)準(zhǔn)的OpenAMP,OpenAMP(Open Asymmetric Multi-Processing)是個開源的軟件框架,用于在異構(gòu)多核
    發(fā)表于 09-21 20:24

    淺談國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應(yīng)用場景

    傳統(tǒng)的ASIC(專用集成電路)設(shè)計,F(xiàn)PGA的靈活性使得其開發(fā)成本更低,且能夠快速響應(yīng)市場變化。RISC-V的開源特性也進步降低了開發(fā)成本。 安全性與可靠性 : 異構(gòu)處理器可以通過硬件隔離等
    發(fā)表于 08-31 08:32

    復(fù)旦微PS+PL異構(gòu)多核開發(fā)案例分享,基于FMQL20SM國產(chǎn)處理器平臺

    FMQL20S400M是復(fù)旦微四核ARM Cortex-A7@1GHz(PS端)+85K可編程邏輯資源(PL端)異構(gòu)多核SoC處理器。創(chuàng)龍科技基于FMQL20S400M設(shè)計的工業(yè)核心板
    發(fā)表于 08-22 14:04

    文解析嵌入式多核異構(gòu)方案,東勝物聯(lián)RK3588多核異構(gòu)核心板系列

    嵌入式人工智能快速發(fā)展,對于高性能計算需求越來越大。為了解決性能與功耗的平衡、通過并行化加速計算等,越來越多地嵌入式處理器使用同構(gòu)多核、異構(gòu)多核和協(xié)
    的頭像 發(fā)表于 06-17 15:45 ?2436次閱讀
    <b class='flag-5'>一</b>文解析嵌入式<b class='flag-5'>多核</b><b class='flag-5'>異構(gòu)</b>方案,東勝物聯(lián)RK3588<b class='flag-5'>多核</b><b class='flag-5'>異構(gòu)</b>核心板系列<b class='flag-5'>一</b>覽

    dsp是嵌入式微處理器一種設(shè)備嗎 ARM嵌入式微處理器有何特點?

    DSP(Digital Signal Processor)不是一種嵌入式微處理器的設(shè)備。DSP是一種專門用于數(shù)字信號處理的微處理器,它具有高
    的頭像 發(fā)表于 04-21 09:37 ?1107次閱讀

    多核異構(gòu)通信框架(RPMsg-Lite)

    ,還優(yōu)化了能耗,為眾多領(lǐng)域帶來了革命性的變革。 異構(gòu)多核系統(tǒng)是指在個芯片上集成多種不同類型的處理器核心,這些核心可能采用不同的指令集架構(gòu)(ISA),具備不同的性能特性和功耗要求。這些
    的頭像 發(fā)表于 03-08 18:20 ?6123次閱讀
    <b class='flag-5'>多核</b><b class='flag-5'>異構(gòu)</b>通信框架(RPMsg-Lite)

    用于多核處理器可配置多軌PMU TPS650860數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《用于多核處理器可配置多軌PMU TPS650860數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 03-07 14:00 ?0次下載
    用于<b class='flag-5'>多核</b><b class='flag-5'>處理器</b>的<b class='flag-5'>可配置</b>多軌PMU TPS650860數(shù)據(jù)表

    TPS650864可配置多軌PMU適用于多核處理器、FPGA和系統(tǒng)的TPS650861可配置多軌PMU數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TPS650864可配置多軌PMU適用于多核處理器、FPGA和系統(tǒng)的TPS650861可配置多軌PMU數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 03-07 09:06 ?0次下載
    TPS650864<b class='flag-5'>可配置</b>多軌PMU適用于<b class='flag-5'>多核</b><b class='flag-5'>處理器</b>、FPGA和系統(tǒng)的TPS650861<b class='flag-5'>可配置</b>多軌PMU數(shù)據(jù)表

    介紹一種基于核集的多核嵌入式實時調(diào)度方法

    在多任務(wù)環(huán)境下,嵌入式系統(tǒng)中通常運行著多于處理機數(shù)目的任務(wù),這就要求操作系統(tǒng)能夠按照某種算法為處于就緒狀態(tài)的任務(wù)動態(tài)地分配處理機,處理調(diào)度
    的頭像 發(fā)表于 03-05 11:31 ?986次閱讀
    介紹<b class='flag-5'>一種</b>基于核集的<b class='flag-5'>多核</b>嵌入式實時<b class='flag-5'>調(diào)度</b>方法

    什么是動態(tài)線程池?動態(tài)線程池的簡單實現(xiàn)思路

    因此,動態(tài)可監(jiān)控線程一種針對以上痛點開發(fā)的線程池管理工具。主要可實現(xiàn)功能有:提供對 Spring 應(yīng)用內(nèi)線程池實例的全局管控、應(yīng)用運行時
    的頭像 發(fā)表于 02-28 10:42 ?736次閱讀

    什么是多核線程多核線程如何提高程序的運行效率?

    線程無法充分利用多核處理器的并行計算能力。
    的頭像 發(fā)表于 02-20 10:22 ?1513次閱讀