在CPU+GPU協(xié)同計算中,CPU和GPU的計算能力不同,靜態(tài)地給CPU和GPU劃分任務會導致CPU和GPU計算不同步,導致嚴重的負載不均衡,為了實現(xiàn)CPU和GPU的負載均衡,需要對CPU和GPU不同的劃分方法。把每個節(jié)點上的所有CPU看成一個設(shè)備,每塊GPU卡看成一個設(shè)備,對集群節(jié)點上的所有CPU設(shè)備和GPU設(shè)備分別編號,每個節(jié)點上有M塊GPU卡,N個節(jié)點上共有N個CPU設(shè)備,編號為1,2,…,N;N個節(jié)點上共有M*N個GPU設(shè)備,編號為1,2,…,M*N。
設(shè)備編號之后就可以對設(shè)備進行分組,根據(jù)算法的要求,有些任務不能細分,一個CPU設(shè)備或GPU設(shè)備上可用的內(nèi)存空間可能不能滿足計算的內(nèi)存要求,需要多設(shè)備數(shù)據(jù)劃分、共同計算,這時需要根據(jù)CPU內(nèi)存或GPU內(nèi)存進行分組
1)根據(jù)CPU內(nèi)存大小和計算對內(nèi)存的要求可以計算得到一組內(nèi)的CPU設(shè)備數(shù)目為GC個, GC=(Mcom+MemC-1)/MemC,其中一個節(jié)點的內(nèi)存大小為MemC,每個計算任務需要的內(nèi)存大小為Mcom。
所有的CPU設(shè)備分為N/GC個組,每個組計算同一個任務,組內(nèi)的CPU設(shè)備再進行數(shù)據(jù)劃分,數(shù)據(jù)劃分采用靜態(tài)的劃分,因為組內(nèi)的CPU設(shè)備計算能力一致;
2)根據(jù)GPU內(nèi)存大小和計算對內(nèi)存的要求可以計算得到一組內(nèi)的GPU設(shè)備數(shù)目為GG個, GG=(Mcom+MemG-1)/Mem,其中,一個GPU設(shè)備的內(nèi)存大小為MemG,每個計算任務需要的內(nèi)存大小為Mcom。
所有的GPU設(shè)備分為M*N/GG個組,每個組計算同一個任務,組內(nèi)的GPU設(shè)備再進行數(shù)據(jù)劃分,數(shù)據(jù)劃分采用靜態(tài)劃分的方法。
CPU和GPU設(shè)備分組之后,就可以把任務動態(tài)分劃分給每個CPU組或GPU組,可以采用MPI通信進行劃分,由主進程進行動態(tài)的發(fā)送任務編號給各個CPU組或GPU組內(nèi)的組長,組長再把任務編號廣播給組內(nèi)的組員,然后組內(nèi)的設(shè)備同時計算,計算完畢之后即可向主進程請求下一個任務,直到所有任務計算完畢為止。
-
cpu
+關(guān)注
關(guān)注
68文章
10908瀏覽量
213086 -
gpu
+關(guān)注
關(guān)注
28文章
4783瀏覽量
129382
原文標題:CPU+GPU集群計算中的一種動態(tài)負載均衡設(shè)計方法
文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
虛擬內(nèi)存不足如何解決 虛擬內(nèi)存和物理內(nèi)存的區(qū)別
DDR內(nèi)存頻率對性能的影響
RAM內(nèi)存不足的表現(xiàn)及解決方法
北橋芯片負責與cpu的聯(lián)系并控制內(nèi)存嗎
Windows管理內(nèi)存的三種主要方式
前端總線與內(nèi)存頻率怎么配
C2000 CPU內(nèi)存內(nèi)置自檢功能
![C2000 <b class='flag-5'>CPU</b><b class='flag-5'>內(nèi)存</b>內(nèi)置自檢功能](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
內(nèi)存控制器概述和工作原理
反射內(nèi)存卡與普通內(nèi)存卡的區(qū)別
![反射<b class='flag-5'>內(nèi)存</b>卡與普通<b class='flag-5'>內(nèi)存</b>卡的區(qū)別](https://file1.elecfans.com/web2/M00/05/2E/wKgZombXxOCAL0l9AABV3vfn4XY577.png)
主板內(nèi)存故障燈亮會是cpu的問題嗎
主板自檢cpu和內(nèi)存燈一直來回閃
HarmonyOS實戰(zhàn)開發(fā)-內(nèi)存快照Snapshot Profiler功能使用指導
CW32L052 DMA直接內(nèi)存訪問
![CW32L052 DMA直接<b class='flag-5'>內(nèi)存</b>訪問](https://file1.elecfans.com/web2/M00/C2/BE/wKgaomXe1U2AeokOAATX2KVj3HM981.png#pic_center)
評論