本文選自極術(shù)專欄“IC設(shè)計(jì)”,作者芯工阿文,授權(quán)轉(zhuǎn)自微信公眾號(hào)芯工阿文,本篇主要講述對(duì)DMA的理解和認(rèn)識(shí)。
這些天有個(gè)想法,在數(shù)字芯片設(shè)計(jì)中,很多模塊都可以近似為DMA模型,包括CPU?;谠撓敕ㄟM(jìn)行擴(kuò)展,一些復(fù)雜的模塊可以變得稍微容易理解。
首先描述一下什么是DMA,Direct Memory Access,字面意思就是直接內(nèi)存訪問(wèn)。個(gè)人認(rèn)為這個(gè)名詞應(yīng)該是從軟件視角進(jìn)行定義的。實(shí)際上,DMA完成的工作,無(wú)非就是從一個(gè)接口讀取數(shù)據(jù),再發(fā)送至另外一個(gè)接口,也就是對(duì)應(yīng)著一讀一寫。從硬件角度來(lái)看,這個(gè)是很常規(guī)的操作,但在軟件看來(lái),可以將大量的操作卸載到DMA,從而將CPU釋放出來(lái)做更多的事情。所以DMA實(shí)際完成的工作也就是數(shù)據(jù)的轉(zhuǎn)移,基于轉(zhuǎn)移的兩個(gè)方向之間的差異和特征,從而帶來(lái)各種收益。
數(shù)據(jù)轉(zhuǎn)移,簡(jiǎn)單來(lái)說(shuō)有3個(gè)要素,源地址、目的地址和數(shù)據(jù)長(zhǎng)度。一般來(lái)說(shuō),DMA的實(shí)現(xiàn)有兩種方式,一是Direct DMA,另一個(gè)是鏈表DMA。Direct DMA就是通過(guò)寄存器讀寫的方式直接配置上述的3個(gè)要素;鏈表DMA就是將保存上述3要素的描述符存放于內(nèi)存,再將其地址信息配置至DMA,啟動(dòng)DMA后,解析描述符后做數(shù)據(jù)轉(zhuǎn)移。
鏈表DMA的處理流程近似如下:
1)根據(jù)配置信息啟動(dòng)描述符讀取操作,解析描述符;
2)基于描述信息,獲取源地址和數(shù)據(jù)長(zhǎng)度,啟動(dòng)數(shù)據(jù)讀取操作;
3)讀取數(shù)據(jù)返回后,再將數(shù)據(jù)發(fā)送至目的地址,完成后告知狀態(tài)。
以此進(jìn)行擴(kuò)展,比如讀取數(shù)據(jù)返回后,做各種運(yùn)算,再將結(jié)果發(fā)送至目的地址,不少加速計(jì)算模塊均是基于該思路進(jìn)行處理的。再比如描述符讀取做一些處理,支持多樣化的描述符,或者描述符再嵌套描述符,等等。
個(gè)人認(rèn)為,在SOC芯片內(nèi)的幾乎所有計(jì)算模塊,均可以基于DMA的模型進(jìn)行理解,再以此進(jìn)行擴(kuò)展開發(fā),包括CPU。
再來(lái)看一下CPU是如何工作的,沒(méi)有深入了解CPU的結(jié)構(gòu),僅僅知道大概,如有錯(cuò)誤,請(qǐng)輕噴。首先,CPU基于起始地址,從該地址讀取指令,再執(zhí)行。一般來(lái)說(shuō),執(zhí)行指令會(huì)伴隨著數(shù)據(jù)讀取,也就是LOAD,將數(shù)據(jù)搬運(yùn)過(guò)來(lái)之后,再對(duì)數(shù)據(jù)做各種運(yùn)算,完成后再將數(shù)據(jù)放回去,對(duì)應(yīng)著STORE。這個(gè)過(guò)程是否跟DMA搬運(yùn)數(shù)據(jù)非常類似?如下是對(duì)應(yīng)關(guān)系。
圖1
兩者之間有非常近似的對(duì)應(yīng)關(guān)系,基本原理是一樣的,只是在具體實(shí)現(xiàn)過(guò)程中,存在較大的差異。如描述符,對(duì)于DMA,僅有有限的幾個(gè)格式,不同實(shí)現(xiàn)有不同的指令格式,對(duì)于CPU,指令集就相當(dāng)于描述符,類型很多,不同架構(gòu)有不同的指令集,由此也會(huì)引入很多問(wèn)題,其復(fù)雜度是DMA的很多很多倍,如CPU需要Cache,但是從沒(méi)聽說(shuō)過(guò)DMA需要使用Cache。
還有一個(gè)明顯差別,CPU有計(jì)算邏輯ALU,通常來(lái)說(shuō),DMA將數(shù)據(jù)從源地址搬回來(lái)后,就直接寫到目的地址。這里再換個(gè)思路,如果在這兩者中間,加入一點(diǎn)計(jì)算邏輯,比如壓縮解壓縮、編解碼等等,是否與很多硬件加速器的架構(gòu)基本是一致的?
可以看到,CPU和DMA之間,差不多就是兩個(gè)極端。CPU是屬于general purpose,DMA是目的性非常強(qiáng)的設(shè)計(jì)。在這中間取一個(gè)點(diǎn),是否就可以對(duì)應(yīng)GPU、AI、DSA等等場(chǎng)景?
前一段時(shí)間想做點(diǎn)事情,設(shè)計(jì)一個(gè)DMA,但在數(shù)據(jù)讀取和寫入之間開放一個(gè)接口,在這接口之內(nèi)做一些計(jì)算邏輯,以此針對(duì)各種具體的數(shù)據(jù)計(jì)算場(chǎng)景,基于需求進(jìn)行設(shè)計(jì)。也就是說(shuō),將這個(gè)DMA作為一個(gè)平臺(tái),基于該平臺(tái)做后續(xù)的二次開發(fā)。但是,在梳理上述的概念之后,發(fā)現(xiàn)其實(shí)現(xiàn)在已經(jīng)有類似的東西,也就是RISC-V。該指令集是完全開放的,當(dāng)前也有各種各樣的開源代碼,有Verilog實(shí)現(xiàn)的,還有chisel,也有spinalHDL,完全可以基于這些代碼做針對(duì)需求場(chǎng)景的二次開發(fā),而且可以從更小的數(shù)據(jù)粒度進(jìn)行操控。
-
cpu
+關(guān)注
關(guān)注
68文章
10911瀏覽量
213150 -
接口
+關(guān)注
關(guān)注
33文章
8718瀏覽量
152027 -
IC設(shè)計(jì)
+關(guān)注
關(guān)注
38文章
1302瀏覽量
104327 -
dma
+關(guān)注
關(guān)注
3文章
566瀏覽量
101028 -
數(shù)字芯片
+關(guān)注
關(guān)注
1文章
110瀏覽量
18485
原文標(biāo)題:把DMA當(dāng)作一個(gè)模型
文章出處:【微信號(hào):Ithingedu,微信公眾號(hào):安芯教育科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論