FMS2018已經(jīng)過(guò)去了,但是閃存的熱度并沒(méi)有消退。NVMe組織在FMS2018上通過(guò)8個(gè)演講對(duì)NVMe、NVMe-oF、NVMe-MI、JBOF以及NVMe基準(zhǔn)測(cè)試等話題進(jìn)行了介紹。在其官網(wǎng)上有這次演講的PPT(據(jù)說(shuō)視頻也會(huì)更新上來(lái))。接下來(lái)通過(guò)NVMe 組織在FMS2018上的主旨演講看下未來(lái)一年NVMe的演進(jìn)重點(diǎn)。
NVMe協(xié)議族的路線圖(點(diǎn)擊看大圖,下同)
從上圖可以看到當(dāng)前NVMe一些主要的特性和下一步將要做的重點(diǎn)。這篇文章就說(shuō)NVMe 1.4的兩大更新。NVMe官網(wǎng)最新的一版NVMe標(biāo)準(zhǔn)是1.3c,發(fā)布于2018年5月24日。而今年第四季度以及2019年,NVMe1.4版本將是NVMe標(biāo)準(zhǔn)化組織工作重點(diǎn),此次更新的重點(diǎn)包括IO Determinism、PMR以及多路徑訪問(wèn)共享命名空間。
關(guān)于命名空間(namespace)
命名空間(namespace)是NVMe協(xié)議中一個(gè)基本的邏輯空間的概念,簡(jiǎn)單地說(shuō)命名空間將NVMe SSD的用戶空間進(jìn)行邏輯劃分,每個(gè)命名空間擁有自身的NAND,可以獨(dú)立的進(jìn)行格式化和加密等操作。
IO Determinism:NVMe這樣提高QoS
NVMe協(xié)議將在1.4版中通過(guò)定義IO Determinism,實(shí)現(xiàn)對(duì)SSD的物理介質(zhì)資源精細(xì)化管理和控制。在沒(méi)有IO Determinism時(shí),多個(gè)APP由1個(gè)SSD承載,雖然多個(gè)APP訪問(wèn)不同的namespace,但是不同namespace是共享底層channel和Die的。
IO Determinism應(yīng)用前后負(fù)載訪問(wèn)盤(pán)的變化(這張圖也是下圖測(cè)試結(jié)果的一個(gè)測(cè)試方案)
有了IO Determinism之后,NVMe協(xié)議可以將整塊SSD的物理空間劃分為多個(gè)NVM Set,每個(gè)NVM Set可以包含1到多個(gè)Channel和Die,不同的NVM Set的擦除、讀寫(xiě)都是相互獨(dú)立的,最終不同的Set供不同的App使用(如上圖中右側(cè))。如此一來(lái),應(yīng)用之間不會(huì)互相干擾,性能和延遲也可以得到更好的保障。Facebook在FMS2018上發(fā)布了關(guān)于NVMe SSD實(shí)現(xiàn) IO Determinism詳細(xì)的測(cè)試結(jié)果,如下圖:
Facebook對(duì)IO Determinism應(yīng)用后的測(cè)試結(jié)果
從上圖Facebook對(duì)IO Determinism的測(cè)試結(jié)果可以看出,讀延遲QoS在IO Determinism應(yīng)用后有了8倍的提升(具體的測(cè)試說(shuō)明可以參看相關(guān)閱讀中Facebook在FMS2018上的演講PPT)。此外,如今NVMe SSD單盤(pán)容量不斷提升(Memblaze的PBlaze5 910/916可以做到15.36TB),IO Determinism將一塊大盤(pán)分為多個(gè)“小盤(pán)”,供上層多個(gè)應(yīng)用使用,提高了資源的利用率。
NVMe多路徑訪問(wèn)共享命名空間
NVMe多路徑訪問(wèn)共享命名空間的意思是單個(gè)或多個(gè)主機(jī)可以通過(guò)不同的NVMe Controler訪問(wèn)同一個(gè)Namespace。下圖是一個(gè)基本的原理。
這一特性會(huì)影響到未來(lái)閃存陣列等存儲(chǔ)系統(tǒng)的設(shè)計(jì)。當(dāng)前高可用的NVMe存儲(chǔ)系統(tǒng)多使用雙端口NVMe SSD,并采用如下方案實(shí)現(xiàn):
NVMe1.4以后有了多路經(jīng)訪問(wèn)特性,高可用的存儲(chǔ)系統(tǒng)就可以結(jié)合NVMe SSD的雙端口實(shí)現(xiàn)下圖這樣的高可用方案。每一個(gè)Contorller都可以看到NVMe SSD一個(gè)Port的兩條路徑,這需要NVMe SSD支持多路經(jīng)功能。
這與SAS時(shí)代實(shí)現(xiàn)高可用系統(tǒng)的理念類似,只是從Switch到盤(pán)的性能都有了質(zhì)的提升。JBOD也升級(jí)到了JBOF/FBOF。業(yè)務(wù)連續(xù)和數(shù)據(jù)的完整性是企業(yè)客戶對(duì)存儲(chǔ)系統(tǒng)的重要訴求,要打造高可用方案,Memblaze在雙端口的研發(fā)上已經(jīng)有諸多積累,相關(guān)的討論和技術(shù)解讀可以看文末關(guān)于雙端口的文章。
最后,NVMe協(xié)議還有NVMe-MI和NVMe-oF兩個(gè)重要的分支,分別定義了NVMe SSD管理命令和網(wǎng)絡(luò)層面的規(guī)范。未來(lái)這兩個(gè)分支也會(huì)有所演進(jìn),NVMe-MI將允許應(yīng)用通過(guò)In-Band方式向NVMe 子系統(tǒng)(一般為NVMe SSD或者多塊NVMe SSD組成的組)發(fā)送NVMe-MI Send和NVMe-MI Receive兩個(gè)新的命令,獲取子系統(tǒng)的基本信息。這些信息之前多由BMC系統(tǒng)獲取。這一新的特性提高了應(yīng)用獲取底層SSD狀態(tài)信息的能力,可以更高效的感知NVMe 子系統(tǒng)的健康狀態(tài)。
NVMe-oF也會(huì)開(kāi)始支持NVMe Over TCP,這部分內(nèi)容將在后續(xù)的文章中進(jìn)行詳細(xì)的闡述。
-
SSD
+關(guān)注
關(guān)注
21文章
2893瀏覽量
117904 -
nvme
+關(guān)注
關(guān)注
0文章
222瀏覽量
22740
原文標(biāo)題:NVMe 1.4:你需要知道的兩個(gè)重點(diǎn)技術(shù)
文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論