存儲廠商N(yùn)GD Systems公司副總裁Scott Shadley在一次專題訪談中,探討了SNIA計(jì)算存儲(CS)工作組自成立以來的技術(shù)進(jìn)步。Scott Shadley除了擔(dān)任NGD Systems副總裁的職位外,Scott還是存儲網(wǎng)絡(luò)行業(yè)協(xié)會(SNIA)的董事會成員。
標(biāo)準(zhǔn)組織推出的新技術(shù)獲得“官方定義”并不多見。但要獲得這樣的“定義”,這項(xiàng)技術(shù)需要相當(dāng)大的突破。因此,希望正式引入計(jì)算存儲(CS)——這是一種淘汰傳統(tǒng)計(jì)算機(jī)存儲技術(shù)的存儲架構(gòu),以提供一種更快、更經(jīng)濟(jì)、更省電的方式來存儲和分析PB字節(jié)的數(shù)據(jù)。
企業(yè)存儲的發(fā)展
簡而言之,計(jì)算存儲是一種IT架構(gòu),其中數(shù)據(jù)在存儲設(shè)備級別進(jìn)行處理,以減少必須在存儲和計(jì)算平臺之間移動的數(shù)據(jù)量。因此,該技術(shù)提供了一種更快、更高效的方法來應(yīng)對數(shù)據(jù)密集型世界的獨(dú)特挑戰(zhàn),通過減少數(shù)據(jù)移動和允許對分析的響應(yīng)速度高達(dá)20到40倍來滿足減少的多余帶寬,并提供非常低的延遲響應(yīng)時(shí)間。
如果考慮一下企業(yè)存儲的發(fā)展歷史,計(jì)算存儲的發(fā)展速度是適當(dāng)?shù)?。得益于NVMe和NVMe Over Fabrics輔助的新閃存技術(shù),該技術(shù)的發(fā)展越來越快。當(dāng)今的數(shù)據(jù)中心(包括超大規(guī)模數(shù)據(jù)中心)主要依賴于使用馮·諾依曼體系結(jié)構(gòu)的基本方法構(gòu)建的傳統(tǒng)服務(wù)器硬件,馮·諾依曼體系結(jié)構(gòu)適用于幾乎所有通用服務(wù)器,是具有70年歷史的計(jì)算機(jī)體系結(jié)構(gòu),坦率地說,這種體系結(jié)構(gòu)多年來從未經(jīng)歷過太多的變化。
而一些新方法并沒有取得太大的成功?,F(xiàn)在有了諸如人工智能和機(jī)器學(xué)習(xí)之類的應(yīng)用程序,這些應(yīng)用程序需要大量的原始數(shù)據(jù)(結(jié)構(gòu)化和非結(jié)構(gòu)化),這些數(shù)據(jù)需要高計(jì)算能力來“學(xué)習(xí)”,因此計(jì)算能力已成為瓶頸。在傳統(tǒng)的橫向擴(kuò)展模型中,此問題通過添加節(jié)點(diǎn)來解決,從而獲得更多的分布式計(jì)算能力和更多的內(nèi)存。不幸的是,從投資成本和運(yùn)營成本角度來看,添加服務(wù)器節(jié)點(diǎn)的成本很高。添加更多節(jié)點(diǎn)還增加了互連的長度,從而增加了數(shù)據(jù)移動和分析所需的時(shí)間。
計(jì)算存儲這種技術(shù)可以將傳感器(例如自動駕駛汽車、視頻監(jiān)控?cái)z像頭、交通信號燈)中的原始信息巧妙地組織為有意義的數(shù)據(jù),因?yàn)槿狈σ苿有钥梢源龠M(jìn)實(shí)時(shí)數(shù)據(jù)分析,從而通過減少輸入來提高性能/輸出瓶頸。隨著人工智能、機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)工作負(fù)載涌現(xiàn)出驚人的數(shù)據(jù)量(IDC公司的研究表明,到2025年,數(shù)據(jù)總量將超過163 ZB,其中95%是由物聯(lián)網(wǎng)設(shè)備生成的),這項(xiàng)新技術(shù)是真正缺失的環(huán)節(jié)。
調(diào)研機(jī)構(gòu)Dimensional Research公司最近對300多位計(jì)算機(jī)存儲專業(yè)人員進(jìn)行的一項(xiàng)調(diào)查揭示了這一挑戰(zhàn),表明存儲瓶頸可能發(fā)生在10 TB以下。這樣,計(jì)算存儲可以提供更強(qiáng)大的處理能力來輔助每個(gè)主機(jī)CPU,從而使組織可以提取其可以生成的所有數(shù)據(jù),并僅提供真正需要的數(shù)據(jù),從而使“管道”盡可能保持開放。這樣一來,就可以收集更多分析所需的原始數(shù)據(jù),并為組織提供僅從該數(shù)據(jù)中提取實(shí)現(xiàn)價(jià)值所需的自由。在比較中,當(dāng)組織必須處理整個(gè)數(shù)據(jù)集時(shí),就會延誤增值。這種方法可最大程度地提高效率,減少功耗,并降低運(yùn)營成本。這種“分類、轉(zhuǎn)換、發(fā)送”方法使快速、全面和有意義的實(shí)時(shí)數(shù)據(jù)應(yīng)用成為可能。
計(jì)算存儲的官方定義只花了一年時(shí)間就制定出來了,這是一個(gè)相當(dāng)迅速的過程,證明了對這種截然不同的計(jì)算機(jī)存儲技術(shù)的迫切需求。一年多前,存儲網(wǎng)絡(luò)行業(yè)協(xié)會(SNIA)召開會議,研究如何圍繞計(jì)算存儲技術(shù)定義和制定標(biāo)準(zhǔn)。SNIA是一個(gè)非盈利組織,由198家信息技術(shù)領(lǐng)域的成員公司組成。經(jīng)過幾個(gè)月的會議和一些辯論,他們現(xiàn)在已經(jīng)制定了官方定義:
?“計(jì)算存儲體系結(jié)構(gòu)可通過集成計(jì)算資源(直接與存儲、存儲附近或主機(jī)與存儲之間)集成來提高應(yīng)用程序性能和/或基礎(chǔ)設(shè)施效率。這些計(jì)算資源不在傳統(tǒng)的計(jì)算和內(nèi)存體系結(jié)構(gòu)之外。
?這些體系結(jié)構(gòu)的目標(biāo)是:啟用并行計(jì)算;減少I/O流量;減輕對現(xiàn)有計(jì)算、內(nèi)存、存儲和I/O的其他限制。”
受益于計(jì)算存儲的行業(yè)
當(dāng)將計(jì)算存儲應(yīng)用于多個(gè)用例時(shí),將變得更易于理解。要求計(jì)算存儲技術(shù)強(qiáng)大和高效的行業(yè)示例是新型“智能”汽車和即將推出的全自動駕駛汽車,這些汽車必須處理數(shù)據(jù)負(fù)載(每天高達(dá)28TB)以進(jìn)行分析,否則可能會影響駕駛員的安全性。一些設(shè)計(jì)計(jì)算存儲架構(gòu)的公司已經(jīng)能夠提供利用小型化技術(shù)的技術(shù),該技術(shù)可以與SSD硬盤一起使用來處理數(shù)據(jù)負(fù)載。這在空間受限的邊緣相關(guān)(例如汽車)中效果很好。但是,盡管外形尺寸很大,計(jì)算存儲解決方案仍可以將功能提高20倍甚至更多,并且使支持人工智能的系統(tǒng)能夠以前所未有的方式讀取和分析數(shù)據(jù)。
在數(shù)以千計(jì)的物理服務(wù)器和數(shù)百萬個(gè)虛擬機(jī)上運(yùn)行的超大規(guī)模數(shù)據(jù)中心(例如AWS的數(shù)據(jù)中心基礎(chǔ)設(shè)施)必須并行執(zhí)行各種工作負(fù)載。這些超大規(guī)模數(shù)據(jù)中心開始使用計(jì)算存儲驅(qū)動器(CSD)來處理PB級的數(shù)據(jù),同時(shí)也帶來了體積小、功耗低但仍具有巨大計(jì)算能力的更小尺寸的優(yōu)點(diǎn)。這樣,體積小巧但功能強(qiáng)大的計(jì)算存儲驅(qū)動器(CSD)可以幫助提高超大規(guī)模架構(gòu)的計(jì)算能力,這些超大規(guī)模架構(gòu)將機(jī)器用于人工智能(AI)和機(jī)器學(xué)習(xí)(ML)應(yīng)用程序,而這些應(yīng)用程序通常需要諸如實(shí)時(shí)、復(fù)雜和并行索引的操作和模式匹配。
例如,出于欺詐檢測目的而需要實(shí)時(shí)分析大量數(shù)據(jù)以獲取銷售點(diǎn)數(shù)據(jù)的零售企業(yè),也可能會受益于計(jì)算存儲更快的響應(yīng)時(shí)間。Storage Switzerland公司發(fā)布的調(diào)查報(bào)告指出,“這些應(yīng)用程序必須在執(zhí)行分析請求之前掃描大量數(shù)據(jù),以識別與查詢相關(guān)的信息子集。將大量數(shù)據(jù)移出存儲系統(tǒng),跨網(wǎng)絡(luò)并移入主機(jī)內(nèi)存會導(dǎo)致時(shí)間和延遲損失,這是實(shí)時(shí)分析應(yīng)用程序無法承受的。”
內(nèi)容交付網(wǎng)絡(luò)(CDN)是利用計(jì)算存儲技術(shù)的另一個(gè)市場。在這里,該技術(shù)可以幫助進(jìn)行加密/數(shù)字版權(quán)管理(用于驗(yàn)證用戶可以訪問內(nèi)容)。在這種情況下,計(jì)算存儲通過安全地解鎖內(nèi)容而不共享密鑰來提供更好的數(shù)據(jù)管理。這種將每個(gè)服務(wù)器機(jī)架的密鑰匹配提高40倍的能力僅僅是這項(xiàng)工作的開始。
總結(jié)
事實(shí)上,在當(dāng)今數(shù)據(jù)密集的世界中,更少的數(shù)據(jù)移動是至關(guān)重要的。數(shù)據(jù)移動的成本不僅僅是時(shí)間,還有資源,有時(shí)還會浪費(fèi)分析資源?,F(xiàn)在是采取下一步存儲和實(shí)施NVMe計(jì)算存儲驅(qū)動器的時(shí)候了。按照數(shù)據(jù)的步驟進(jìn)行操作,注意在硬盤驅(qū)動器內(nèi)部做了多少工作將節(jié)省數(shù)據(jù)移動時(shí)間,這將提高效率,并減少主機(jī)CPU和內(nèi)存負(fù)載的采用。
責(zé)任編輯:ct
評論