全球的超級(jí)計(jì)算中心都在紛紛利用NVIDIA Quantum InfiniBand網(wǎng)絡(luò)上的NVIDIA BlueField DPU將加速計(jì)算提升到一個(gè)新的水平
在歐洲和美國(guó),HPC開(kāi)發(fā)者正在利用NVIDIA BlueField-2 DPU內(nèi)的Arm核和加速器的強(qiáng)大功能為超級(jí)計(jì)算機(jī)提供強(qiáng)大助力。
美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室(LANL)正在與NVIDIA進(jìn)行一項(xiàng)為期多年的廣泛合作,這項(xiàng)合作旨在將計(jì)算型多物理應(yīng)用的性能提高30倍。
LANL研究人員預(yù)計(jì),使用在NVIDIA Quantum InfiniBand網(wǎng)絡(luò)上運(yùn)行的DPU(數(shù)據(jù)處理器)可顯著提升性能。這將使利用BlueField以及NVIDIA DOCA軟件框架在計(jì)算存儲(chǔ)、模式匹配等領(lǐng)域?qū)崿F(xiàn)技術(shù)創(chuàng)新。
面向DPU的開(kāi)放式API
這些努力還將有助于進(jìn)一步定義OpenSNAPI,任何人都可通過(guò)該應(yīng)用接口來(lái)控制DPU。這是統(tǒng)計(jì)計(jì)算框架( Unified Communication Framework)的一個(gè)項(xiàng)目,Unified Communication Framework是一個(gè)旨在實(shí)現(xiàn)HPC應(yīng)用異構(gòu)計(jì)算的聯(lián)盟,成員包括Arm、IBM、NVIDIA、美國(guó)國(guó)家實(shí)驗(yàn)室和美國(guó)的一些大學(xué)。
LANL已經(jīng)感受到網(wǎng)絡(luò)計(jì)算的強(qiáng)大功能,這要?dú)w功于其創(chuàng)建的DPU賦能的存儲(chǔ)系統(tǒng)。
加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲(chǔ)與DPU和InfiniBand加速器相結(jié)合,可為Linux文件系統(tǒng)的關(guān)鍵性能部分提供加速。它的性能高達(dá)同類(lèi)存儲(chǔ)系統(tǒng)的30倍,并將成為L(zhǎng)ANL基礎(chǔ)架構(gòu)中的關(guān)鍵組件。
一位研究人員在近期的LANL博客中表示:“ABoF讓計(jì)算靠近存儲(chǔ),可更大限度減少數(shù)據(jù)移動(dòng),從而提高仿真和數(shù)據(jù)分析工作流程的效率?!?br />
德克薩斯州打造出云原生超級(jí)計(jì)算平臺(tái)
德克薩斯高級(jí)計(jì)算中心(TACC)近期也開(kāi)始在Dell PowerEdge服務(wù)器中采用BlueField-2。它將在InfiniBand網(wǎng)絡(luò)上使用DPU,使其Lonestar6系統(tǒng)成為云原生超級(jí)計(jì)算的開(kāi)發(fā)平臺(tái)。
TACC的Lonestar6為德州農(nóng)工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多HPC開(kāi)發(fā)者,以及一些研究中心和教職人員提供服務(wù)。
MPI獲得加速
在距TACC東北部1200英里的地方,俄亥俄州立大學(xué)的研究人員展示了DPU如何將一個(gè)HPC熱門(mén)編程模型的運(yùn)行速度提高26%。
他們通過(guò)卸載消息傳遞接口(MPI)的關(guān)鍵部分,加速了P3DFFT,這是一個(gè)用于眾多大規(guī)模HPC仿真的數(shù)學(xué)庫(kù)。
俄亥俄州立大學(xué)計(jì)算機(jī)科學(xué)與工程專(zhuān)業(yè)的教授Dhabaleswar K. (DK) Panda在其帶領(lǐng)的MVAPICH開(kāi)源軟件團(tuán)隊(duì)推動(dòng)DPU工作,他表示:“DPU就像是為忙碌的高管處理工作的助手,它們將成為主流,因?yàn)樗鼈兛梢约铀龠\(yùn)行各種工作負(fù)載?!?br />
HPC中心和云中的DPU
對(duì)于運(yùn)行藥物研發(fā)或飛機(jī)設(shè)計(jì)等HPC仿真應(yīng)用的超級(jí)計(jì)算機(jī)而言,高達(dá)兩位數(shù)的性能加速是驚人的。Panda表示,云服務(wù)可以利用這些加速提高客戶(hù)的生產(chǎn)力,他已收到多個(gè)HPC中心的代碼請(qǐng)求。
Quantum InfiniBand網(wǎng)絡(luò)以及NVIDIA SHARP特性,助力他高效完成工作。
他說(shuō):“其他人還在談?wù)摼W(wǎng)絡(luò)計(jì)算,而InfiniBand已經(jīng)在為它提供支持。”
達(dá)勒姆開(kāi)發(fā)負(fù)載均衡
歐洲的多個(gè)研究團(tuán)隊(duì)正利用BlueField DPU加速M(fèi)PI和其他HPC工作負(fù)載。
例如,英格蘭北部的達(dá)勒姆大學(xué)正在開(kāi)發(fā)一款軟件,用于在16個(gè)節(jié)點(diǎn)的Dell PowerEdge集群上使用BlueField DPU以實(shí)現(xiàn)MPI作業(yè)的負(fù)載均衡。該項(xiàng)目的首席調(diào)查員Tobias Weinzierl表示,該軟件將為全球各地的HPC設(shè)施更高效地處理更好算法鋪平道路。
劍橋大學(xué)和慕尼黑的DPU應(yīng)用
劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用DPU。
倫敦大學(xué)學(xué)院正在探索如何在BlueField-2 DPU上為主機(jī)系統(tǒng)調(diào)度作業(yè)。例如,可以使用它的能力在主機(jī)處理器之間移動(dòng)數(shù)據(jù),以便在需要時(shí)數(shù)據(jù)已然就位。
Dell PowerEdge服務(wù)器內(nèi)的BlueField DPU可為Cambridge Service for Data Driven Discovery服務(wù)卸載主機(jī)CPU的安全策略、存儲(chǔ)框架和其他作業(yè),從而更大限度地提高系統(tǒng)性能。
與此同時(shí),慕尼黑工業(yè)大學(xué)計(jì)算機(jī)體系架構(gòu)和并行系統(tǒng)組的研究人員正在尋找方法,使用DPU來(lái)卸載MPI和操作系統(tǒng)任務(wù),這是EuroHPC項(xiàng)目的一部分。
在美國(guó),佐治亞理工學(xué)院的研究人員正在與桑迪亞國(guó)家實(shí)驗(yàn)室合作,利用BlueField-2 DPU加速分子動(dòng)力學(xué)研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達(dá)20%,且不會(huì)損失模擬的準(zhǔn)確性。
不斷擴(kuò)展的網(wǎng)絡(luò)
本月早些時(shí)候,日本研究人員宣布將推出一款采用新版NVIDIA H100 Tensor Core GPU的系統(tǒng),該系統(tǒng)將搭載速度更快、更智能的NVIDIA Quantum-2 InfiniBand網(wǎng)絡(luò)平臺(tái)。
NEC將使用H100的為筑波大學(xué)計(jì)算科學(xué)中心構(gòu)建算力大約為6 PFLOPS超級(jí)計(jì)算機(jī)。研究人員將使用該系統(tǒng)實(shí)現(xiàn)氣候?qū)W、天體物理學(xué)、大數(shù)據(jù)、AI和更多方面的研究。
與此同時(shí),Panda等研究人員已經(jīng)開(kāi)始考慮如何使用BlueField-3 DPU的核心功能。
他打趣道:“這就像雇傭擁有大學(xué)學(xué)位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來(lái)越多的工作卸載?!?/p>
-
加速器
+關(guān)注
關(guān)注
2文章
809瀏覽量
38131 -
HPC
+關(guān)注
關(guān)注
0文章
326瀏覽量
23872 -
網(wǎng)絡(luò)計(jì)算機(jī)
+關(guān)注
關(guān)注
0文章
3瀏覽量
6587
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
HPC云計(jì)算的技術(shù)架構(gòu)
利用NVIDIA DPF引領(lǐng)DPU加速云計(jì)算的未來(lái)
![利用<b class='flag-5'>NVIDIA</b> DPF引領(lǐng)<b class='flag-5'>DPU</b>加速云<b class='flag-5'>計(jì)算</b>的<b class='flag-5'>未來(lái)</b>](https://file1.elecfans.com/web3/M00/07/0B/wKgZPGeS7aKAGUIAAAAbxIpaJKw881.png)
在NVIDIA BlueField-3 DPU上運(yùn)行WEKA客戶(hù)端的實(shí)際優(yōu)勢(shì)
![在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField</b>-3 <b class='flag-5'>DPU</b>上運(yùn)行WEKA客戶(hù)端的實(shí)際優(yōu)勢(shì)](https://file1.elecfans.com/web3/M00/05/0A/wKgZPGd8h92AdrhJAAATZmAVrps353.png)
云計(jì)算和HPC的關(guān)系
HPC云計(jì)算前景
借助NVIDIA超級(jí)計(jì)算機(jī)加速量子計(jì)算發(fā)展
IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書(shū)
NVIDIA BlueField-3 DPU助力思科提高工作負(fù)載安全性和運(yùn)營(yíng)效率
借助NVIDIA DOCA 2.7增強(qiáng)AI 云數(shù)據(jù)中心和NVIDIA Spectrum-X
助力科學(xué)發(fā)展,NVIDIA AI加速HPC研究
![助力科學(xué)發(fā)展,<b class='flag-5'>NVIDIA</b> AI加速<b class='flag-5'>HPC</b><b class='flag-5'>研究</b>](https://file1.elecfans.com/web2/M00/E6/2B/wKgaomZCvAaAfknvAAAcvZ0bm24729.jpg)
是德科技與NVIDIA攜手推進(jìn)6G研究云平臺(tái)發(fā)展
基于NVIDIA開(kāi)源CUDA-Q量子計(jì)算平臺(tái)發(fā)布
NVIDIA推出6G研究云平臺(tái),以AI推動(dòng)無(wú)線通信的發(fā)展
NVIDIA 推出云量子計(jì)算機(jī)模擬微服務(wù)
![<b class='flag-5'>NVIDIA</b> 推出云量子<b class='flag-5'>計(jì)算</b>機(jī)模擬微服務(wù)](https://file1.elecfans.com/web2/M00/C5/DB/wKgaomX5Bk6ALsj7AAY64NDeZQs038.jpg)
評(píng)論