案例簡(jiǎn)介
? 本案例中通過(guò) NVIDIA A100 GPU 加速器,上海市磁共振重點(diǎn)實(shí)驗(yàn)室構(gòu)建了高效的深度學(xué)習(xí)科研硬件平臺(tái),建立高效且穩(wěn)定的針對(duì)醫(yī)學(xué)圖像處理的深度學(xué)習(xí)平臺(tái)。
? 本案例中 NVIDIA 精英級(jí)合作伙伴信弘智能助力上海市磁共振重點(diǎn)實(shí)驗(yàn)室部署了高效的科研硬件平臺(tái)。
客戶(hù)簡(jiǎn)介及應(yīng)用背景
上海市磁共振重點(diǎn)實(shí)驗(yàn)室(Shanghai Key Laboratory of Magnetic Resonance)是從屬于華東師范大學(xué)的省部級(jí)重點(diǎn)實(shí)驗(yàn)室, 是國(guó)內(nèi)核磁共振研究和人才培養(yǎng)的主要基地之一。多年來(lái),堅(jiān)持自己在磁振物理學(xué)上的專(zhuān)業(yè)特色,逐漸形成了應(yīng)用研究與技術(shù)研發(fā)并重,磁共振波譜與磁共振成像兼顧的局面,并先后建立了“上海市磁共振成像技術(shù)平臺(tái)”和“上海市核磁共振波譜技術(shù)服務(wù)平臺(tái)”兩個(gè)開(kāi)放平臺(tái),進(jìn)一步強(qiáng)化了實(shí)驗(yàn)室的開(kāi)放服務(wù)功能。
目前該實(shí)驗(yàn)室已與上海市范圍內(nèi)十幾家重點(diǎn)醫(yī)院展開(kāi)科研合作,對(duì)高效的大數(shù)據(jù)的醫(yī)學(xué)圖像處理有著急切的需求。此次借助 NVIDIA A100 GPU 和自身龐大的計(jì)算能力,構(gòu)建出了高效穩(wěn)定的科研硬件平臺(tái),用于醫(yī)學(xué)圖像的各種后處理任務(wù),深度學(xué)習(xí)相關(guān)任務(wù)。
客戶(hù)挑戰(zhàn)
不同于二維自然圖像,醫(yī)學(xué)圖像往往單個(gè)數(shù)據(jù)數(shù)據(jù)量較大,對(duì)于網(wǎng)絡(luò)傳輸帶寬及 GPU 顯存都提出了新的挑戰(zhàn)。并且由于科研課題較大、研究?jī)?nèi)容跨度較大和研究人員較多等因素。深度學(xué)習(xí)的硬件平臺(tái)效率成為了科研工作效率的瓶頸。如何在有限的預(yù)算內(nèi)完成深度學(xué)習(xí)平臺(tái)的構(gòu)建成為了新的挑戰(zhàn)。
跨節(jié)點(diǎn)使用性能不高,需要優(yōu)化網(wǎng)絡(luò)環(huán)境,目前實(shí)驗(yàn)室僅使用了一根 1GB 帶寬網(wǎng)線(xiàn)連接公用存儲(chǔ)服務(wù)器,在大型訓(xùn)練任務(wù)中數(shù)據(jù)傳輸速度低成為深度學(xué)習(xí)任務(wù)的瓶頸。
應(yīng)用方案
基于以上挑戰(zhàn),作為解決方案的第一步,上海市磁共振重點(diǎn)實(shí)驗(yàn)室使用了 NVIDIA A100 GPU 加速器,將深度學(xué)習(xí)訓(xùn)練、推理和分析整合至一個(gè)易于部署的統(tǒng)一 AI 基礎(chǔ)架構(gòu)中,通過(guò)大顯存方法減少I(mǎi)O速度帶來(lái)的影響。
目前,實(shí)驗(yàn)室包括 A100 計(jì)算服務(wù)器總計(jì)擁有 7 個(gè)計(jì)算服務(wù)器(計(jì)算節(jié)點(diǎn)),每臺(tái)服務(wù)器擁有 4 塊 NVIDIA GPU 加速器用于深度學(xué)習(xí),每臺(tái)服務(wù)器共享同一個(gè)存儲(chǔ)服務(wù)器。所有用戶(hù)通過(guò) Active Directory 賬戶(hù)共享計(jì)算及存儲(chǔ)服務(wù)器。
并且為了進(jìn)一步整合當(dāng)前實(shí)驗(yàn)室中 NVIDIA GPU 服務(wù)器資源,實(shí)驗(yàn)室開(kāi)發(fā)了面向臨床及科研的醫(yī)學(xué)圖像 AI 開(kāi)發(fā)開(kāi)源平臺(tái)“Strix”。該平臺(tái)基于 NVIDIA 團(tuán)隊(duì)的 MONAI 醫(yī)學(xué)圖像 AI 處理庫(kù)開(kāi)發(fā)。整合了醫(yī)學(xué)圖像 AI 開(kāi)發(fā)中涉及的數(shù)據(jù)準(zhǔn)備,數(shù)據(jù)預(yù)處理,多種任務(wù)框架,結(jié)果可視化等步驟。讓醫(yī)學(xué)圖像 AI 開(kāi)發(fā)可以更為簡(jiǎn)單易于上手。針對(duì)不同架構(gòu)的 GPU, Strix 也做了針對(duì)性的優(yōu)化。例如 A100 GPU 的 MIG 虛擬 GPU 技術(shù),我們提供了虛擬 GPU 交互式選擇,實(shí)現(xiàn)讓用戶(hù)更輕松的選擇目標(biāo) GPU 進(jìn)行訓(xùn)練。
使用效果
通過(guò)NVIDIA A100 GPU的MIG技術(shù),在小團(tuán)隊(duì)的工作環(huán)境中有較高的自由度,在計(jì)算資源較為緊缺的情況下,可以增加可用用戶(hù)數(shù)。在顯存資源較為緊缺的情況下,可以減少用戶(hù)數(shù)增加單個(gè)顯存容量。
更大的顯存可以運(yùn)行需要更大顯存的深度學(xué)習(xí)任務(wù),讓許多從前無(wú)法實(shí)現(xiàn)的科研課題在新的GPU上成為可能。同時(shí)最新的Ampere架構(gòu)支持了半精度運(yùn)算,搭配 NVIDIA的自動(dòng)混合精度(Automatic Mixed Precision ) 技術(shù),在節(jié)省運(yùn)行顯存開(kāi)銷(xiāo)的同時(shí),加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度。帶來(lái)了更快的網(wǎng)絡(luò)訓(xùn)練及推理效率。
上海市磁共振重點(diǎn)實(shí)驗(yàn)室表示,“作為以醫(yī)學(xué)圖像處理為重點(diǎn)的課題組,通過(guò)與 NVIDIA 的緊密合作,我們將更高效地利用前沿AI技術(shù)及醫(yī)學(xué)圖像技術(shù),解決醫(yī)療行業(yè)的高價(jià)值問(wèn)題,專(zhuān)注在更智能更高效更安全的未來(lái)醫(yī)療的新技術(shù)?!?/p>
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5080瀏覽量
103828 -
gpu
+關(guān)注
關(guān)注
28文章
4788瀏覽量
129428 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9335瀏覽量
86138
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
英偉達(dá)A100和H100比較
![英偉達(dá)<b class='flag-5'>A100</b>和H<b class='flag-5'>100</b>比較](https://file1.elecfans.com/web3/M00/07/B4/wKgZPGepwQKASwE3AAKqH4859uk770.png)
NPU在深度學(xué)習(xí)中的應(yīng)用
GPU深度學(xué)習(xí)應(yīng)用案例
FPGA加速深度學(xué)習(xí)模型的案例
深度學(xué)習(xí)GPU加速效果如何
FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?
利用Matlab函數(shù)實(shí)現(xiàn)深度學(xué)習(xí)算法
llm模型訓(xùn)練一般用什么系統(tǒng)
深度學(xué)習(xí)在視覺(jué)檢測(cè)中的應(yīng)用
基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)
卷積神經(jīng)網(wǎng)絡(luò)在圖像和醫(yī)學(xué)診斷中的優(yōu)勢(shì)
常見(jiàn)的醫(yī)學(xué)圖像讀取方式和預(yù)處理方法
![常見(jiàn)的<b class='flag-5'>醫(yī)學(xué)</b><b class='flag-5'>圖像</b>讀取方式和預(yù)<b class='flag-5'>處理</b>方法](https://file1.elecfans.com/web2/M00/CF/5F/wKgZomYh6PCASZQyAAAV3ymW-SM749.jpg)
基于TOF深度相機(jī)的圖像處理專(zhuān)利獲授權(quán)
![基于TOF<b class='flag-5'>深度</b>相機(jī)的<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>專(zhuān)利獲授權(quán)](https://file1.elecfans.com/web2/M00/C9/60/wKgaomYciwKAOoF9AAHm_8Sljs8888.png)
評(píng)論