準(zhǔn)確的天氣模型對于企業(yè)正確預(yù)測可再生能源的生產(chǎn)和制定自然災(zāi)害預(yù)案至關(guān)重要。僅 2022 年,無效和無法預(yù)測的天氣就造成了約 7140 億 美元的損失。為了避免這種情況,企業(yè)需要更快、更便宜、更精準(zhǔn)的天氣模型。
在 GTC23上,微軟和 TempoQuest 詳細(xì)介紹了他們?nèi)绾闻c NVIDIA 合作一起解決這個能源和氣候問題。NVIDIA 初創(chuàng)加速計劃成員 TempoQuest 實現(xiàn)了超本地、低延遲的天氣和環(huán)境預(yù)測。該多學(xué)科合作團隊涵蓋大氣科學(xué)、氣象學(xué)、高性能計算(HPC)AI、機器學(xué)習(xí)(ML)、工程等領(lǐng)域,是將 GPU 引入環(huán)境領(lǐng)域的先鋒,包括:
-
第一個將 WRF 移植到 GPU 上
-
第一個以比基于 CPU 的預(yù)測更快、更便宜的方式創(chuàng)建更高分辨率的預(yù)測
-
第一個開發(fā)出 GPU 軟件即服務(wù)的天氣預(yù)報系統(tǒng)
本文中將介紹 TempoQuest 如何利用微軟 Azure 上的 NVIDIA 加速計算,將傳統(tǒng)的天氣研究和預(yù)報(WRF)軟件移植到 GPU 上、提供高于 1 公里的分辨率以及 1 分鐘至 1 小時的時間分辨率并加快對可再生風(fēng)能和太陽能資源發(fā)電的預(yù)測。
公用事業(yè)單位在整合可再生能源過程中所面臨的挑戰(zhàn)
公用事業(yè)單位在他們的電網(wǎng)中使用可再生能源(主要是風(fēng)能和太陽能)是具有挑戰(zhàn)性的。這些能源因環(huán)境因素而異,比如云層覆蓋和風(fēng)速等。如果可再生能源的發(fā)電量不足以滿足需求,公用事業(yè)單位必須使用“旋轉(zhuǎn)備用”,即由發(fā)電機生產(chǎn)的碳基電力來彌補缺口。為了更好地預(yù)測可再生能源發(fā)電,需要快速、準(zhǔn)確、經(jīng)濟的天氣預(yù)報。
![3c310a78-05cf-11ee-962d-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9B/CD/wKgaomTntsGAdoFEAAPrEZEUybY491.png)
圖 1 標(biāo)準(zhǔn)電網(wǎng)基礎(chǔ)設(shè)施示意圖,包括發(fā)電、輸電和配電
能源行業(yè)需要實現(xiàn)三個關(guān)鍵功能:發(fā)電、輸電和配電。發(fā)電目前主要使用碳基燃料,但正在向包括風(fēng)能和太陽能在內(nèi)的可再生能源過渡,以實現(xiàn)凈零排放。輸電指的是產(chǎn)生的電力通過升壓變壓器后經(jīng)高壓線傳輸。在遙遠(yuǎn)的電網(wǎng)邊緣,電力經(jīng)變壓器和變電站“降壓”后,輸送給家庭和企業(yè)的用電者(240 V / 120 V)。
如果要在電網(wǎng)中增加更多可再生能源,公用事業(yè)單位不僅要整合新的發(fā)電站,還要建造更多高壓輸電線路和塔架。這就給電網(wǎng)維護(hù)帶來了更高的復(fù)雜性和成本,包括投資和運營費用。高分辨率的 GPU 加速 WRF 可以通過減少對碳基電力的依賴和優(yōu)化可再生能源的使用幫助實現(xiàn)這一目標(biāo)。
使用 GPU 加速 WRF
AceCAST 代表“加速預(yù)測”,通過運行一個名為“天氣研究和預(yù)報”(WRF)的區(qū)域模型可實現(xiàn)加速預(yù)測。目前,已有 160 個國家的 5 萬名用戶使用該模型。通過將 WRF 移植到使用專有的 OpenACC 和 CUDA 帶有 NVIDIA GPU 的 x86 系統(tǒng)上運行,并在多 GPU 和多節(jié)點系統(tǒng)上進(jìn)行擴展。AceCAST 支持所有主要的 WRF 動力學(xué)、物理學(xué)方案和名詞表選項,可直接取代現(xiàn)有的 WRF 配置。
AceCAST 的眾多優(yōu)點包括更快的求解時間、更高的分辨率和精度、對局部天氣現(xiàn)象更加深入的認(rèn)識以及更低的計算成本。
測試表明,在天氣預(yù)報和可再生能源預(yù)測方面,GPU 比 CPU 速度更快、分辨率更高且更具成本效益。這一加速解決方案對于減少碳排放、提升電網(wǎng)可靠性和管理以及降低用電者的用電成本十分重要。
AceCAST 驗證和性能成本分析
為了驗證基準(zhǔn)測試結(jié)果,首先要保證 CPU WRF 與 GPU WRF 的差異在可接受的范圍內(nèi)。團隊在幾個時間和空間預(yù)測范圍內(nèi)測試了模型性能,最終驗證了數(shù)千個測試案例,以確保 AceCAST 產(chǎn)生與 CPU WRF 相同的結(jié)果。在微軟 Azure 上運行性能測試時,團隊發(fā)現(xiàn)兩者在性能和成本上都有很大的差異。
基于 CPU 的 WRF – Standard HB120rs_v3 VMs(HBv3):
-
120 顆 AMD EPYC7V73X 系列(Milan-X)CPU 核
-
450 GB 內(nèi)存( 350 GB/s 內(nèi)存帶寬)
-
200 Gb/s HDR InfiniBand
-
2 個1 TB NVMe 固態(tài)硬盤
-
NCAR WRF 4.2.2
-
使用 Parallel net-CDF
-
使用英特爾編譯器和 MPI 進(jìn)行編譯
GPU 加速 WRF - Standard_ND96amsr_A100_v4(NDmv4):
-
8 個 NVIDIA A100 Tensor Core GPUs (80GB)
-
NVLink 3.0(200 Gb/s HDR InfiniBand)
-
96 顆 AMD EPYC7V12 系列(Rome)CPU 核
-
8 個 1 TB NVMe 固態(tài)硬盤
-
AceCAST 2.1
-
使用 OpenACC 和 CUDA 的專有實現(xiàn)
-
使用 MPI 在多節(jié)點和多 GPU 上進(jìn)行擴展
Azure 代管式 Lustre 文件系統(tǒng)
-
40 TiB 存儲Azure 代管容量
-
10000 MB/s 最大吞吐量
![3c63b3ba-05cf-11ee-962d-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9B/CD/wKgaomTntsGAHI_QAAN6h2WfFV0547.png)
圖 2 基于 CPU 的 WRF 與 TempoQuest AceCAST 的性能價格比較分析
結(jié)果顯示,與一個節(jié)點上基于 CPU 的 WRF 相比,一個節(jié)點上的 GPU 加速 WRF(AceCAST)的速度加快了約 9 倍,而要實現(xiàn)與一個 GPU 節(jié)點類似的性能,需要 18 個 CPU 節(jié)點。這些結(jié)果至關(guān)重要,因為更快、更低成本的天氣預(yù)報使公用事業(yè)單位能夠更加準(zhǔn)確地預(yù)測可再生能源發(fā)電、提供穩(wěn)定可靠的電力并避免過長時間的停電。
AceCAST 3.0.1 上的進(jìn)一步測試顯示其可繼續(xù)提升性能。團隊使用了一個嵌套域,外域由 500 萬個網(wǎng)格點(430x331x38v)和 15 公里的網(wǎng)格間距組成,內(nèi)域由 8000 萬個網(wǎng)格點(1551x1361x38v)和 3 公里的網(wǎng)格間距組成。
![3c6c2e46-05cf-11ee-962d-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9B/CD/wKgaomTntsKAQ7XdAAUk4C7-3l0284.png)
圖 3 TempoQuest AceCAST 以最佳配置運行一項作業(yè)的性能成本圖
結(jié)果顯示,AceCAST 在 1xNDmA100V4(8 個 GPU)上的內(nèi)域計算和通信時間比 1xHBv3(64 個CPU)快 16.8 倍。單個作業(yè)的最佳配置是在 16 個 HBv3(CPU)虛擬機上運行 WRF,在 1 個包含 8 個 GPU 的 NDmA100(GPU)虛擬機上運行 AceCAST。在這種情況下,AceCAST 比基于 CPU 的 WRF 運行速度快 7%,成本低 75%。
可再生發(fā)電功率預(yù)測
最后一步是將 AceCAST 應(yīng)用于可再生能源預(yù)測。美國的公用事業(yè)單位掌握著所有 7 萬多臺風(fēng)力發(fā)電機的規(guī)格以及每個風(fēng)能和太陽能節(jié)點的位置。通過使用專有的天氣-電力算法,AceCAST 可提供更高的預(yù)測分辨率,每天對特定可再生能源發(fā)電站點作出小時級的精確功率預(yù)測(MW)。
電網(wǎng)脫碳化
隨著發(fā)電資產(chǎn)從集中化的碳基技術(shù)過渡到清潔的分布式能源資源,電網(wǎng)面臨著實時管理供需的挑戰(zhàn)。通過預(yù)測可再生資產(chǎn)的性能,電力公司能夠提高電網(wǎng)的可靠性和彈性。NVIDIA、微軟和 TempoQuest 正在聯(lián)手幫助解決這一重大的社會及全球挑戰(zhàn)。
憑借 AceCAST 這一 GPU 加速 WRF,TempoQuest 正在以更低的成本加速風(fēng)能和太陽能可再生資源的發(fā)電功率預(yù)測。這有助于優(yōu)化負(fù)載和發(fā)電的平衡、減少公用事業(yè)單位的運營成本、管理可再生能源輸出的波動并產(chǎn)生更加可靠的預(yù)測,進(jìn)而減少對碳基電力儲備的依賴。
點擊“閱讀原文”深入了解加速計算,訪問 GPU 加速庫論壇。
掃描下方海報二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領(lǐng)域的最新進(jìn)展!
原文標(biāo)題:微軟和 TempoQuest 利用 AceCast 加速風(fēng)能預(yù)測
文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3854瀏覽量
92080
原文標(biāo)題:微軟和 TempoQuest 利用 AceCast 加速風(fēng)能預(yù)測
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論