由于仿真軟件需要耗費(fèi)大量計(jì)算資源,許多計(jì)算機(jī)輔助工程 (CAE) 應(yīng)用都可以從 GPU 的并行處理能力中大受裨益。與 CPU 相比,GPU 的密度更高而總體擁有成本更低,因此具有明顯的性價(jià)比優(yōu)勢,今天為大家分享基于CFD領(lǐng)域的GPU加速體驗(yàn)。
計(jì)算流體仿真力學(xué),英文全稱Computational Fluid Dynamics,縮寫為CFD,它是數(shù)值數(shù)學(xué)和計(jì)算機(jī)科學(xué)結(jié)合的產(chǎn)物,通過空間離散和數(shù)值求解的思路,對流體力學(xué)的各類問題進(jìn)行數(shù)值實(shí)驗(yàn)、模擬和分析研究,以解決學(xué)習(xí)、科研或者工程設(shè)計(jì)中的問題。
面對一個具體的工程問題,CFD工程師在應(yīng)用CFD工具進(jìn)行仿真分析時(shí)的基本流程,通??梢钥偨Y(jié)為五步:前處理、網(wǎng)格劃分、邊界條件加載、求解計(jì)算和后處理。但如何去平衡計(jì)算量(網(wǎng)格數(shù)量)和計(jì)算時(shí)間,對于很多CFD工程師都是個挑戰(zhàn)。
在實(shí)際解決問題的過程中,CFD工程師除了希望能選擇一款稱手的軟件工具外,當(dāng)然也希望計(jì)算機(jī)的主頻越高越好,核心越多越好。但是,核心與計(jì)算速度并非線性關(guān)系,不會因?yàn)楹诵牡缺壤鲩L。若想在單臺電腦上發(fā)揮極限運(yùn)算能力,還需要使用GPU加速,因?yàn)镚PU加速通過協(xié)調(diào)處理器并行運(yùn)算,能夠極大地提升計(jì)算能力,尤其適合多個項(xiàng)目同時(shí)進(jìn)行,這樣獲得的時(shí)間收益較大。
流體仿真為什么要選擇GPU?
CFD始終向處理更高精確度、更復(fù)雜的幾何結(jié)構(gòu)方向發(fā)展。但現(xiàn)階段,CFD軟件應(yīng)用于復(fù)雜流體問題方面還有待拓展,受到的阻礙主要源自以下三個方面:
● 隱式算法的高內(nèi)存要求——一些CFD分析工程師總是希望得到完美的殘差收斂曲線,以證明計(jì)算結(jié)果的可靠性,因此,他們會首選隱式算法,這意味著高內(nèi)存的需求;
● CFD結(jié)果對網(wǎng)格的強(qiáng)依賴性——網(wǎng)格的合理設(shè)計(jì)和高質(zhì)量生成是CFD計(jì)算的前提條件,是影響CFD計(jì)算結(jié)果的最主要的決定性因素之一,是CFD工作中人工工作量最大的部分,也是制約CFD工作效率的瓶頸問題之一。即使在CFD高度發(fā)達(dá)的國家,網(wǎng)格生成仍占整個CFD計(jì)算任務(wù)全部人力時(shí)間的70%~80%。
● 工程流體仿真問題復(fù)雜多變——在流體力學(xué)模擬中,由于流體力學(xué)模擬是個復(fù)雜的過程,存在極端變形、自由液面以及物質(zhì)運(yùn)動交界面等問題,在應(yīng)用網(wǎng)格數(shù)值模擬時(shí),會出現(xiàn)網(wǎng)格扭曲導(dǎo)致計(jì)算不收斂或者產(chǎn)生很大的計(jì)算誤差,需要重新模擬,這使得計(jì)算成本大大增加。
為了使CFD仿真發(fā)揮最大效用,CFD工程師往往需要快速得到計(jì)算結(jié)果。而借助于GPU加速計(jì)算所提供的非凡應(yīng)用程序性能,能將CFD程序計(jì)算密集部分的工作負(fù)載轉(zhuǎn)移到GPU,同時(shí)仍有CPU運(yùn)行其余程序代碼,這樣計(jì)算速度大大提升。另外,從計(jì)算性能來看,在CFD應(yīng)用中單個GPU的性能遠(yuǎn)遠(yuǎn)優(yōu)于CPU,基于GPU加速的CFD計(jì)算速度明顯加快,很多復(fù)雜的CFD難題得以解決,因此,越來越多的CFD工程師選擇GPU加速。
流體仿真分析GPU評測
CFD是一個計(jì)算需求強(qiáng)烈的領(lǐng)域,GPU的選擇將從根本上決定CFD分析過程的體驗(yàn)。在CFD分析中,工程師前期花費(fèi)的時(shí)間主要在模型建立和修改上,后期真正的分析時(shí)間消耗在計(jì)算機(jī)上,因此,選擇一款適合自身的CFD軟件和高性能建模工作站就顯得尤為重要。接下來分享來自e-works平臺基于Altair CFD應(yīng)用軟件以及一些案例模型的實(shí)際評測,供大家參考:
基于Altair AcuSolve軟件的 GPU加速
【軟件環(huán)境介紹】Altair AcuSolve是一款基于GLS-FEM算法的通用熱流體求解器,不但有快速良好的收斂速度,還能達(dá)到很高的求解精度,同時(shí)對網(wǎng)格有良好的兼容性,特別方便于復(fù)雜模型網(wǎng)格的劃分,廣泛應(yīng)用于汽車、流體機(jī)械和海洋平臺等工業(yè)和科學(xué)應(yīng)用問題的解決。值得一提的是,最新版本的AcuSolve,不僅通過GPU加速提高了3~4倍的計(jì)算速度,同時(shí)也支持核態(tài)沸騰、熱輻射、冷凝/蒸發(fā)多相流和流固耦合(FSI)等CFD難題的解決。
【硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用Quadro RTX 8000,它采用了NVIDIA Turing架構(gòu)和NVIDIA RTX平臺支持,對于追求以高穩(wěn)健性、高精度為目標(biāo)的CFD仿真分析帶來了卓越的計(jì)算性能體驗(yàn)。
【測試模型】在新能源汽車、醫(yī)療設(shè)備、軍工設(shè)備等大功率密度的應(yīng)用場合,設(shè)備運(yùn)行時(shí)會產(chǎn)生大量的熱損耗,為保證設(shè)備的安全運(yùn)行,需要采用各種冷卻措施來對設(shè)備進(jìn)行冷卻,水冷是其中一種方式。以新能源車的水冷板為例,其設(shè)計(jì)直接影電池的溫度均勻性,進(jìn)而影響車輛的續(xù)航里程和安全性。本測試模型擁有網(wǎng)格數(shù)量4300萬,求解方程采用湍流+固體傳熱組合,湍流模型選擇基于SA一方程的模型,設(shè)置穩(wěn)態(tài)迭代步為200步,分別采用無GPU和1塊GPU加速進(jìn)行計(jì)算時(shí)間對比。
動力電池水冷板模型
計(jì)算時(shí)間對比
【測試結(jié)果】數(shù)據(jù)表明,無GPU加速時(shí),水冷板分析的計(jì)算時(shí)間需要21小時(shí);采用單塊Quadro RTX 8000加速,水冷板分析的計(jì)算時(shí)間只需要4小時(shí)。由此可見,采用Altair AcuSolve進(jìn)行水冷板仿真分析,并提供RTX GPU的增強(qiáng)支持,計(jì)算速度與無GPU加速相比提高了4.25倍。顯然,這種方式對于CFD工程師快速探索水冷板的設(shè)計(jì),并根據(jù)準(zhǔn)確的計(jì)算結(jié)果做出決策非常有益。
基于Altair nanoFluidX軟件的 GPU加速
【軟件環(huán)境介紹】Altair nanoFluidX是一款基于粒子的流體動力學(xué) (SPH) 仿真工具,用于預(yù)測運(yùn)動軌跡復(fù)雜的幾何結(jié)構(gòu)周圍的流體。以整車CFD仿真為例,傳統(tǒng)CFD方法需要建立網(wǎng)格耗時(shí)巨大,但Altair nanoFluidX基于粒子的特性,無需建立網(wǎng)格,還可基于GPU顯卡計(jì)算,非常有助于工程師獲得簡潔而高效的CFD解決方案。
【硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用Quadro RTX 8000和Tesla V100,由于Altair nanoFluidX采用的粒子方法,其計(jì)算是由一系列的流體粒子的相互作用完成,在計(jì)算中每個粒子所執(zhí)行的計(jì)算是完全相同的,而在不同的數(shù)據(jù)上執(zhí)行相同的程序,恰恰是GPU計(jì)算最擅長的。
【測試模型】整車涉水分析是近年來新興的CFD仿真領(lǐng)域,主要研究汽車以一定速度涉水時(shí),關(guān)鍵零部件的進(jìn)水風(fēng)險(xiǎn),如防火墻滲水,傳統(tǒng)的發(fā)動機(jī)進(jìn)氣口進(jìn)水,電動汽車電氣短路等問題。整車涉水模型往往需要消耗大量的計(jì)算資源和時(shí)間進(jìn)行求解,以本次建立的整車涉水模型為例,擁有粒子數(shù)量為4100萬,設(shè)置車速為50公里/小時(shí)、瞬態(tài)物理時(shí)間為4秒,建立單相流模型,本次測試分別采用1塊RTX 8000 、2塊RTX 8000、4塊RTX 8000和4塊Tesla V100加速,對比計(jì)算時(shí)間。
整車涉水模型
計(jì)算時(shí)間對比
【測試結(jié)果】數(shù)據(jù)表明,采用1塊、2塊、4塊RTX 8000加速,整車涉水分析分別需要花費(fèi)48小時(shí)、28小時(shí)、13小時(shí);采用4塊V100,則需要16個小時(shí)。從計(jì)算時(shí)間來看,采用4塊RTX 8000加速,計(jì)算時(shí)間最少,與采用1塊RTX 8000加速相比,計(jì)算速度提升了約2.7倍。計(jì)算結(jié)果也表明,采用基于GPU加速和Altair nanoFluidX的組合方式,允許CFD工程師在一個更可接受的短時(shí)間內(nèi)研究類似整車涉水這樣的復(fù)雜流體問題。
基于Altair ultraFluidX軟件的 GPU加速
【軟件環(huán)境介紹】Altair ultraFluidX專用于超快預(yù)測乘用車、輕型卡車、賽車和重型車輛的空氣動力特性的仿真分析,它基于格子玻爾茲曼(LBM)技術(shù),無需建立網(wǎng)格,這大大縮短了建模時(shí)間,使得設(shè)計(jì)變得更加容易,同時(shí)保留了所有重要的幾何細(xì)節(jié)。
【硬件環(huán)境介紹】CPU采用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU選用NVIDIA RTX8000和NVIDIA Tesla V100,由于Altair ultraFluidX采用的LBM方法,非常適合大規(guī)模并行架構(gòu),而采用GPU加速,可以明顯提高吞吐量,達(dá)到Altair ultraFluidX的周轉(zhuǎn)時(shí)間,同時(shí)降低硬件和能源成本。
【測試模型】對于車輛的早期開發(fā)優(yōu)化,采用CFD手段無疑是最有效且最經(jīng)濟(jì)的方法,但這類CFD分析往往是高內(nèi)存和高計(jì)算資源消耗的典型代表,需要使用GPU來優(yōu)化計(jì)算性能。以此次建立的汽車虛擬風(fēng)洞模型為例,擁有格子數(shù)量1億6千萬,格子的最小尺寸為1.8mm,設(shè)置車速為140公里/小時(shí)、瞬態(tài)物理時(shí)間為2秒,分別采用2塊NVIDIA RTX 8000、4塊NVIDIA RTX 8000和4塊V100加速,對比計(jì)算時(shí)間。
汽車虛擬風(fēng)洞模型
計(jì)算時(shí)間對比
【測試結(jié)果】數(shù)據(jù)表明,采用2塊、4塊NVIDIA RTX8000加速,模擬汽車虛擬風(fēng)洞分別需要花費(fèi)14小時(shí)、8小時(shí);采用4塊V100,則需要8.4個小時(shí)。三種GPU加速中,采用4塊NVIDIA RTX8000加速,計(jì)算時(shí)間最少,與采用2塊NVIDIA RTX8000加速相比,計(jì)算速度提升了約0.75倍。計(jì)算結(jié)果也表明,基于GPU和Altair ultraFluidX的組合方式,可以明顯加速汽車虛擬風(fēng)洞分析,有效縮短汽車開發(fā)周期。
總結(jié)
作為當(dāng)前最重要的三大協(xié)處理加速技術(shù)之一,GPU已經(jīng)成為數(shù)值分析的新寵,廣泛應(yīng)用于各個領(lǐng)域。以流體仿真領(lǐng)域?yàn)槔?,隨著CFD分析對計(jì)算能力的要求日益增高,越來越多的CFD工程師傾向于采用GPU加速,例如借助 RTX 8000 GPU加速,能以遠(yuǎn)低于傳統(tǒng) CPU 解決方案的成本、空間和功耗,獲得無與倫比的計(jì)算性能。
同時(shí),在渲染方面,利用RTX 8000強(qiáng)大的運(yùn)算能力,將流場和流體構(gòu)件建立數(shù)學(xué)模型,并用數(shù)字化可視化的形式表現(xiàn)出來,可以獲得任意位置的結(jié)果值,這無疑也極大地提高了設(shè)計(jì)的精確性。e-works認(rèn)為,優(yōu)秀的計(jì)算性能和尖端的數(shù)值方法的組合,在更短的時(shí)間內(nèi)研究復(fù)雜的流體問題,將成為未來CFD領(lǐng)域高效而主流的方式。
編輯:hfy
-
gpu
+關(guān)注
關(guān)注
28文章
4785瀏覽量
129402 -
CFD
+關(guān)注
關(guān)注
1文章
121瀏覽量
18494
發(fā)布評論請先 登錄
相關(guān)推薦
《CST Studio Suite 2024 GPU加速計(jì)算指南》
![](https://file1.elecfans.com/web2/M00/84/58/wKgaomRmBBeAAAmTAAM2EsfjDvE540.png)
268.英偉達(dá)顯卡GPU占用0%,CPU占用100%3D游戲卡頓解決方案NVIDIA設(shè)置
![](https://file1.elecfans.com/web2/M00/84/62/wKgaomRmBViARIRxAACMFNuLnfA833.png)
【解決方案】加速海嘯模擬
GPU加速XenApp/Windows 2016/Office/IE性能會提高嗎
GPU加速matlab程序
機(jī)器學(xué)習(xí)實(shí)戰(zhàn):GNN加速器的FPGA解決方案
tengine是如何使用arm的GPU進(jìn)行加速的
FPGA與GPU計(jì)算存儲加速對比
![FPGA與<b class='flag-5'>GPU</b>計(jì)算存儲<b class='flag-5'>加速</b>對比](https://file.elecfans.com/web2/M00/1F/61/poYBAGGYHeWAI3ZBAAJzxAamOls629.png)
采用賽靈思Alveo的CFD內(nèi)核加速
![采用賽靈思Alveo的<b class='flag-5'>CFD</b>內(nèi)核<b class='flag-5'>加速</b>](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
直播就在明天!Cadence Fidelity 水泵水輪機(jī) CFD 模擬解決方案和應(yīng)用
![直播就在明天!Cadence Fidelity 水泵水輪機(jī) <b class='flag-5'>CFD</b> 模擬<b class='flag-5'>解決方案</b>和應(yīng)用](https://file1.elecfans.com//web2/M00/B1/A4/wKgZomVcYmWAJMTkAAHJwiKbm1Y213.jpg)
評論