GPU在傳統(tǒng)圖形可視化領(lǐng)域的應(yīng)用不斷的擴(kuò)大,無(wú)論是在3D設(shè)計(jì),大分辨率多屏拼接顯示,還是特效渲染領(lǐng)域,越來(lái)越多的人轉(zhuǎn)向使用更加穩(wěn)定的專業(yè)圖形卡。深度學(xué)習(xí)和大數(shù)據(jù)作為新銳行業(yè)也大量地使用專業(yè)的GPU,以加速訓(xùn)練研發(fā)的速度。
最新基于Turing架構(gòu)的NVIDIA Quadro GPU系列從去年就開(kāi)始上市。本篇開(kāi)箱評(píng)測(cè)分享將告訴你最新的Quadro RTX 5000有那些改變,又有哪些提升呢?
開(kāi)箱
本次顯卡包裝改變了以往的顏色、風(fēng)格,使用綠白灰搭配,正面的灰色格子采用漸變的顏色很有現(xiàn)代感和立體感。包裝的正面和頂部、側(cè)面都有顯卡型號(hào)的標(biāo)識(shí)。
RTX幾個(gè)字有金屬反光效果,凸顯了這代顯卡最重要的功能之一——實(shí)時(shí)光線追蹤。
整體拿在手里沉甸甸的,挺有分量,包裝的材質(zhì)很結(jié)實(shí)。
顯卡包裝及配件
內(nèi)部包裝也和以往包裝不一樣,外殼和防震泡沫是一體的,顯卡安置在其中,給人的感覺(jué)是堅(jiān)固、牢靠。
顯卡外面還有一層透明防靜電袋,配線盒里面有用戶手冊(cè)、支持手冊(cè)、 8pin轉(zhuǎn)雙6pin電源線、DP轉(zhuǎn)DVI轉(zhuǎn)接頭和DP轉(zhuǎn)HDMI轉(zhuǎn)接頭。這是眾多使用DVI顯示器或HDMI顯示器的福音,再也不用另外單獨(dú)購(gòu)買轉(zhuǎn)接頭了。
顯卡正面
顯卡外觀主要采用綠、銀色和黑色搭配,與包裝風(fēng)格一致。顯卡也是沉甸甸的,質(zhì)感很不錯(cuò)。在顯卡正面和脊背上都能看到顯卡型號(hào)的標(biāo)識(shí)。
Quadro RTX 5000依然是雙插槽顯卡,1個(gè)渦輪風(fēng)扇,顯卡采用8pin加6pin的供電方式,對(duì)于最大功耗為265W的RTX 5000來(lái)講是足夠用了。
顯卡頂部接口
顯卡頂部總共有3個(gè)接口,NVLink、SYNC、Stereo。
NVLink技術(shù)取代了SLI技術(shù),可以配合Quadro NVLink 2-Slot或者3-Slot使用。NVLink技術(shù)不但具備多卡同步輸出的功能,在應(yīng)用支持的情況下,還能實(shí)現(xiàn)顯存疊加的功能,使兩塊卡疊加成一個(gè)更大的顯存。
SYNC接口要配合Quadro SYNCII卡來(lái)使用,實(shí)現(xiàn)多卡的顯示信號(hào)同步輸出。對(duì)于大屏拼接的用戶來(lái)講可以延續(xù)之前的使用方法。
Stereo接口要配合3D立體檔板來(lái)輸出3D立體信號(hào)。
總線接口是PCIE 3.0接口,向下兼容PCIE 2.0。目前市場(chǎng)上主板大都是使用這種接口的。
顯卡顯示接口
顯示接口有了新的變化,不是4DP+DVI的配置,改成了4DP+VirtualLink的配置。
DP接口都支持DP 1.4的協(xié)議,最高分辨率可以達(dá)到7680x4320。而VirtualLink接口則是下一代VR設(shè)備使用的標(biāo)準(zhǔn)接口,一個(gè)接口可完成供電、顯示傳輸、控制信號(hào)多個(gè)功能。
性能測(cè)試
顯卡參數(shù)
測(cè)試平臺(tái)
測(cè)試軟件
測(cè)試內(nèi)容展示
1.
SPECviewperf 13
SPECviewperf 13是基于專業(yè)應(yīng)用上衡量圖形性能被廣泛應(yīng)用的測(cè)試軟件。該軟件對(duì)基于OpenGL和DirectX的專業(yè)繪圖軟件進(jìn)行基準(zhǔn)評(píng)測(cè),SPECviewperf 13帶來(lái)了全新的9個(gè)專業(yè)圖形測(cè)試場(chǎng)景,SPECviewperf13測(cè)試更加貼近真實(shí)的工作應(yīng)用, 其中一些測(cè)試場(chǎng)景甚至包含有超過(guò)6,000萬(wàn)個(gè)定點(diǎn)數(shù)據(jù),能夠充分反映出顯卡的專業(yè)圖形性能,此次測(cè)試我們使用軟件默認(rèn)配置進(jìn)行評(píng)測(cè)。
測(cè)試結(jié)果
從測(cè)試結(jié)果來(lái)看,RTX 5000在所有項(xiàng)目上普遍超越了Quadro P5000,snx的性能甚至增加了40%以上。看來(lái)Turing架構(gòu)增加的不僅僅是光線追蹤和深度學(xué)習(xí)的效率,在專業(yè)應(yīng)用的性能上增加的幅度也是很大的。
2.
SuperPosition Benchmark
這款軟件更像是在一個(gè)復(fù)雜的游戲環(huán)境,在不同的光場(chǎng)效果中對(duì)顯卡DX和OpenGL渲染性能及穩(wěn)定性的評(píng)測(cè)。
測(cè)試結(jié)果
在DirectX的性能方面,RTX 5000比P5000提高了近45%,在OpenGL方面,RTX 5000比P 5000提高了性能提高了50%左右。兩個(gè)主要的圖形API的性能都增加了很多,相信RTX 5000在專業(yè)3D可視化領(lǐng)域有了更高的可用性。
3.
V-Ray Benchmark
Chaos Group的V-Ray在渲染領(lǐng)域早已被廣大用戶認(rèn)可了,由于GPU渲染性能的提升,Chaos Group在V-Ray Next上推出了V-Ray GPU NEXT版本,支持調(diào)用NVIDIA CUDA核心進(jìn)行渲染,隨著技術(shù)的不斷更新,GPU渲染的質(zhì)量上幾乎和CPU沒(méi)有區(qū)別。GPU算力強(qiáng)勁渲染時(shí)間成本會(huì)更低,并且支持多卡加速渲染,所以很多渲染器都在增加自己的GPU渲染功能。本次評(píng)估僅測(cè)試單卡的渲染性能,時(shí)間越短性能越好。
測(cè)試截圖
測(cè)試結(jié)果
從測(cè)試結(jié)果看,使用最新的RTX 5000比P5000節(jié)省了35%的時(shí)間。在V-Ray渲染中RTX 5000的效率會(huì)更高一些。
4.
CUDA-Z
就像我們熟知的CPU-Z 、GPU-Z一樣,CUDA-Z是對(duì)NVIDIA GPU處理器的一些基本信息的采集,GeForce、Quadro、Tesla卡都可以配合使用。
測(cè)試截圖
CUDA計(jì)算能力
在CUDA-Z的測(cè)試項(xiàng)目中,我們實(shí)際用到最多的是單精度浮點(diǎn)運(yùn)算,如果有使用到雙精度科學(xué)計(jì)算的,推薦使用GV100或者GP100雙精計(jì)算能力高的GPU。
RTX 5000單精計(jì)算的能力達(dá)到了11.7T,相對(duì)于前一臺(tái)P5000提高了36%,提升幅度很大。這么強(qiáng)的單晶浮點(diǎn)數(shù)是CPU不能匹敵的,這也是越來(lái)越多的應(yīng)用把計(jì)算從CPU轉(zhuǎn)向了GPU的原因。
5.
3DMark Port Royal
測(cè)試場(chǎng)景
測(cè)試結(jié)果
目前NVIDIA的RTX渲染的Benchmark功能,3DMark的Port Royal可以支持性能測(cè)試。Quadro P5000由于沒(méi)有RT Core所以無(wú)法使用這個(gè)評(píng)測(cè)軟件。
測(cè)試場(chǎng)景里帶了大量金屬的材質(zhì),反射效果驚艷。RTX 5000渲染FPS達(dá)到了28左右?guī)€算流暢。目前游戲行業(yè)已經(jīng)有BF5使用這種技術(shù),相信未來(lái)在工業(yè)制造領(lǐng)域和影視后期領(lǐng)域都會(huì)被廣泛的使用。
6.
OctaneBench 2019 Preview
OC渲染器是做3D設(shè)計(jì)及動(dòng)畫的一款支持GPU渲染的渲染器,可以配合很多3ds Max、CINEMA 4D、NUKE、MODO等3D建模及特效的軟件。OC渲染器是可以支持Out of Core的渲染軟件,最新的OctaneBench 2019 Preview是可以支持RT Core加速光線追蹤渲染的軟件。我們可以看一下使用和關(guān)閉RTX在渲染速度上的區(qū)別。
測(cè)試截圖
軟件分別在開(kāi)啟RTX和關(guān)閉RTX狀態(tài)下對(duì)相同場(chǎng)景進(jìn)行渲染,從測(cè)試成績(jī)上可以看出,開(kāi)啟了RTX On渲染之后,渲染的速度比關(guān)閉RTX渲染速度快了近3倍??梢?jiàn)在RT Core的加成下,渲染速度有了很大的提升。
7.
NVIDIA Tensorflow example
我們選擇NVIDIA Tensorflow的一個(gè)示例來(lái)測(cè)試顯卡的性能。在相同參數(shù)設(shè)置的情況下,顯卡在一秒內(nèi)訓(xùn)練的圖片數(shù)越多,說(shuō)明顯卡在實(shí)例深度學(xué)習(xí)方面的性能越好。
上圖可以看到,RTX 5000在滿載時(shí)候每秒處理的數(shù)量最多為441張。
P5000在上圖此示例中每秒處理的圖片數(shù)最多為194張。
從每秒處理數(shù)據(jù)的性能上看,RTX 5000處理速度是P5000的2.2倍。速度快了很多,這是由于調(diào)用了Tensor Core進(jìn)行計(jì)算的原因??梢?jiàn)Tensor Core在深度學(xué)習(xí)的加速上還是有很大作用的。Quadro RTX高端顯卡都具有Tensor Core,基于這種顯卡可以實(shí)現(xiàn)圖像加AI的一些應(yīng)用。例如在渲染的同時(shí)可以實(shí)現(xiàn)去AI噪點(diǎn),圖像AI識(shí)別,或者其他AI推理的一些工作。
總結(jié)
RTX 5000顯卡最大的特點(diǎn)是:
具有RT Core支持RTX實(shí)時(shí)光線追蹤渲染,能渲染出具有流光溢彩真實(shí)感的畫面。渲染速度非??欤谥T多行業(yè)可視化的工業(yè)設(shè)計(jì)流程上會(huì)有很好的推動(dòng)作用。
具有Tensor Core,可以加速深度學(xué)習(xí)和AI推理。在人工智能大力發(fā)展的今天,有了Tensor Core的加持,很多應(yīng)用會(huì)變得如虎添翼。
傳統(tǒng)的圖形應(yīng)用性能優(yōu)化和穩(wěn)定性都繼承了下來(lái),并且性能表現(xiàn)的更好。使用Fermi 、Kepler、Maxwell架構(gòu)的用戶可以考慮RTX系列顯卡進(jìn)行更新?lián)Q代了。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5078瀏覽量
103767 -
gpu
+關(guān)注
關(guān)注
28文章
4783瀏覽量
129382 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5516瀏覽量
121583
原文標(biāo)題:NVIDIA Quadro RTX 5000評(píng)測(cè) | 體驗(yàn)RTX加持下的創(chuàng)意工作改變
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論