NVIDIA GPU曾于去年12月和今年7月兩度樹立了數(shù)據(jù)中心神經(jīng)網(wǎng)絡(luò)訓(xùn)練的性能標(biāo)桿。今天發(fā)布的行業(yè)基準(zhǔn)測(cè)試結(jié)果顯示,NVIDIA也引領(lǐng)著數(shù)據(jù)中心內(nèi)部與外部AI網(wǎng)絡(luò)的趨勢(shì)。
NVIDIA Turing GPU和Xavier芯片系統(tǒng)在首個(gè)獨(dú)立AI推理基準(zhǔn)測(cè)試 ——MLPerf Inference 0.5中取得第一名。由于推理一直是AI市場(chǎng)中最大、同時(shí)也是最具競(jìng)爭(zhēng)力的領(lǐng)域,業(yè)內(nèi)此前一直希望能夠有一套客觀的推理性能測(cè)試指標(biāo)。
在參與此次測(cè)試的十二家公司中,只有NVIDIA AI平臺(tái)提交了MLPerf的全部五項(xiàng)推理測(cè)試成績(jī)(MLPerf是一個(gè)于2018年5月成立的行業(yè)基準(zhǔn)測(cè)試小組)。這證明了NVIDIA CUDA-X AI和TensorRT軟件的成熟程度。它們讓用戶能夠更加輕松地將所有的NVIDIA GPU應(yīng)用于數(shù)據(jù)中心、邊緣等領(lǐng)域。
MLPerf定義了五項(xiàng)推理基準(zhǔn),涵蓋了三個(gè)現(xiàn)有的人工智能應(yīng)用:圖像分類、目標(biāo)檢測(cè)和翻譯。每項(xiàng)基準(zhǔn)分為四個(gè)場(chǎng)景:與數(shù)據(jù)中心應(yīng)用關(guān)聯(lián)性最高的服務(wù)器和離線場(chǎng)景,以及用于滿足邊緣設(shè)備地芯片系統(tǒng)需求的單流和多流場(chǎng)景。
圖1:NVIDIA在兩個(gè)數(shù)據(jù)中心場(chǎng)景(離線和服務(wù)器)的全部五項(xiàng)基準(zhǔn)測(cè)試中均排在第一位,Turing GPU被評(píng)為市面上單處理器性能最高的GPU。
圖2:NVIDIA Turing在MLPerf數(shù)據(jù)中心場(chǎng)景中的成績(jī)超過了其他市面上的處理器。
離線場(chǎng)景中具有代表性的場(chǎng)景有圖像標(biāo)記等,該場(chǎng)景下所有數(shù)據(jù)可在本地使用;而服務(wù)器場(chǎng)景代表性場(chǎng)景有在線翻譯服務(wù)等,此場(chǎng)景下會(huì)突然或間歇性隨機(jī)出現(xiàn)數(shù)據(jù)和請(qǐng)求工作。
Xavier在兩個(gè)邊緣場(chǎng)景(單流和多流)中被評(píng)為市面上性能最佳的邊緣和移動(dòng)芯片系統(tǒng)。
工業(yè)檢測(cè)相機(jī)主要被用來在快速移動(dòng)的生產(chǎn)線上發(fā)現(xiàn)不合格品,這是一種典型的單流任務(wù)。多流場(chǎng)景則是測(cè)試芯片能夠處理多少個(gè)數(shù)據(jù)源 —— 該性能對(duì)于一輛可能需要使用6臺(tái)以上攝像機(jī)的自動(dòng)駕駛汽車而言,是一項(xiàng)關(guān)鍵的能力。
圖3:NVIDIA Xavier在MLPerf邊緣場(chǎng)景中成為市面上最佳的邊緣和移動(dòng)芯片系統(tǒng)。
該結(jié)果顯示了NVIDIA CUDA和TensorRT軟件的性能。它們?yōu)橛脩籼峁┝艘粋€(gè)通用平臺(tái),使用戶可以在多個(gè)產(chǎn)品和應(yīng)用中取得領(lǐng)先結(jié)果,而這正是NVIDIA所獨(dú)有的能力。
在數(shù)據(jù)中心場(chǎng)景中,NVIDIA的兩款GPU還出現(xiàn)了相互競(jìng)爭(zhēng)的場(chǎng)面。NVIDIA TITAN RTX展示了Turing級(jí) GPU的巨大潛力,尤其是在各種要求苛刻的任務(wù)中,比如運(yùn)行用于語言翻譯的GNMT模型等。
功能豐富、應(yīng)用廣泛的NVIDIA T4 Tensor Core GPU在多個(gè)場(chǎng)景取得了優(yōu)秀的成績(jī)。這個(gè)功耗僅為70瓦的GPU能夠輕松安裝到任何帶有PCIe槽的服務(wù)器中,使用戶能夠根據(jù)需要擴(kuò)展其計(jì)算力,進(jìn)而大幅擴(kuò)展其推理工作。
MLPerf已經(jīng)獲得行業(yè)和學(xué)術(shù)界的廣泛支持。其成員包括Arm、Facebook、Futurewei、通用汽車、Google、哈佛大學(xué)、Intel、MediaTek、微軟、NVIDIA及Xilinx。值得一提的是,相比于之前的兩次訓(xùn)練比賽,此次基準(zhǔn)測(cè)試吸引了更多的參與者。
NVIDIA此次共采用了三款產(chǎn)品,共計(jì)四種配置參加此次測(cè)試,并提交了全部20個(gè)場(chǎng)景中的19個(gè)場(chǎng)景的成績(jī),以此表明公司對(duì)這項(xiàng)工作的支持。NVIDIA的合作伙伴Dell EMC,以及NVIDIA的客戶阿里巴巴同樣使用NVIDIA GPU提交了成績(jī)。相比于其他參與者,NVIDIA與合作伙伴和客戶一同向用戶全面地展示了NVIDIA產(chǎn)品組合的潛力。
全新的視角與產(chǎn)品
推理指的是在實(shí)時(shí)生產(chǎn)系統(tǒng)中,通過運(yùn)行AI模型,從大量數(shù)據(jù)中篩選出可執(zhí)行洞察的過程。這是一項(xiàng)仍處于發(fā)展中的新興技術(shù),而NVIDIA也在該領(lǐng)域中不斷前進(jìn),未曾停止腳步。今天,NVIDIA發(fā)布了用于MLPerf測(cè)試的Xavier芯片系統(tǒng)低功耗版本——Jetson Xavier NX,其最大功率僅為15瓦,卻具有最高21 TOPS的性能。它將為那些對(duì)性能要求高、但功率有限的新一代機(jī)器人、無人機(jī)和其他自主設(shè)備提供驅(qū)動(dòng)力。
除了新的硬件之外,NVIDIA還發(fā)布了在MLPerf基準(zhǔn)測(cè)試中所使用的最新TensorRT 6優(yōu)化,并在GitHub上以開源方式為用戶提供該軟件。用戶可以在MLPerf 開發(fā)者博客中了解更多關(guān)于這些優(yōu)化的信息。NVIDIA不斷地對(duì)該軟件進(jìn)行升級(jí),使用戶可以從日益增加的AI自動(dòng)化與性能中獲益。
讓推理變得更簡(jiǎn)單
今天的MLPerf測(cè)試還說明了一個(gè)結(jié)論,那就是推理很困難。例如,在實(shí)際工作負(fù)載中,由于推理還需要大量預(yù)處理和后處理步驟,那么在實(shí)際工作負(fù)載中其對(duì)推理性能的需求甚至比基準(zhǔn)測(cè)試更高。NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在去年GTC大會(huì)的主題演講中就曾將這種復(fù)雜性概括為一個(gè)詞:PLASTER。他表示,現(xiàn)代AI推理對(duì)可編程性(Programmability)、延遲性(Latency)、準(zhǔn)確性(Accuracy)、模型大?。ˋccuracy)、吞吐量(Throughput)、能效(Energy efficiency)和學(xué)習(xí)率(Rate of Learning)的要求很高。
這就是為何用戶越來越喜歡使用高性能的NVIDIA GPU和軟件來處理各種要求苛刻的推理工作,其中就包括:BMW、Capital One、思科、Expedia、John Deere、微軟、PayPal、Pinterest、寶潔、Postmates、Shazam、Snap、Shopify、Twitter、Verizon和沃爾瑪?shù)葮O具遠(yuǎn)見的公司。
本周,全球最大的郵政服務(wù)系統(tǒng)——美國郵政,也加入了此行列,使用NVIDIA GPU進(jìn)行AI訓(xùn)練和推理。
硬盤制造商希捷希望通過在NVIDIA GPU上運(yùn)行的AI推理將生產(chǎn)量提高10%。該公司預(yù)計(jì),通過提高效率和質(zhì)量,其將獲得高達(dá)300%的投資回報(bào)。
Pinterest依靠NVIDIA GPU訓(xùn)練和評(píng)估其識(shí)別模型并對(duì)其1750億條Pin貼文執(zhí)行實(shí)時(shí)推理。
Snap使用NVIDIA T4加速器在谷歌云平臺(tái)上執(zhí)行推理。相比于僅采用了CPU的系統(tǒng),這提高了其廣告的效果,同時(shí)降低了成本。
Twitter發(fā)言人就這一趨勢(shì)表示:“GPU的使用不僅大大縮短了訓(xùn)練時(shí)間,還讓我們?cè)谕评頃r(shí)能夠?qū)崟r(shí)了解直播視頻,讓我們可以在自己的平臺(tái)上了解各媒體?!?
AI會(huì)話:關(guān)于推理
未來,會(huì)話式AI將帶來大量的機(jī)會(huì)以及技術(shù)方面的挑戰(zhàn)。NVIDIA在這一領(lǐng)域同樣是當(dāng)之無愧的領(lǐng)導(dǎo)者。NVIDIA已經(jīng)為會(huì)話式AI服務(wù)提供了經(jīng)過優(yōu)化的參照設(shè)計(jì),比如自動(dòng)語音識(shí)別、文本-語言轉(zhuǎn)換和自然語言理解等。NVIDIA們的BERT、GNMT和Jasper等AI模型開源優(yōu)化幫助開發(fā)者實(shí)現(xiàn)頂尖推理性能。NVIDIA的客戶和合作伙伴中包括有會(huì)話式AI領(lǐng)域的一流公司,比如Kensho、微軟、Nuance、Optum等。
最后要補(bǔ)充的是,MLPerf小組已經(jīng)開始致力于改進(jìn)其當(dāng)前的0.5推理測(cè)試。NVIDIA將努力在基準(zhǔn)測(cè)試中繼續(xù)發(fā)揮領(lǐng)導(dǎo)作用。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
gpu
+關(guān)注
關(guān)注
28文章
4789瀏覽量
129442 -
人工智能
+關(guān)注
關(guān)注
1796文章
47814瀏覽量
240594 -
推理
+關(guān)注
關(guān)注
0文章
8瀏覽量
7276
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
生成式AI推理技術(shù)、市場(chǎng)與未來
OpenAI o1、QwQ-32B-Preview、DeepSeek R1-Lite-Preview的相繼發(fā)布,預(yù)示著生成式AI研究正從預(yù)訓(xùn)練轉(zhuǎn)向推理(Inference),以提升AI
NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)
務(wù)是 NVIDIA NeMo Guardrails 軟件工具系列的一部分。這些可移植且經(jīng)過優(yōu)化的推理微服務(wù)可幫助企業(yè)提高生成式 AI 應(yīng)用的安全性、精準(zhǔn)性
發(fā)表于 01-17 16:29
?84次閱讀
蘇茨克維預(yù)測(cè):推理型AI將帶來不可預(yù)測(cè)性
未來的人工智能將展現(xiàn)出類似人類的推理能力。 蘇茨克維強(qiáng)調(diào),隨著AI推理能力的提升,事情將變得更加難以預(yù)測(cè)。他解釋說,推理能力的增強(qiáng)意味著AI
NVIDIA助力Amdocs打造生成式AI智能體
正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領(lǐng)域適配模型的解決方案。該公司還在使用NVIDIA
NVIDIA助力麗蟾科技打造AI訓(xùn)練與推理加速解決方案
麗蟾科技通過 Leaper 資源管理平臺(tái)集成 NVIDIA AI Enterprise,為企業(yè)和科研機(jī)構(gòu)提供了一套高效、靈活的 AI 訓(xùn)練與推理加速解決方案。無論是在復(fù)雜的
NVIDIA與思科合作打造企業(yè)級(jí)生成式AI基礎(chǔ)設(shè)施
由 NVIDIA 加速計(jì)算平臺(tái)、NVIDIA AI Enterprise 軟件和 NVIDIA NIM 推理微服務(wù)加持的思科 Nexus H
AI普及給嵌入式設(shè)計(jì)人員帶來新挑戰(zhàn)
探討了人工智能(AI)的普及給嵌入式設(shè)計(jì)人員帶來的新挑戰(zhàn)。在創(chuàng)建“邊緣機(jī)器學(xué)習(xí)(ML)”應(yīng)用時(shí),設(shè)計(jì)人員必須確保其能有效運(yùn)行,同時(shí)最大限度地降低處理器和存儲(chǔ)開銷,以及物聯(lián)網(wǎng)(IoT)設(shè)
發(fā)表于 08-22 14:20
?734次閱讀
NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成式AI服務(wù)
NVIDIA近日宣布了一項(xiàng)重大舉措,正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM(NVIDIA Inference
英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)
NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革
同發(fā)布“NVIDIA AI Computing by HPE”。 作為極具開創(chuàng)性的一站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,
NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革
作為極具開創(chuàng)性的一站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA AI Computing by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生
英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM
英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡(jiǎn)化AI模型部署過程,為全球的2800萬英偉達(dá)開發(fā)者提供前所未有的便利。
利用NVIDIA組件提升GPU推理的吞吐
本實(shí)踐中,唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將
使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測(cè)
這家云計(jì)算巨頭的計(jì)算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測(cè)。
評(píng)論