Amazon、Microsoft、Snap 和日本電信電話株式會(huì)社部署 NVIDIA AI;NVIDIA Riva 和 Merlin 正式全面上線;NVIDIA AI Enterprise 2.0 支持所有主要數(shù)據(jù)中心和云平臺(tái);NVIDIA AI 加速計(jì)劃啟動(dòng)
加利福尼亞州圣克拉拉市 —— GTC —— 太平洋時(shí)間 2022 年 3 月 22 日 —— NVIDIA 今日發(fā)布 NVIDIA AI 平臺(tái)的多項(xiàng)重要更新。該平臺(tái)是一套致力于推進(jìn)語(yǔ)音、推薦系統(tǒng)、超大規(guī)模推理等工作負(fù)載的軟件套件,目前已被 Amazon, Microsoft, Snap 和日本電信電話株式會(huì)社等全球行業(yè)領(lǐng)導(dǎo)者所采用。
NVIDIA 也宣布了 NVIDIA? AI 加速計(jì)劃,以助力確保 NVIDIA 軟件和解決方案合作伙伴所開發(fā) AI 應(yīng)用的性能和可靠性。該計(jì)劃針對(duì)各種經(jīng)過驗(yàn)證的 AI 加速應(yīng)用增加了可見性,使企業(yè)客戶能夠放心地在 NVIDIA AI 平臺(tái)上進(jìn)行部署。Adobe、紅帽(Red Hat)和 VMware 等 100 多家合作伙伴參與了計(jì)劃啟動(dòng)儀式。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示: “NVIDIA AI 可定義為全球 AI 社區(qū)的軟件工具箱,從 AI 研究者和數(shù)據(jù)科學(xué)家們,到數(shù)據(jù)和機(jī)器學(xué)習(xí)的運(yùn)營(yíng)團(tuán)隊(duì)。NVIDIA 在 GTC 2022上有著大量的新發(fā)布。無論是創(chuàng)建互動(dòng)能力更強(qiáng)的聊天機(jī)器人和虛擬助手,還是構(gòu)建更加智能的推薦系統(tǒng)來幫助消費(fèi)者做出更完善的購(gòu)買決策,亦或是以最大的規(guī)模編排 AI 服務(wù),NVIDIA AI 始終能夠針對(duì)您的需求提供強(qiáng)大的助力。”
NVIDIA AI 可供開發(fā)者免費(fèi)使用,包括用于語(yǔ)音 AI 的 NVIDIA Riva 和用于智能推薦系統(tǒng)的 NVIDIA Merlin?,這兩款軟件均已正式全面上線。而整個(gè)軟件套件也進(jìn)行了更新,包括 NVIDIA Triton、NeMo、Maxine 和 TAO 工具包等工具。
此外,NVIDIA AI Enterprise 2.0 現(xiàn)已經(jīng)過優(yōu)化和認(rèn)證,并支持所有主要的數(shù)據(jù)中心和云平臺(tái),包括裸金屬服務(wù)器、虛擬化基礎(chǔ)設(shè)施和純 CPU 系統(tǒng)。該套件現(xiàn)在支持 Red Hat OpenShift 和 VMware vSphere with Tanzu。
用于構(gòu)建領(lǐng)先AI應(yīng)用的軟件工具
NVIDIA AI 是由多項(xiàng)具有關(guān)鍵功能的 SDK 和工具所組成,可用于跨多個(gè)節(jié)點(diǎn)上對(duì) AI 工作負(fù)載進(jìn)行快速部署、管理和擴(kuò)展,為復(fù)雜的訓(xùn)練和機(jī)器學(xué)習(xí)工作負(fù)載提供有力的支持。它包含以下軟件和工具:
● NVIDIA Triton? :NVIDIA Triton 是一款多功能開源超大規(guī)模模型推理解決方案。其最新版本包含三項(xiàng)關(guān)鍵更新:用于加速部署優(yōu)化模型的模型導(dǎo)航器、用于在 Kubernetes 中進(jìn)行高效擴(kuò)展的管理服務(wù),以及能夠?qū)跇涞哪P瓦M(jìn)行推理的森林推理庫(kù),其具有可解釋性,可在每個(gè)應(yīng)用中實(shí)現(xiàn)快速、經(jīng)過優(yōu)化和可擴(kuò)展的AI。
● NVIDIA Riva 2.0:這款領(lǐng)先的語(yǔ)音 AI SDK 包含具有領(lǐng)先識(shí)別率的預(yù)訓(xùn)練模型,使開發(fā)者能夠?yàn)槠湫袠I(yè)定制實(shí)時(shí)語(yǔ)音AI應(yīng)用程序,其準(zhǔn)確率比普通服務(wù)高 2 倍。Riva 2.0 包含 7 種語(yǔ)言的語(yǔ)音識(shí)別、基于深度學(xué)習(xí)仿真人發(fā)音的語(yǔ)音合成(包括男聲和女聲)以及可通過 NVIDIA TAO 工具包進(jìn)行的自定義調(diào)優(yōu)。NVIDIA 還發(fā)布了涵蓋企業(yè)級(jí)支持的付費(fèi)產(chǎn)品 NVIDIA Riva Enterprise。
● NVIDIA NeMo Megatron 0.9:NeMo Megatron 是一個(gè)用于訓(xùn)練大型語(yǔ)言模型(LLM)的框架。研究者和企業(yè)能夠用它來訓(xùn)練模型,使模型能夠收斂和擴(kuò)展至數(shù)萬億個(gè)參數(shù),以便用于對(duì)話式 AI、推薦系統(tǒng)和基因組學(xué)等應(yīng)用。其最新版本中新增的優(yōu)化和方法能夠縮短端到端開發(fā)和訓(xùn)練時(shí)間,并添加對(duì)云端訓(xùn)練的支持。NVIDIA 加速計(jì)算 LLM 的早期用戶包括京東、AI Sweden、Naver 和佛羅里達(dá)大學(xué)。
● NVIDIA Merlin 1.0:這是一個(gè)加速端到端推薦 AI 框架,用于大規(guī)模構(gòu)建高性能推薦系統(tǒng)。它包含兩個(gè)新庫(kù):Merlin Models 和 Merlin Systems。這些庫(kù)使數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師能夠確定哪些功能和模型最適合他們的應(yīng)用場(chǎng)景,并將推薦系統(tǒng)流水線部署為微服務(wù)。
● NVIDIA Maxine:這個(gè)音頻和視頻質(zhì)量增強(qiáng) SDK 使用 AI 重塑實(shí)時(shí)通信,并引入回聲消除和音頻超分辨率。這兩項(xiàng)新功能能夠提高音頻質(zhì)量,帶來更清晰的通信體驗(yàn)。
NVIDIA AI 深受客戶的歡迎
各個(gè)行業(yè)的領(lǐng)導(dǎo)者正在使用 NVIDIA AI 來提高成本效益、打造更具吸引力的客戶體驗(yàn)并優(yōu)化 AI 應(yīng)用的功能。
Snap 對(duì)話式 AI 負(fù)責(zé)人 Alan Bekker 表示:“在 Snapchat 上,我們的社區(qū)每天使用 Lenses 超過 60 億次。Snap 正在使用 NVIDIA Riva 來優(yōu)化基于 AI 的語(yǔ)音功能,并將這些功能提供給 Lens Studio 創(chuàng)作者,助力其打造新一代高質(zhì)量 AR 體驗(yàn)?!?/p>
微軟技術(shù)研究員兼 Azure AI 首席技術(shù)官黃學(xué)東表示:“Microsoft Azure 認(rèn)知服務(wù) Translator 中的文件翻譯功能,能夠在翻譯文件時(shí)保留源文件的格式和結(jié)構(gòu),提高企業(yè)與客戶的互動(dòng)效率。通過 NVIDIA Triton,我們能夠部署最新的 Z-Code 模型,在保證低延遲的前提下大幅提高文檔翻譯質(zhì)量,為用戶提供一流的翻譯服務(wù)。”
NVIDIA AI Enterprise 支持跨數(shù)據(jù)中心和云的容器化 AI
作為一款端到端、云原生的 AI 和數(shù)據(jù)分析工具與框架套件,NVIDIA AI Enterprise 2.0 軟件套件能夠加速各個(gè)行業(yè)的 AI 開發(fā)和部署。Red Hat OpenShift 是領(lǐng)先的企業(yè)級(jí) Kubernetes 平臺(tái),獲得 Red Hat OpenShift 認(rèn)證的客戶能夠通過 VMware vSphere 使用容器化機(jī)器學(xué)習(xí)工具,更輕松地在裸金屬或虛擬化系統(tǒng)上構(gòu)建、擴(kuò)展和共享模型。
紅帽合作伙伴生態(tài)系統(tǒng)部門高級(jí)副總裁 Stefanie Chiras 表示:“NVIDIA AI Enterprise 已獲得 Red Hat OpenShift 認(rèn)證,并且 OpenShift 已在 NVIDIA LaunchPad 上線,因此用戶可以同時(shí)獲得頂尖的 AI 開發(fā)工具以及具有一致性的混合云基礎(chǔ)?,F(xiàn)在,IT 團(tuán)隊(duì)和數(shù)據(jù)科學(xué)家可以在 Red Hat OpenShift 上構(gòu)建并管理 NVIDIA AI,幫助企業(yè)加快實(shí)際生產(chǎn)中的智能應(yīng)用交付速度?!?/p>
NVIDIA AI Enterprise 2.0 還引入了更多支持訓(xùn)練和推理的 NVIDIA AI 軟件容器。對(duì) NVIDIA TAO 工具包的支持使企業(yè)開發(fā)者能夠?qū)?NVIDIA 預(yù)訓(xùn)練 AI 模型進(jìn)行微調(diào)和優(yōu)化,從而簡(jiǎn)化自定義生產(chǎn)就緒模型的創(chuàng)建,而無需具備 AI 專業(yè)知識(shí)或大量訓(xùn)練數(shù)據(jù)。該軟件套件還包含最新發(fā)布的 NVIDIA Triton 推理服務(wù)器。
日本電信電話株式會(huì)社是日本電信電話集團(tuán)旗下的全球領(lǐng)先信息和通信技術(shù)解決方案提供商。該公司已采用 NVIDIA AI Enterprise 來助力研發(fā)團(tuán)隊(duì)加速構(gòu)建自然語(yǔ)言處理(NLP)和智能視頻分析應(yīng)用。
日本電信電話株式會(huì)社創(chuàng)新中心技術(shù)部總監(jiān) Shoichiro Henmi 表示:“我們的許多應(yīng)用開發(fā)者現(xiàn)在都在使用加速計(jì)算,并有賴于內(nèi)部基礎(chǔ)設(shè)施來提供易于使用且具有高成本效益的 GPU 環(huán)境。我們認(rèn)為 NVIDIA AI Enterprise 是作為支持 AI 平臺(tái)的理想解決方案,它將為我們?cè)?VMware vSphere、Kubernetes 和云基礎(chǔ)設(shè)施中的大規(guī)模開發(fā)工作提供支持。”
客戶可以授權(quán) NVIDIA AI Enterprise 在 NVIDIA 認(rèn)證系統(tǒng)(NVIDIA-Certified Systems?)上運(yùn)行,也可以在沒有 NVIDIA GPU 的相同型號(hào)服務(wù)器上運(yùn)行,包括來自思科、戴爾科技、新華三、慧與(HPE)、浪潮、聯(lián)想、寧暢和超微等領(lǐng)先制造商的服務(wù)器。
企業(yè)還可以選擇在托管于全球各地 Equinix International Business Exchange?(IBX? )數(shù)據(jù)中心的服務(wù)器上進(jìn)行部署?,F(xiàn)已支持來自 AWS、谷歌云和 Microsoft Azure 的云實(shí)例。NVIDIA AI Enterprise 現(xiàn)已包含于 NVIDIA DGX 系統(tǒng)中。
供貨情況
作為 NVIDIA 開發(fā)者計(jì)劃的一部分,開發(fā)者均可使用 NVIDIA 的 AI 軟件集。
評(píng)論