国产寡偷妇婬乱a毛片视频中文,国产日韩欧美高清不卡

騰訊云計(jì)算加速套件 TACO Kit 包含 TACO Train 和 TACO Infer 兩個(gè) AI 組件。基于 GPU 異構(gòu)計(jì)算平臺(tái)針對(duì)業(yè)界 AI 訓(xùn)練和推理任務(wù)進(jìn)行了全方位的加速優(yōu)化。TACO Kit 不僅大大提升了 GPU 集群上多機(jī)多卡分布式訓(xùn)練的效率，對(duì)于 GPU 上的模型推理也通過集成 NVIDIA TensorRT 帶來了顯著加速。雙方團(tuán)隊(duì)就 GPU 推理加速這一話題將進(jìn)行持續(xù)深入的合作，推出定制化的優(yōu)化方案，為業(yè)界客戶帶來顯著的性能收益。

騰訊云計(jì)算加速套件TACO Kit（Tencent Cloud Accelerated Computing Optimization Kit）是一種異構(gòu)計(jì)算加速軟件服務(wù)，具備領(lǐng)先的 GPU 共享技術(shù)和業(yè)界唯一的 GPU 在離線混部能力，搭配騰訊自研的軟硬件協(xié)同優(yōu)化組件和硬件廠商特有優(yōu)化方案，支持物理機(jī)、云服務(wù)器、容器等產(chǎn)品的計(jì)算加速、圖形渲染、視頻轉(zhuǎn)碼各個(gè)應(yīng)用場(chǎng)景，幫助用戶實(shí)現(xiàn)全方位全場(chǎng)景的降本增效。

其中，AI 加速引擎 TACO Train 和 TACO Infer 是騰訊云虛擬化團(tuán)隊(duì)依托云帆團(tuán)隊(duì)，立足于騰訊內(nèi)部豐富的 AI 業(yè)務(wù)場(chǎng)景，深耕訓(xùn)練框架優(yōu)化、分布式框架優(yōu)化、網(wǎng)絡(luò)通信優(yōu)化、推理性能優(yōu)化等關(guān)鍵技術(shù)，攜手打造的一整套 AI 加速方案。為了更好的服務(wù)用戶，騰訊云決定將內(nèi)部深度優(yōu)化的加速方案免費(fèi)提供給公有云用戶，助力廣大用戶提高 AI 產(chǎn)品迭代效率。

無論對(duì)于 AI 訓(xùn)練或 AI 推理，如何有效提升 AI 任務(wù)的性能，節(jié)省硬件資源成本，是業(yè)界持續(xù)追求的目標(biāo)。在訓(xùn)練方面，隨著 AI 模型規(guī)模的擴(kuò)大及訓(xùn)練數(shù)據(jù)的增多，用戶對(duì)模型的迭代效率要求也隨之增長(zhǎng)，單個(gè) GPU 的算力已無法滿足大部分業(yè)務(wù)場(chǎng)景，使用單機(jī)多卡或多機(jī)多卡訓(xùn)練已成為趨勢(shì)。但用戶在部署分布式訓(xùn)練系統(tǒng)時(shí)，時(shí)常面臨著難以充分利用 GPU 資源、訓(xùn)練效率低下的問題，而分布式訓(xùn)練性能調(diào)優(yōu)卻是需要同時(shí)進(jìn)行通信優(yōu)化、計(jì)算優(yōu)化的極其復(fù)雜的問題。

在推理方面，對(duì)多種多樣的工作負(fù)載進(jìn)行推理加速也是業(yè)界共同的需求。這需要考慮如何對(duì)不同框架訓(xùn)練的模型進(jìn)行統(tǒng)一的高效部署；如何整合各類加速軟件和技術(shù)，對(duì)接不同模型和業(yè)務(wù)場(chǎng)景。

在訓(xùn)練方面，TACO Train 推出 Tencent TensorFlow（以下簡(jiǎn)稱 TTF）, 針對(duì)特定業(yè)務(wù)場(chǎng)景的 XLA，Grappler 圖優(yōu)化，以及自適應(yīng)編譯框架解決冗余編譯的問題，并對(duì) TensorFlow 1.15 添加了對(duì)CUDA 11的支持，讓用戶可以使用NVIDIA A100 Tensor Core GPU來進(jìn)行模型訓(xùn)練。另外，TACO Train 推出 LightCC 這一基于 Horovod 深度優(yōu)化的分布式訓(xùn)練框架，在保留了原生 Horovod 的易用性上，增加了性能更好的通信方式。相比 Horovod，LightCC 能夠?qū)?2D AllReduce 充分利用通信帶寬；在 GPU 上訓(xùn)練時(shí)提供高效的梯度融合方式；并使用 TOPK 壓縮通信，降低通信量，提高傳輸效率。最后，騰訊云自研了用戶態(tài)網(wǎng)絡(luò)協(xié)議棧 HARP，可以通過 Plug-in 的方式集成到NVIDIA NCCL中，無需任何業(yè)務(wù)改動(dòng)，加速云上分布式訓(xùn)練性能，從而解決了目前普遍使用的內(nèi)核網(wǎng)絡(luò)協(xié)議棧存在著一些必要的開銷導(dǎo)致其不能很好地利用高速網(wǎng)絡(luò)設(shè)備的問題。

在推理方面，TACO Infer 通過跨平臺(tái)統(tǒng)一的優(yōu)化接口賦能用戶，讓渴望加速計(jì)算的用戶輕松駕馭騰訊云上豐富的異構(gòu)算力。TACO Infer 針對(duì) GPU 推理任務(wù)，集成了NVIDIA TensorRT，利用其極致的模型優(yōu)化能力，使推理過程能夠達(dá)到令人滿意的性能。此外，TACO 也將自定義的高性能 kernel 實(shí)現(xiàn)與TensorRT相結(jié)合，極大地提升用戶的推理效率。

TACO Kit 針對(duì) GPU 的訓(xùn)練優(yōu)化，為諸多業(yè)務(wù)帶來了顯著的性能提升。在某電商平臺(tái)推薦業(yè)務(wù)Wide & Deep 模型訓(xùn)練任務(wù)中，TACO Train 提供的方案通過定制化高性能 GPU 算子，使延遲從 14.3ms 下降至 2.8ms；整體訓(xùn)練性能提升 43%，成本下降 11%；在另一電商推薦場(chǎng)景 MMoE 模型的訓(xùn)練任務(wù)中，TACO Train 提供的訓(xùn)練方案，在NVIDIA V100 Tensor Core GPU集群上，使計(jì)算速度性價(jià)比相比于 CPU 集群提升了 3.2 倍，收斂速度性價(jià)比相比于 CPU 集群提升了 24.3 倍。

目前，騰訊云 TACO Kit 與 NVIDIA 雙方團(tuán)隊(duì)仍持續(xù)為 AI 推理加速進(jìn)行合作。未來也將針對(duì)一些常見的業(yè)務(wù)模型，圍繞TensorRT進(jìn)行聯(lián)合優(yōu)化，將模型推理的性能推向更高的水準(zhǔn)，為業(yè)界有推理加速需求的客戶提供一站式的優(yōu)化方案。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5080

瀏覽量
103822
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4786

瀏覽量
129410
AI

AI

+關(guān)注

關(guān)注
87

文章
31685

瀏覽量
270485
騰訊云

騰訊云

+關(guān)注

關(guān)注
0

文章
217

瀏覽量
16846

原文標(biāo)題：騰訊云與 NVIDIA 深度合作，打造計(jì)算加速套件 TACO Kit 加速 GPU AI 計(jì)算全鏈路

文章出處：【微信號(hào)：NVIDIA_China，微信公眾號(hào)：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

使用NVIDIA推理平臺(tái)提高AI推理性能

NVIDIA推理平臺(tái)提高了 AI 推理性能，為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。

發(fā)表于 02-08 09:59 ?196次閱讀

使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺(tái)提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

騰訊申請(qǐng)注冊(cè)“騰訊云AI代碼助手”商標(biāo)

致力于提升編程效率的智能工具。其主要功能包括代碼的智能補(bǔ)全和自動(dòng)生成，旨在幫助開發(fā)者更加高效地進(jìn)行編程工作。這款工具的出現(xiàn)，標(biāo)志著騰訊在人工智能和云計(jì)算領(lǐng)域的技術(shù)實(shí)力得到了進(jìn)一步的提升。值得注意的是，

發(fā)表于 12-13 10:28 ?358次閱讀

NVIDIA與軟銀集團(tuán)合作加速日本主權(quán)AI計(jì)劃

NVIDIA 宣布與軟銀集團(tuán)開展一系列合作，旨在加速日本主權(quán) AI 計(jì)劃，并進(jìn)一步提升日本在全球的技術(shù)領(lǐng)先優(yōu)勢(shì)，同時(shí)為全球電信運(yùn)營(yíng)商開辟數(shù)十

發(fā)表于 11-19 15:49 ?401次閱讀

印尼GOTO、騰訊云與阿里云簽署合作協(xié)議

近日，印尼知名科技公司GOTO與中國(guó)的騰訊云、阿里云正式簽署了合作協(xié)議。此次攜手合作，旨在共同推動(dòng)印尼數(shù)字經(jīng)濟(jì)的發(fā)展，

發(fā)表于 11-11 14:32 ?378次閱讀

NVIDIA助力麗蟾科技打造AI訓(xùn)練與推理加速解決方案

麗蟾科技通過 Leaper 資源管理平臺(tái)集成 NVIDIA AI Enterprise，為企業(yè)和科研機(jī)構(gòu)提供了一套高效、靈活的 AI 訓(xùn)練與推理

發(fā)表于 10-27 10:03 ?322次閱讀

NVIDIA與思科合作打造企業(yè)級(jí)生成式AI基礎(chǔ)設(shè)施

由 NVIDIA 加速計(jì)算平臺(tái)、NVIDIA AI Enterprise 軟件和 NVIDIA NIM

發(fā)表于 10-10 09:35 ?435次閱讀

英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理微服務(wù)，與同樣剛推出的 Llama 3.1

發(fā)表于 07-25 09:48 ?796次閱讀

HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 變革

by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生命周期服務(wù)，將簡(jiǎn)化 AI 創(chuàng)造價(jià)值的過程，加速生成式 AI 的發(fā)展步伐。

發(fā)表于 06-21 14:39 ?428次閱讀

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

作為極具開創(chuàng)性的一站式“交鑰匙”私有云人工智能（private-cloud AI）解決方案，NVIDIA AI Computing by HPE 包含了可

發(fā)表于 06-20 17:36 ?789次閱讀

英特爾助力京東云用CPU加速AI推理，以大模型構(gòu)建數(shù)智化供應(yīng)鏈

英特爾助力京東云用CPU加速AI推理，以大模型構(gòu)建數(shù)智化供應(yīng)鏈

發(fā)表于 05-27 11:50 ?601次閱讀

研華與英偉達(dá)深化合作，成為NVIDIA AI Enterprise軟件全球分銷商

）的軟件平臺(tái)。近日發(fā)布的NVIDIA AI Enterprise 5.0將為用戶提供一系列微服務(wù)，其中包括NVIDIA NIM。這是一套用于對(duì)二十多種流行的AI模型

發(fā)表于 05-07 11:21 ?429次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實(shí)踐中，唯品會(huì) AI 平臺(tái)與 NVIDIA 團(tuán)隊(duì)合作，結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin Hierarc

發(fā)表于 04-20 09:39 ?829次閱讀

NVIDIA和谷歌云宣布開展一項(xiàng)新的合作，加速AI開發(fā)

NVIDIA 和谷歌云宣布開展一項(xiàng)新的合作，以幫助全球初創(chuàng)企業(yè)加速創(chuàng)建生成式 AI 應(yīng)用和服務(wù)。

發(fā)表于 04-11 14:03 ?570次閱讀

SAP與NVIDIA攜手加速生成式AI在企業(yè)應(yīng)用中的普及

SAP SE 和 NVIDIA 宣布深化合作，致力于加速企業(yè)客戶在 SAP 云解決方案和應(yīng)用組合中利用數(shù)據(jù)和生成式 AI 的變革力量。

發(fā)表于 03-22 10:02 ?681次閱讀

使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測(cè)

這家云計(jì)算巨頭的計(jì)算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測(cè)。

發(fā)表于 02-29 14:04 ?636次閱讀

欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

搜索歷史

騰訊云與NVIDIA仍持續(xù)為AI推理加速進(jìn)行合作

評(píng)論

使用NVIDIA推理平臺(tái)提高AI推理性能

騰訊申請(qǐng)注冊(cè)“騰訊云AI代碼助手”商標(biāo)

NVIDIA與軟銀集團(tuán)合作加速日本主權(quán)AI計(jì)劃

印尼GOTO、騰訊云與阿里云簽署合作協(xié)議

NVIDIA助力麗蟾科技打造AI訓(xùn)練與推理加速解決方案

NVIDIA與思科合作打造企業(yè)級(jí)生成式AI基礎(chǔ)設(shè)施

英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 變革

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

英特爾助力京東云用CPU加速AI推理，以大模型構(gòu)建數(shù)智化供應(yīng)鏈

研華與英偉達(dá)深化合作，成為NVIDIA AI Enterprise軟件全球分銷商

利用NVIDIA組件提升GPU推理的吞吐

NVIDIA和谷歌云宣布開展一項(xiàng)新的合作，加速AI開發(fā)

SAP與NVIDIA攜手加速生成式AI在企業(yè)應(yīng)用中的普及

使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測(cè)