欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過NVIDIA TensorRT加速夸克瀏覽器AI應(yīng)用

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-21 14:14 ? 次閱讀

客戶簡介

? 本案例中通過TensorRT加速夸克瀏覽器視頻圖像相關(guān)模型的預(yù)測性能,比如待上線業(yè)務(wù)的相關(guān)流程整體性能達(dá)不到線上要求,通過對全流程的優(yōu)化以及使用NVIDIA TensorRT加速模型后,最終整體性能由10s級別降到400ms內(nèi),其中模型性能加速1~3倍,顯存占用下降50%。

? 本案例主要應(yīng)用到NVIDIA TensorRT、NVIDIA Nsight Systems

客戶簡介及應(yīng)用背景

夸克瀏覽器是阿里旗下的一個搭載極速AI引擎的高速智能瀏覽器??淇鸵詷O速智能搜索為定位,致力于為用戶提供交互更智能高效、內(nèi)容更專業(yè)權(quán)威的新一代搜索引擎,同時也在產(chǎn)品極致體驗(yàn)上不斷實(shí)現(xiàn)突破。

夸克目前不僅提供極致的搜索體驗(yàn),也在探索以深度學(xué)習(xí)為基礎(chǔ)的AI工具,通過高效的算法效果和全流程的性能優(yōu)化,提供更好的用戶體驗(yàn)。深度學(xué)習(xí)模型在實(shí)際應(yīng)用的過程中,效果遠(yuǎn)好于傳統(tǒng)模型,但由于算法復(fù)雜度過高,預(yù)測性能成為制約模型最終能否上線的核心問題。NVIDIA TensorRT通過計算圖的優(yōu)化、高效Kernel的實(shí)現(xiàn)及更高效硬件的利用加速模型預(yù)測耗時,使預(yù)測速度提升了1~3倍。

客戶挑戰(zhàn)

夸克瀏覽器為用戶提供智能相機(jī)功能,打開夸克APP后,通過相機(jī)入口(如下左圖紅框所示)進(jìn)入智能相機(jī)功能,可以看到智能相機(jī)提供的具體功能(如下右圖所示),包括萬能掃描、學(xué)習(xí)輔導(dǎo)、萬物識別等功能,這些功能對實(shí)時性要求極高,不少功能的底層核心技術(shù)依賴OCR。作為核心一環(huán),OCR需要承接巨大流量,其效果及性能影響整個上層業(yè)務(wù)的用戶體驗(yàn)。

OCR全流程包含檢測、識別等多個模型以及復(fù)雜的前后處理,整體耗時10s級別,耗時過長嚴(yán)重影響用戶體驗(yàn),無法達(dá)到上線要求。主要影響性能的因素有以下三點(diǎn):單個模型占用顯存過大導(dǎo)致全流程無法部署在同一個GPU上,需要在多個GPU上進(jìn)行數(shù)據(jù)傳輸,多GPU部署導(dǎo)致GPU利用率不高;模型本身性能慢,涉及復(fù)雜的檢測和識別模型;全流程中模型前后處理復(fù)雜。

應(yīng)用方案

對比目前性能優(yōu)化方案,夸克選擇了采用NVIDIA TensorRT作為模型優(yōu)化的底層框架對模型進(jìn)行優(yōu)化。TensorRT提供完整端到端模型性能優(yōu)化工具,支持TF和ONNX等相關(guān)框架模型,使用后對模型性能帶來巨大提升。

TensorRT對模型結(jié)構(gòu)進(jìn)行優(yōu)化,使用高效KERNEL實(shí)現(xiàn),并且支持FP16和INT8量化。部分模型通過使用TensorRt后,模型性能有2到3倍的提升,并且顯存降到原來的30%~50%。

有模型在使用FP16精度后,模型效果下降,夸克團(tuán)隊在NVIDIA的工作人員的指導(dǎo)下,通過對模型設(shè)置混合精度后,模型的性能較FP16稍微下降,但是整體效果也達(dá)到要求。

對于部分轉(zhuǎn)TensorRT失敗的模型,我們對模型進(jìn)行分析,把模型耗時的部分單獨(dú)抽取出來,單獨(dú)做模型優(yōu)化。

在使用TensorRT的過程中,通過Nsight Systems發(fā)現(xiàn)TensorRT OP在某些場景性能表現(xiàn)不盡人意,最后在NVIDIA工作人員指導(dǎo)下,通過調(diào)整OP的使用方式解決該問題。

使用效果及影響

通過使用NVIDIA TensorRT,夸克瀏覽器極大地提升了模型性能和降低模型本身顯存占用,提高了GPU的使用率。在對整體流程和模型進(jìn)行優(yōu)化后,全部模型能夠部署在單個GPU上,并且整體耗時在400ms內(nèi)。

夸克技術(shù)人員表示:TensorRT文檔齊全,功能使用方便,用戶能夠以低門檻使用其帶來的優(yōu)化,無需手動編寫復(fù)雜模型轉(zhuǎn)換工具,大大地減少了用戶投入成本。對比其他模型優(yōu)化框架,TensorRT具有更好的通用性、易用性和性能。

通過這次對OCR全流程的性能優(yōu)化,夸克瀏覽器也積累了一套適合內(nèi)部使用的模型性能優(yōu)化方案,在遇到其他模型性能問題時也有的放矢。目前夸克已經(jīng)把TensorRT相關(guān)優(yōu)化工具集成到其瀏覽器的內(nèi)部平臺上,同時應(yīng)用到其他業(yè)務(wù)的模型中,并取得良好的效果。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5080

    瀏覽量

    103826
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4788

    瀏覽量

    129423
收藏 人收藏

    評論

    相關(guān)推薦

    E2000 Speedometer測試瀏覽器性能

    設(shè)計的基準(zhǔn)測試工具,旨在通過模擬用戶交互來測量 Web應(yīng)用的響應(yīng)速度 。其核心目標(biāo)是盡可能真實(shí)地反映現(xiàn)實(shí)世界的Web體驗(yàn)。當(dāng)瀏覽器在Speedometer上的得分提升時,實(shí)際用戶的體驗(yàn)也應(yīng)得到改善
    發(fā)表于 01-10 21:33

    訊飛星火瀏覽器插件全新升級

    時刻陪伴,星火插件讓你的瀏覽器變成真正的生產(chǎn)力工具。
    的頭像 發(fā)表于 12-25 09:48 ?340次閱讀

    AWTK 最新動態(tài):支持瀏覽器控件

    導(dǎo)讀AWTK瀏覽器控件,基于webview項(xiàng)目實(shí)現(xiàn),將瀏覽器嵌入到AWTK應(yīng)用程序中,讓開發(fā)者可以方便的集成在線幫助和調(diào)用地圖等功能。awtk-widget-web-view是基于webview實(shí)現(xiàn)的AWTK瀏覽器控件,使得AW
    的頭像 發(fā)表于 11-20 01:05 ?286次閱讀
    AWTK 最新動態(tài):支持<b class='flag-5'>瀏覽器</b>控件

    寫一個Chrome瀏覽器插件

    一、什么是瀏覽器插件 瀏覽器插件是依附于瀏覽器,用來拓展網(wǎng)頁能力的程序。插件具有監(jiān)聽瀏覽器事件、獲取和修改網(wǎng)頁元素、攔截網(wǎng)絡(luò)請求、添加快捷菜單等功能。使用
    的頭像 發(fā)表于 11-18 17:12 ?519次閱讀
    寫一個Chrome<b class='flag-5'>瀏覽器</b>插件

    跨域問題是由瀏覽器的同源策略造成的

    瀏覽器
    jf_62215197
    發(fā)布于 :2024年08月27日 07:51:42

    不只是前端,后端、產(chǎn)品和測試也需要了解的瀏覽器知識(二)

    繼上篇《 不只是前端,后端、產(chǎn)品和測試也需要了解的瀏覽器知識(一)》介紹了瀏覽器的基本情況、發(fā)展歷史以及市場占有率。 本篇文章將介紹瀏覽器基本原理。 在掌握基本原理后,通過技術(shù)深入,在
    的頭像 發(fā)表于 08-12 14:32 ?406次閱讀
    不只是前端,后端、產(chǎn)品和測試也需要了解的<b class='flag-5'>瀏覽器</b>知識(二)

    谷歌Chrome瀏覽器新增三大AI功能,提升用戶體驗(yàn)

    谷歌近日宣布,在其廣受歡迎的Chrome瀏覽器中引入了三項(xiàng)前沿的AI技術(shù)功能,旨在為用戶提供更加智能、便捷的瀏覽體驗(yàn)。這些新功能由Gemini技術(shù)強(qiáng)力驅(qū)動,目前已在Chrome桌面版上線,標(biāo)志著谷歌在
    的頭像 發(fā)表于 08-05 11:26 ?760次閱讀

    不只是前端,后端、產(chǎn)品和測試也需要了解的瀏覽器知識

    一、我們?yōu)槭裁匆私?b class='flag-5'>瀏覽器? 1. 對于前端開發(fā)者 1.瀏覽器是用戶體驗(yàn)的第一線。我們需要了解瀏覽器的工作原理,才能有效地設(shè)計和實(shí)現(xiàn)用戶界面,確保良好的用戶體驗(yàn)。 2.好的產(chǎn)品需要考慮瀏覽器
    的頭像 發(fā)表于 07-01 18:03 ?524次閱讀
    不只是前端,后端、產(chǎn)品和測試也需要了解的<b class='flag-5'>瀏覽器</b>知識

    Opera瀏覽器引領(lǐng)潮流,全球首接端側(cè)AI大模型

    昆侖萬維旗下海外平臺Opera宣布,其旗艦瀏覽器Opera One和游戲瀏覽器Opera GX將正式接入端側(cè)AI大模型,成為全球首個實(shí)現(xiàn)這一突破的主流瀏覽器。
    的頭像 發(fā)表于 06-03 09:18 ?803次閱讀

    Opera聯(lián)手谷歌云,搭載Gemini大模型,助力瀏覽器AI助手Aria圖像升級

    據(jù)悉,Aria 是 Opera 原生瀏覽器內(nèi)置的 AI 助手,由 Opera multi-LLM Composer AI 引擎驅(qū)動,支持用戶根據(jù)需求選用不同的大模型。
    的頭像 發(fā)表于 05-30 11:50 ?493次閱讀

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM
    的頭像 發(fā)表于 04-28 10:36 ?648次閱讀

    Edge瀏覽器關(guān)閉Microsoft Rewards擴(kuò)展原因揭曉

    據(jù)報道,近期德國等地的Microsoft Edge瀏覽器用戶發(fā)現(xiàn),安裝或啟動Microsoft Rewards擴(kuò)展后,會出現(xiàn)“右上角擴(kuò)展被Edge瀏覽器禁用以保障您的瀏覽器安全”的提醒窗口。
    的頭像 發(fā)表于 04-10 09:55 ?939次閱讀

    鴻蒙實(shí)戰(zhàn)開發(fā):【瀏覽器制作】

    使用[@ohos.systemparameter]接口和[Web組件]展示了一個瀏覽器的基本功能,展示網(wǎng)頁,根據(jù)頁面歷史棧前進(jìn)回退等。
    的頭像 發(fā)表于 03-19 17:47 ?658次閱讀
    鴻蒙實(shí)戰(zhàn)開發(fā):【<b class='flag-5'>瀏覽器</b>制作】

    使用NVIDIA Triton推理服務(wù)加速AI預(yù)測

    這家云計算巨頭的計算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)加速 AI 預(yù)測。
    的頭像 發(fā)表于 02-29 14:04 ?637次閱讀

    如何通過瀏覽器訪問Web頁面進(jìn)行固件更新的方法?

    如果電腦沒有安裝 TIA PORTAL 軟件,但是 CPU 之前激活了 Web 服務(wù)功能,可以通過電腦聯(lián)網(wǎng) CPU,然后打開瀏覽器瀏覽到 CPU 的方式進(jìn)行固件更新。
    的頭像 發(fā)表于 02-25 14:51 ?1865次閱讀