欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用Ryzen ? AI處理器構(gòu)建聊天機(jī)器人

eeDesigner ? 來源:11 ? 作者:11 ? 2024-05-11 14:22 ? 次閱讀

人工智能處理器和軟件將個人計算的強(qiáng)大功能帶到人工智能PC上,將工作、協(xié)作和創(chuàng)新的效率提升到一個全新的水平。生成式AI應(yīng)用程序(如AI聊天機(jī)器人)由于高處理要求而存在于云中。在這篇博客中,我們將探索Ryzen ? AI技術(shù)的構(gòu)建模塊,并展示利用它來構(gòu)建一個僅在Ryzen AI筆記本電腦上以最佳性能運行的AI聊天機(jī)器人是多么容易。

全棧Ryzen? AI軟件

Ryzen AI配備了一個專用的神經(jīng)處理單元(NPU),用于與CPU內(nèi)核集成在片上的AI加速。AMD Ryzen AI軟件開發(fā)工具包(SDK)使開發(fā)人員能夠采用在PyTorch或TensorFlow中訓(xùn)練的機(jī)器學(xué)習(xí)模型,并在由Ryzen AI支持的PC上運行它們,可以智能地優(yōu)化任務(wù)和工作負(fù)載,釋放CPU和GPU資源,并以更低的功耗確保最佳性能。了解更多關(guān)于Ryzen AI產(chǎn)品信息。

SDK包括用于在NPU上優(yōu)化和部署AI推理的工具和運行時庫。安裝很簡單,該套件配備了各種預(yù)量化的準(zhǔn)備部署模型的擁抱臉AMD模型動物園。開發(fā)人員可以在幾分鐘內(nèi)開始構(gòu)建他們的應(yīng)用程序,在Ryzen AI PC上釋放AI加速的全部潛力。

構(gòu)建AI Chatbot

人工智能聊天機(jī)器人需要大量的處理能力,以至于它們通常生活在云中。nbsp;實際上,我們可以在PC上運行ChatGPT,但是本地應(yīng)用程序通過Internet將提示發(fā)送到服務(wù)器進(jìn)行LLM模型處理,并在收到響應(yīng)后簡單地顯示響應(yīng)。

然而,在這種情況下,本地和高效的AI聊天機(jī)器人不需要云支持。您可以從Hugging Face下載一個開源的預(yù)訓(xùn)練OPT1.3B模型,并通過一個簡單的三步過程將其部署在Ryzen AI筆記本電腦上,并使用預(yù)構(gòu)建的Gradio Chatbot應(yīng)用程序。

步驟1:從Hugging Face下載預(yù)訓(xùn)練的opt-1.3b模型

步驟2:量化從FP32到INT 8的下載模型

步驟3:使用模型部署Chatbot應(yīng)用程序

先決條件

首先,您需要確保滿足以下先決條件。

AMD銳龍AI筆記本電腦與Windows?(R) 11個操作系統(tǒng)

Anaconda,如果需要,請從 這里

最新的Ryzen AI AIE驅(qū)動程序和軟件。遵循簡單的單擊安裝 這里

本博客的輔助材料發(fā)布在AMD GitHub存儲庫中。

接下來,克隆存儲庫或下載并解壓縮Chatbot-with-RyzenAI-1.0.zip到安裝Ryzen AI SW的根目錄中。在本例中,它是C:UserahoqRyzenAI

cd C:UsersahoqRyzenAI

git clone alimulh/Chatbot-with-RyzenAI-1.0

#激活安裝RyzenAI時創(chuàng)建的conda環(huán)境。在我的情況下,它是ryzenai-1.0-20231204-120522

Conda activate Ryzenai-1.0-20231204-120522

#使用requirements.txt文件安裝gradio pkage。聊天機(jī)器人的瀏覽器應(yīng)用程序是用Gradio創(chuàng)建的

pip安裝-r要求. txt

#初始化路徑

setup.bat

現(xiàn)在,您可以通過3個步驟創(chuàng)建聊天機(jī)器人:

Step-1從Hugging Face下載預(yù)訓(xùn)練模型

在此步驟中,從Hugging Face下載預(yù)訓(xùn)練的Opt-1.3b模型。您可以修改run.py腳本,從您自己或您公司的存儲庫下載預(yù)訓(xùn)練模型。Opt-1.3b是一個大的,~4GB的模型。下載時間取決于網(wǎng)速。在這種情況下,它花了~6分鐘。

cd Chatbot-with-RyzenAI-1.0

python run.py--model_name opt-1.3b --下載

下載的模型保存在文件夾opt-1.3b_pretrained_fp32中,如下所示。

wKgZomY_DnuATA7kAADsZxyjT_M334.jpg

步驟2量化下載的模型從FP32到Int8

下載完成后,我們使用以下命令對模型進(jìn)行重新配置:

python run.py--model_name opt-1.3b-python

量化是一個兩步的過程。首先,F(xiàn)P32模型是“平滑量化”的,以減少量化過程中的精度損失。它本質(zhì)上是識別激活系數(shù)中的異常值并相應(yīng)地調(diào)節(jié)權(quán)重。因此,在量化期間,如果離群值被丟棄,則誤差引入是可忽略的。Smooth Quant是由AMD的先驅(qū)研究人員之一Song Han博士發(fā)明的,他是麻省理工學(xué)院EECS系的教授。下面是平滑量化技術(shù)如何工作的可視化演示。

wKgaomY_Dn2AOJmUAAEw7FyurAE541.jpg

你可以在這里了解更多關(guān)于平滑量化(smoothquant)技術(shù)的信息。在平滑建模過程之后,條件模型沿著與mart.json文件一起保存在opt-1.3b_smoothquant文件夾的“model_onnx”文件夾中。以下是平滑量化對數(shù)的屏幕截圖:

wKgaomY_DoCAPSzPAADVHa0erGo345.jpg

平滑量化需要約30秒才能完成。一旦完成,最佳量化器用于將模型轉(zhuǎn)換為int 8。int 8量化模型然后保存在“opt-1.3b_smoothquant "文件夾內(nèi)的”model_onnx_int8“文件夾中。量化是一個離線過程。大約需要2-3分鐘完成,需要一次完成。下面是Int 8量化日志的屏幕截圖:

wKgZomY_DoSAF3nnAAG2oCwRX14969.jpg

Step-3評估模型并使用聊天機(jī)器人應(yīng)用程序部署它

接下來,評估量化模型并使用以下命令以NPU為目標(biāo)運行它。注意,模型路徑被設(shè)置為我們在上一步中保存int8量化模型的位置,

python run.py --model_name opt-1.3b --target aie --local_path。 opt-1.3b_smoothquantmodel_onnx_int8

在第一次運行期間,模型由內(nèi)聯(lián)編譯器自動編譯。編譯也是一個兩步的過程:首先,編譯器識別可以在NPU中執(zhí)行的層和需要在CPU中執(zhí)行的層。然后創(chuàng)建子圖集。一組用于NPU,另一組用于CPU。最后,它為每個子圖創(chuàng)建針對相應(yīng)執(zhí)行單元的指令集。這些指令由兩個ONNX執(zhí)行提供程序(EP)執(zhí)行,一個用于CPU,一個用于NPU。在第一次編譯之后,已編譯的模型保存在該高速緩存中,因此在后續(xù)部署中它避免了編譯。下面是一個屏幕截圖,其中模型信息是在編譯流程中打印出來的。

wKgZomY_DoeAJj7NAAEx-b3TWvE852.jpg

編譯后,模型在NPU和CPU上運行。將應(yīng)用測試提示。LLM Opt1.3B模型的響應(yīng)顯示了正確的答案。請記住,我們下載并部署了一個公開的預(yù)訓(xùn)練模型。因此,它的準(zhǔn)確性是主觀的,可能并不總是像預(yù)期的那樣。我們強(qiáng)烈建議在生產(chǎn)部署之前對公開可用的模型進(jìn)行微調(diào)。下面是測試提示和響應(yīng)的屏幕截圖:

wKgaomY_DomACXPqAAB3NSK5lZI258.jpg

現(xiàn)在,讓我們使用保存在路徑opt-1. 3b-smoothquantmodel_onnx_int 8中的int 8量化模型啟動聊天機(jī)器人

python gradio_appopt_demo_gui. py——model_file. opt—1.3b_smoothquantmodel_onnx_int8

如命令提示符所示,聊天機(jī)器人應(yīng)用程序在端口1234上的本地主機(jī)上運行。

打開瀏覽器并瀏覽到http://localhost:1234。

在瀏覽器應(yīng)用程序上,設(shè)置max_output_token=64并輸入提示“AMD做什么?“輸入文本框中。聊天機(jī)器人輸出如下所示的響應(yīng)。它還將KPI(關(guān)鍵性能指標(biāo))計算為token/sec。在這種情況下,它是每秒約4.7個令牌。

wKgZomY_Do2AKaXfAADk6exh4VA870.jpg

?

恭喜你,你已經(jīng)成功構(gòu)建了一個私人AI聊天機(jī)器人。它完全運行在筆記本電腦上,OPT1.3B是一種LLM(大型語言模型)。

結(jié)論

AMD銳龍? AI全棧工具使用戶能夠在AI PC上輕松創(chuàng)建以前無法實現(xiàn)的體驗-開發(fā)人員使用AI應(yīng)用程序,創(chuàng)作者使用創(chuàng)新和引人入勝的內(nèi)容,企業(yè)主使用工具優(yōu)化工作流程和效率。

我們很高興能將這項技術(shù)帶給我們的客戶和合作伙伴。如果您有任何問題或需要澄清,我們很樂意聽取您的意見。查看我們的GitHub存儲庫以獲取教程和示例設(shè)計,加入我們的討論論壇,或發(fā)送電子郵件至[email protected]。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19432

    瀏覽量

    231283
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28673

    瀏覽量

    208592
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31616

    瀏覽量

    270445
  • ryzen
    +關(guān)注

    關(guān)注

    1

    文章

    81

    瀏覽量

    17035
收藏 人收藏

    評論

    相關(guān)推薦

    聊天機(jī)器人在國內(nèi)為什么只能做客服?

    `“智能聊天機(jī)器人”在國外越來越火熱了。這一年,微軟先后推出了Tay、小冰小娜機(jī)器人家族,社交巨頭Facebook也緊接著在自己的messenger應(yīng)用中發(fā)布了超過10萬個的功能性機(jī)器人。此后,包括
    發(fā)表于 06-20 16:50

    聊天機(jī)器人的自動問答技術(shù)實現(xiàn)

    【原創(chuàng)】聊天機(jī)器人與自動問答技術(shù)
    發(fā)表于 06-03 08:47

    如何利用Python+ESP8266 DIY 一個智能聊天機(jī)器人?

    如何利用Python+ESP8266 DIY 一個智能聊天機(jī)器人?
    發(fā)表于 02-14 06:16

    聊天機(jī)器人的作用分析

    可以成為你的私人小秘書。 近日,兩大科技巨頭谷歌和臉譜紛紛投巨資研發(fā)各自的聊天機(jī)器人產(chǎn)品。谷歌本周收購了聊天機(jī)器人創(chuàng)業(yè)公司API.AI,進(jìn)一步加強(qiáng)語音識別技術(shù),讓機(jī)器人開始說話。 臉譜
    發(fā)表于 09-20 10:21 ?2次下載

    AI聊天機(jī)器人發(fā)展的前途怎么樣

    在人工智能(AI)盛行的時代,由于即時消息平臺的崛起,虛擬助理的普及以及各種企業(yè)提供實時客戶服務(wù)的努力下,聊天機(jī)器人市場正以非凡速度的成長。
    發(fā)表于 03-26 16:19 ?1427次閱讀

    一個基于Microsoft聊天機(jī)器人Tay的示例

    當(dāng)意料之外的事情浮出水面時,我們可以期望的最好的辦法就是減少有效應(yīng)對負(fù)擔(dān)的基礎(chǔ)設(shè)施。讓我們談?wù)劄?b class='flag-5'>AI構(gòu)建該基礎(chǔ)架構(gòu)?;ヂ?lián)網(wǎng)喜歡聊天機(jī)器人無處不在,所以讓我們看一個基于Microsoft聊天機(jī)器
    的頭像 發(fā)表于 04-09 14:18 ?2998次閱讀

    構(gòu)建聊天機(jī)器人需要哪些資源?

    我問新客戶的第一個問題是:“為什么需要聊天機(jī)器人,并且該聊天機(jī)器人如何解決您的問題或為您的組織帶來價值?”,“您的客戶正在尋找什么答案?”,“您的客戶服務(wù)是否經(jīng)常收到重復(fù)的問題?”
    的頭像 發(fā)表于 10-27 14:59 ?2507次閱讀

    GoGlobal 推出全新 AI 聊天機(jī)器人 – ChatGoGlobal

    ? ? 立即提問,即時回應(yīng) 全球領(lǐng)先的國際人力資源和名義雇主(EOR)服務(wù)提供商 GoGlobal,近日宣布推出其全新的 AI 聊天機(jī)器人ChatGoGlobal。 這款生成式 AI 聊天機(jī)器
    的頭像 發(fā)表于 04-20 14:56 ?1198次閱讀
    GoGlobal 推出全新 <b class='flag-5'>AI</b> <b class='flag-5'>聊天機(jī)器人</b> – ChatGoGlobal

    聊天機(jī)器人開源分享

    電子發(fā)燒友網(wǎng)站提供《聊天機(jī)器人開源分享.zip》資料免費下載
    發(fā)表于 06-20 15:07 ?1次下載
    <b class='flag-5'>聊天機(jī)器人</b>開源分享

    全球與中國AI聊天機(jī)器人市場:增長趨勢、競爭格局與前景展望

    與人類用戶進(jìn)行對話。 它可以使用自然語言處理(NLP)和機(jī)器學(xué)習(xí)(ML)等各種技術(shù)和方法來構(gòu)建。 聊天機(jī)器人有多種類型,包括基于規(guī)則的聊天機(jī)器人
    的頭像 發(fā)表于 08-01 18:07 ?2063次閱讀

    如何用AI聊天機(jī)器人寫出萬字長文

    如何用AI聊天機(jī)器人寫出萬字長文
    的頭像 發(fā)表于 12-26 16:25 ?1104次閱讀

    谷歌AI聊天機(jī)器人改名為Gemini

    谷歌(Google)近日宣布,旗下備受矚目的AI聊天機(jī)器人Bard正式更名為Gemini,并推出了一款功能更加強(qiáng)大的付費版本——Gemini Advanced。這一戰(zhàn)略調(diào)整旨在與微軟、OpenAI等科技巨頭在AI
    的頭像 發(fā)表于 02-18 11:28 ?1214次閱讀

    英偉達(dá)推出全新AI聊天機(jī)器人

    近日,英偉達(dá)(Nvidia)宣布推出其全新的AI聊天機(jī)器人——“Chat With RTX”。這款聊天機(jī)器人被視為英偉達(dá)版的ChatGPT,為用戶提供了一個全新的、本地化的AI交互體驗
    的頭像 發(fā)表于 02-19 11:09 ?1013次閱讀

    ChatGPT 與傳統(tǒng)聊天機(jī)器人的比較

    近年來最受矚目的一個。 一、技術(shù)基礎(chǔ) 1.1 傳統(tǒng)聊天機(jī)器人 傳統(tǒng)聊天機(jī)器人通常基于規(guī)則引擎構(gòu)建,這意味著它們通過預(yù)設(shè)的腳本和關(guān)鍵詞來響應(yīng)用戶的輸入。這些機(jī)器人
    的頭像 發(fā)表于 10-25 16:16 ?732次閱讀

    自然語言處理聊天機(jī)器人中的應(yīng)用

    上歸功于自然語言處理技術(shù)的進(jìn)步。 聊天機(jī)器人的工作原理 聊天機(jī)器人的核心是一個對話系統(tǒng),它能夠處理用戶的輸入(通常是文本形式),并生成相應(yīng)的回復(fù)。這個系統(tǒng)通常包括以下幾個關(guān)鍵組件: 語
    的頭像 發(fā)表于 12-05 15:24 ?585次閱讀