伊人久久中文字幕精品人妻,体验黑人巨大的中国少妇

當前，在人工智能領域，大模型在豐富人工智能應用場景中扮演著重要的角色，經過不斷的探索，大模型進入到落地的階段。而大模型在落地過程中面臨兩大關鍵難題：對龐大計算資源的需求和對數據隱私與安全的考量。為應對這些挑戰(zhàn)，在邊緣側私有化部署大模型成為了一個有效的解決方案。

將大模型部署到邊緣側，不僅能夠減少延遲和帶寬消耗，使得大模型能夠在邊緣節(jié)點快速進行推理和應用；還能增強數據隱私保護，這對于維護企業(yè)的數據安全至關重要。

為響應市場需求，英碼科技推出了基于算能BM1684X平臺的大模型私有化部署產品方案，包括：邊緣計算盒子IVP03X-V2、云邊加速卡AIV02X和AIV03X，助力企業(yè)實現垂直大模型應用落地！

▎邊緣計算盒子IVP03X-V2

IVP03X-V2是英碼科技基于BM1684X推出的高性能邊緣計算盒子，INT8算力高達32Tops，配置了16GB大內存，支持適配Llama2-7B/ChatGLM3-6B/Qwen-7B和SAM/StableDiffusion等大模型，是業(yè)內少數能同時兼容國內外深度學習框架，并且能夠流暢運行大語言模型推理的邊緣計算設備之一。

▎大模型推理加速卡AIV02X & AIV03X

AIV02X和AIV03X算力可達64 TOPS@INT8和72 TOPS@INT8，顯存配置32GB和48GB，支持多芯分布式推理及支持大語言/提示型/圖像生成模型等大模型推理；這兩款云邊大模型推理加速卡均可應用于邊緣大語言、文生圖等通用大模型、垂直行業(yè)私有模型的推理應用。

接下來，以英碼科技IVP03X邊緣計算盒子為例，為大家介紹實測大語言模型、文生圖大模型的部署流程和效果演示：

英碼科技IVP03X-V2實測大語言模型

一、前期準備工作

demo下載地址：

https://github.com/sophgo/sophon-demo

二、大模型內存配置

1、建一個存放工具的文件夾：

mkdir memedit && cd memedit

2、下載內存配置工具：

wget -nd https://sophon-file.sophon.cn/sophon-prod-s3/drive/23/09/11/13/DeviceMemoryModificationKit.tgz tar xvf DeviceMemoryModificationKit.tgz cd DeviceMemoryModificationKit tar xvf memory_edit_{vx.x}.tar.xz #vx.x是版本號 cd memory_edit

3、重配內存：

./memory_edit.sh -p #這個命令會打印當前的內存布局信息 ./memory_edit.sh -c -npu 7615 -vpu 3072 -vpp 3072 #npu也可以訪問vpu和vpp的內存替換emmbboot.itb: sudo cp /data/memedit/DeviceMemoryModificationKit/memory_edit/emmcboot.itb /boot/emmcboot.itb && sync

4、重啟生效：

reboot 重啟后，檢查配置： free -h cat /sys/kernel/debug/ion/bm_npu_heap_dump/summary | head -2 cat /sys/kernel/debug/ion/bm_vpu_heap_dump/summary | head -2 cat /sys/kernel/debug/ion/bm_vpp_heap_dump/summary | head -2

三、實測Chat-GLM3大模型（英文模式）

1、demo下載（Chat-GLM3）

進到Chat-GLM2案例目錄下：sophon-demo-release/sample/Chat-GLM2/

安裝pip3，安裝dfss

sudo apt install python3-pip pip3 install dfss -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip3 install dfss --upgrade

下載模型：

sudo apt install unzip chmod -R +x scripts/ ./scripts/download.sh

2、安裝依賴

安裝python依賴：

pip3 install -r python/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ Sail安裝包，下載安裝： python3 -m dfss [email protected]:sophon-demo/ChatGLM3/sail/soc/sophon_arm-3.7.0-py3-none-any.whl pip3 install sophon_arm-3.7.0-py3-none-any.whl

3、大模型運行測試：

python3 python/chatglm3.py --bmodel models/BM1684X/chatglm3-6b_int4.bmodel --token python/token_config --dev_id 0 python3 python/chatglm3.py --bmodel models/BM1684X/chatglm3-6b_int8.bmodel --token python/token_config --dev_id 0 python3 python/chatglm3.py --bmodel models/BM1684X/chatglm3-6b_fp16.bmodel --token python/token_config --dev_id 0

四、實測Qwen大模型（中文模式）

1、demo下載（Qwen）

進到Chat-GLM2案例目錄下：sophon-demo-release/sample/Qwen/

安裝pip3，安裝dfss

sudo apt install python3-pip pip3 install dfss -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip3 install dfss --upgrade

下載模型：

sudo apt install unzip chmod -R +x scripts/ ./scripts/download.sh

2、安裝依賴

安裝python依賴：

3、大運行測試：

python3 python/qwen.py --bmodel models/BM1684X/qwen-7b_int4_1dev.bmodel --token python/token_config --dev_id 0 python3 python/qwen.py --bmodel models/BM1684X/qwen-7b_int8_1dev.bmodel --token python/token_config --dev_id 0

英碼科技IVP03X-V2實測文生圖大模型

1、demo下載（StableDiffusionV1_5）

進到Chat-GLM2案例目錄下：sophon-demo-release/sample/Qwen/

安裝pip3，安裝dfss

sudo apt install python3-pip pip3 install dfss -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip3 install dfss --upgrade

下載模型：

sudo apt install unzip chmod -R +x scripts/ ./scripts/download_controlnets_bmodel.sh ./scripts/download_multilize_bmodel.sh ./scripts/download_singlize_bmodel.sh

2、安裝依賴

安裝python依賴：

pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ 安裝sail包 python3 -m dfss [email protected]:sophon-demo/ChatGLM3/sail/soc/sophon_arm-3.7.0-py3-none-any.whl

3、大模型運行測試：

①文本生成圖像

迭代20次

python3run.py--model_path../models/BM1684X--stagesinglize--prompt"Aparrotrestingonabranch"--neg_prompt"worstquality"--num_inference_steps20--dev_id0

迭代500次

python3 run.py --model_path ../models/BM1684X --stage singlize --pr ompt "A parrot resting on a branch" --neg_prompt "worst quality" --num_inference_steps 500 --dev_id 0

② Controlnet插件輔助控制生成圖像

一只小兔子晚上在酒吧喝酒：迭代次數，20次

python3 run.py --model_path ../models/BM1684X --stage multilize --controlnet_name scribble_controlnet_fp16.bmodel --processor_name scribble_processor_fp16.bmodel --controlnet_img ../pics/generated_img.jpg --prompt "a rabbit drinking at the bar at night" --neg_prompt "worst quality" --num_inference_steps 100 --dev_id 0

一只小兔子晚上在酒吧喝酒：迭代次數，200次

結語

隨著大模型技術的不斷落地和應用，大模型涌現的強大能力不再局限于云端，模型的算法正逐漸向邊緣端延伸；未來，英碼科技將結合自身在軟硬件方面的技術優(yōu)勢和豐富的經驗，以AI賦能更多企業(yè)低門檻、高效落地邊緣側大模型應用，從而推動各行業(yè)智能化轉型的進程。

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
31493

瀏覽量
270191
人工智能

人工智能

+關注

關注
1796

文章
47643

瀏覽量
240110
大模型

大模型

+關注

關注
2

文章
2543

瀏覽量
3120

基于 Flexus 云服務器 X 實例的應用場景 - 私有化部署自己的筆記平臺

，為其他人提供一些便利幫助。一般記錄自己筆記的方式有好多種，比如在開源的博客平臺上發(fā)布，比如 CSDN，博客園，51CTO 博客、公眾號等。另一種方式就是：自己部署一款私有化的筆記平臺

發(fā)表于 01-02 09:55 ?120次閱讀

大模型時代的算力需求

現在AI已進入大模型時代，各企業(yè)都爭相部署大模型，但如何保證大模型的算力，以及相關的穩(wěn)定性和性能，是一個極為重要的問題，帶著這個極為重要的問

發(fā)表于 08-20 09:04

智能水電表管理系統(tǒng)支持本地私有化部署嗎？

智能水電表管理系統(tǒng)，作為智慧城市建設中的關鍵組件，正逐步改變著能源計量與管理的傳統(tǒng)模式。面對日益增長的數據安全需求及特定行業(yè)的合規(guī)性考量，越來越多的企業(yè)和機構開始關注系統(tǒng)的本地私有化部署方案。本文將

發(fā)表于 08-12 20:32 ?320次閱讀

AIBOX青春版上線！1399把AI帶回家

BM1688，算力高達16TOPS，支持主流大模型的私有化部署，把AI的能力私有化，滿足個性

發(fā)表于 08-08 08:02 ?740次閱讀

【算能RADXA微服務器試用體驗】+ GPT語音與視覺交互：2，圖像識別

圖像識別也屬于是AI的一個非常基本的經典應用。在主打AI功能的BM1684X上自然也是得到了廣泛的支持。算能官方提供了一個叫做Radxa-Model-Zoo的倉庫，這個倉庫里包含了許多AI方面

發(fā)表于 07-14 23:36

PerfXCloud大模型開發(fā)與部署平臺開放注冊

PerfXCloud?介紹 PerfXCloud是澎峰科技為開發(fā)者和企業(yè)量身打造的AI開發(fā)和部署平臺。它專注于滿足大模型的微調和推理需求，為用戶提供極致便捷的一鍵部署體驗。 PerfX

發(fā)表于 07-02 10:27 ?414次閱讀

用yolov5的best.pt導出成onnx轉化成fp32 bmodel后在Airbox上跑，報維度不匹配怎么處理？

bm1684x --test_input best_pt_in_f32.npz --test_reference best_pt_top_outputs.npz --model bestf32.bmodel跑模型是利用文件中的

發(fā)表于 05-31 08:10

bm1684運行demo報錯怎么解決？

../models/BM1684X/yolov5s_v6.1_3output_fp32_1b.bmodel[BMRT][bmcpu_setup:406] INFO:cpu_lib \'libcpuop.so

發(fā)表于 05-20 07:24

搭載TPU處理器BM1688&CV186AH的英碼科技邊緣計算盒子，功耗更低、接口更豐富

了基于BM1684的邊緣計算盒子IVP03A、IVP03C、IVP03D，以及基于BM1684X的IVP03X邊緣計算盒子，在智慧交通、智慧

發(fā)表于 05-18 08:39 ?401次閱讀

【AIBOX】裝在小盒子的AI足夠強嗎？

Firefly推出大語言模型本地部署的產品：AIBOX-1684X，目前已適配主流的大語言模型，包括ChatGLM3-6B，以下是ChatG

發(fā)表于 05-15 08:02 ?506次閱讀

把大模型裝進小盒子：這個小魔盒直擊端側AIGC的痛點！

私有本地化部署：智能硬件的未來隨著當下數字化的高速發(fā)展，今年將會迎來“大模型應用爆發(fā)元年”。市面上不少大

發(fā)表于 05-10 08:33 ?412次閱讀

AIBOX-1684X：把大語言模型“裝”進小盒子

AIBOX-1684X支持主流大模型私有化部署，算力高達32TOPS，同時也支持CNN、RNN、LSTM等傳統(tǒng)網絡架構，支持TensorFN

發(fā)表于 04-20 08:02 ?1411次閱讀

256Tops算力！CSA1-N8S1684X算力服務器

（基于BM1684X的高算力服務器）高算力AI處理器BM1684X搭載了BM1684AI算力So

發(fā)表于 03-23 08:02 ?1748次閱讀

源2.0適配FastChat框架，企業(yè)快速本地化部署大模型對話平臺

，且有數據隱私保護需求的本地化部署場景。全面開放的對話模板功能，用戶可基于FastChat平臺，快速對不同參數規(guī)模的Yuan2.0基礎模型進行訓練、評估和應用，將Yuan2.0系列基礎

發(fā)表于 02-29 09:57 ?866次閱讀

【算能RADXA微服務器試用體驗】Radxa Fogwise 1684X Mini 規(guī)格

通過網絡可以了解到，算能RADXA微服務器的具體規(guī)格：處理器：BM1684X 算力：高達32Tops INT8峰值算力內存：16GB L

發(fā)表于 02-28 11:21