人工智能(AI)領(lǐng)域中的大模型(Large Model)逐漸成為研究的熱點(diǎn)。大模型,顧名思義,是指擁有海量參數(shù)和高度復(fù)雜結(jié)構(gòu)的深度學(xué)習(xí)模型。它的出現(xiàn),不僅推動了AI技術(shù)的突破,更為各行各業(yè)帶來了革命性的變化。
RK3588是瑞芯微推出的新一代旗艦級高端處理器,采用8nm工藝設(shè)計(jì),搭載四核A76+四核A55的八核CPU和Arm高性能GPU,內(nèi)置6T算力的NPU。能夠高效地處理AI算法和模型,為大模型的運(yùn)行提供了強(qiáng)大的硬件支持。
![wKgZomYp-UCASVgJAABF-3JCGqI970.png](https://file1.elecfans.com/web2/M00/D9/5D/wKgZomYp-UCASVgJAABF-3JCGqI970.png)
![](https://file1.elecfans.com/web2/M00/D9/5D/wKgZomYp-UCASVgJAABF-3JCGqI970.png)
在北京迅為推出的搭載了RK3588處理器的iTOP-RK3588開發(fā)板上,使用RKLLM 工具套件支持在iTOP-RK3588平臺上進(jìn)行LLM(大型語言模型)模型的轉(zhuǎn)換和部署。它與Hugging Face模型架構(gòu)兼容(Hugging Face是廣泛用于自然語言處理任務(wù)的模型架構(gòu)。目前,該系統(tǒng)支持以下模型:LLaMA、Qwen、Qwen2和Phi-2。支持量化技術(shù),即使用w8a8(8位權(quán)重,8位激活)和w4a16(4位權(quán)重,16位激活)精度進(jìn)行模型量化。這可以在目標(biāo)平臺上更高效地存儲和計(jì)算模型,減小內(nèi)存占用。
![wKgaomYp-UuADTMMAABtJ14dMhc249.png](https://file1.elecfans.com/web2/M00/DA/3E/wKgaomYp-UuADTMMAABtJ14dMhc249.png)
![](https://file1.elecfans.com/web2/M00/DA/3E/wKgaomYp-UuADTMMAABtJ14dMhc249.png)
iTOP-RK3588開發(fā)板體驗(yàn)大模型
為了讓用戶更快速的體驗(yàn)RKLLM ,北京迅為已經(jīng)對Linux內(nèi)核源碼中的NPU版本進(jìn)行了升級,升級到了最新的0.9.6版本,具體如下所示:
![wKgaomYp-VSAa1JLAAAUgIdinTg807.png](https://file1.elecfans.com/web2/M00/DA/3E/wKgaomYp-VSAa1JLAAAUgIdinTg807.png)
![](https://file1.elecfans.com/web2/M00/DA/3E/wKgaomYp-VSAa1JLAAAUgIdinTg807.png)
默認(rèn)以將RKLLM動態(tài)庫集成在了Ubuntu和Debian系統(tǒng)中,用戶可以直接拷貝轉(zhuǎn)換完成的RKLLM大預(yù)言模型和推理程序進(jìn)行測試。詳細(xì)說明請見NPU手冊中RKLLM模型轉(zhuǎn)換和測試相關(guān)步驟。
《iTOP-RK3588開發(fā)板NPU使用手冊》v1.1教程目錄
第1章 你好!NPU
1.1 NPU的誕生!
1.2 初識RKNPU
第2章 準(zhǔn)備RKNPU開發(fā)環(huán)境
2.1 開發(fā)環(huán)境
2.1 軟件架構(gòu)
2.2 SDK說明
第3章 讓NPU跑起來
3.1 在Linux系統(tǒng)中使用NPU
3.1.1 設(shè)置交叉編譯器
3.1.2 修改編譯工具路徑
3.1.3 更新RKNN模型
3.1.4 編譯demo
3.1.5 開發(fā)板運(yùn)行demo
3.2 在Android系統(tǒng)中使用NPU
3.2.1下載編譯所需工具
3.2.2 修改編譯工具路徑
3.2.3 更新RKNN模型
3.2.4 編譯demo
3.2.5 開發(fā)板運(yùn)行demo
第4章 體驗(yàn)RKNN_DEMO
4.1 rknn_ssd_demo體驗(yàn)
4.2 rkn_api_demo體驗(yàn)
4.3 rknn_multiple_input_demo體驗(yàn)
第5章 模型轉(zhuǎn)換
5.1 RKNN-Toolkit2 介紹
5.2 RKNN-Toolkit2環(huán)境搭建
5.2.1 安裝Miniconda
5.2.2 創(chuàng)建RKNN虛擬環(huán)境
5.2.3 安裝pycharm
5.2.4 配置pycharm
5.3 RKNN-Toolkit2工具的使用
5.3.1 模型運(yùn)行在模擬器
5.3.2 模型運(yùn)行在RK3588開發(fā)板
第6章 其他模型轉(zhuǎn)換
6.1 使用tensorflow框架
6.2 使用caffe框架
6.3 使用tflite框架
6.4 使用onnx框架
6.5 使用darknet框架
6.6 使用pytorch框架
第 7章 使用RKNN-Toolkit-lite2
7.1 主要功能說明
7.2 環(huán)境搭建步驟
7.2.1 安裝Miniconda
7.2.2 創(chuàng)建RKNN虛擬環(huán)境
7.2.3 安裝RKNN-ToolkitLite 2軟件包
7.2.4 安裝opencv
7.3 運(yùn)行測試程序
第8章 RKLLM大預(yù)言模型測試
8.1 RKLLM-Toolkit介紹
8.2 RKLLM-Toolkit環(huán)境搭建
8.2.1 安裝Miniconda
8.2.2 創(chuàng)建RKLLM虛擬環(huán)境
8.3 大語言模型轉(zhuǎn)換
8.4 推理程序編譯
8.5 開發(fā)板運(yùn)行測試
-
測試
+關(guān)注
關(guān)注
8文章
5399瀏覽量
127128 -
人工智能
+關(guān)注
關(guān)注
1796文章
47791瀏覽量
240573 -
RK3588
+關(guān)注
關(guān)注
7文章
346瀏覽量
4597
發(fā)布評論請先 登錄
相關(guān)推薦
迅為RK3588開發(fā)板實(shí)時系統(tǒng)編譯-Preemption系統(tǒng)/ Xenomai系統(tǒng)編譯-實(shí)時系統(tǒng)燒寫-固件獲取方式
迅為RK3588開發(fā)板實(shí)時系統(tǒng)編譯-Preemption系統(tǒng)/ Xenomai系統(tǒng)編譯-獲取Linux源碼包
迅為iTOP-RK3588開發(fā)板商業(yè)級/工業(yè)級/國產(chǎn)化/國產(chǎn)化工業(yè)級/郵票孔版本以及LPDDR5版本性能首選
RK3588 技術(shù)分享 | 在Android系統(tǒng)中使用NPU實(shí)現(xiàn)Yolov5分類檢測
迅為瑞芯微RK3588開發(fā)板深度剖析丨首選的性能
探索巔峰性能 |迅為瑞芯微RK3588開發(fā)板/核心板深度剖析
迅為RK3588開發(fā)板!黑神話悟空,啟動?
迅為RK3588開發(fā)板深度剖析丨首選的性能
RK3588 技術(shù)分享 | 在Android系統(tǒng)中使用NPU實(shí)現(xiàn)Yolov5分類檢測
探索巔峰性能 |迅為 RK3588開發(fā)板深度剖析
基于北京迅為iTOP-RK3588大語言模型部署測試
![基于<b class='flag-5'>北京</b><b class='flag-5'>迅</b><b class='flag-5'>為</b><b class='flag-5'>iTOP-RK3588</b>大<b class='flag-5'>語言</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b><b class='flag-5'>測試</b>](https://file1.elecfans.com/web2/M00/C8/2C/wKgaomYSU1KAe1JkAAAXkB1dyRY812.png)
評論