這是RISC-V跑大模型系列的第二篇文章,主要教大家如何將LLaMA移植到RISC-V環(huán)境里。
1. 環(huán)境準(zhǔn)備
1)最新版Python
2)確保機(jī)器有足夠的內(nèi)存加載完整模型(7B模型需要13~15G)
3)下載原版LLaMA模型和擴(kuò)展了的中文模型
2. 模型下載
從LLaMA原版模型地址上下載下述文件(我們使用的是7B):
最后文件下載完成后的結(jié)果如下:
3. 加載并啟動(dòng)
1)這一步需要下載llama.cpp,
python3 convert-pth-to-ggml.py models/7B/ 03)將.pth模型權(quán)重轉(zhuǎn)換為ggml的FP32格式,生成文件路徑為models/7B/ggml-model-f32.bin。
![c239f23c-1d95-11ee-962d-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9D/91/wKgZomToB6eASjhnAAPRdhm-gs8235.png)
4)運(yùn)行./main二進(jìn)制文件,-m命令指定Q4量化模型(也可加載ggml-FP16的模型)。以下是解碼參數(shù)及示例:
./main models/7B/ggml-model-f32.bin --color -f prompts/alpaca.txt -ins -c 256 --temp 0.2 -n 128 --repeat_penalty 1.3
參數(shù)解釋:
-ins | 啟動(dòng)類ChatGPT對(duì)話交流的運(yùn)行模式 |
-f | 指定prompt模板,alpaca模型請(qǐng)加載prompts/alpaca.txt |
-c | 控制上下文的長(zhǎng)度,值越大越能參考更長(zhǎng)的對(duì)話歷史(默認(rèn):512) |
-n | 控制回復(fù)生成的最大長(zhǎng)度(默認(rèn):128) |
-t | 控制batch size(默認(rèn):8),可適當(dāng)增加 |
--repeat_penalty | 控制線程數(shù)量(默認(rèn):4),可適當(dāng)增加 |
--temp | 溫度系數(shù),值越低回復(fù)的隨機(jī)性越小,反之越大 |
--top_p, top_k | 控制解碼采樣的相關(guān)參數(shù) |
審核編輯:劉清
-
解碼器
+關(guān)注
關(guān)注
9文章
1152瀏覽量
40960 -
python
+關(guān)注
關(guān)注
56文章
4811瀏覽量
85077 -
RISC-V
+關(guān)注
關(guān)注
45文章
2329瀏覽量
46684 -
澎峰科技
+關(guān)注
關(guān)注
0文章
61瀏覽量
3226 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1571瀏覽量
8117
原文標(biāo)題:RISC-V 跑大模型(二):LLaMA零基礎(chǔ)移植教程
文章出處:【微信號(hào):perfxlab,微信公眾號(hào):perfxlab】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
RISC-V 跑大模型(三):LLaMA中文擴(kuò)展
![<b class='flag-5'>RISC-V</b> <b class='flag-5'>跑</b>大<b class='flag-5'>模型</b>(三):<b class='flag-5'>LLaMA</b>中文擴(kuò)展](https://file1.elecfans.com/web2/M00/8C/F0/wKgaomS1AoiAbJSYAACUfmvct_s083.png)
開發(fā)板上玩GTA,RISC-V多項(xiàng)移植項(xiàng)目成功運(yùn)作中
安卓上RISC-V,移植成最大阻礙
每日推薦 | HarmonyOS 從入門到大神資料,從零開始寫RISC-V處理器經(jīng)驗(yàn)連載
目前國內(nèi)RISC-V架構(gòu)的MCU從程序從arm移植到RISC-V難度大嗎?
有RISC-V跑uCLinux或者NO MMU的Linux的項(xiàng)目嗎?
RISC-V規(guī)范的演進(jìn) RISC-V何時(shí)爆發(fā)?
?開發(fā)板上玩GTA RISC-V多項(xiàng)移植項(xiàng)目成功運(yùn)作中
![?開發(fā)板上玩GTA <b class='flag-5'>RISC-V</b>多項(xiàng)<b class='flag-5'>移植</b>項(xiàng)目成功運(yùn)作中](https://file.elecfans.com/web2/M00/14/D9/poYBAGFCwTiAJ7rjAABGuZniQQk158.png)
從零開始寫RISC-V處理器
基于RISC-V內(nèi)核單片機(jī)移植RTOS實(shí)時(shí)操作系統(tǒng)(一)
![基于<b class='flag-5'>RISC-V</b>內(nèi)核單片機(jī)<b class='flag-5'>移植</b>RTOS實(shí)時(shí)操作系統(tǒng)(一)](https://file.elecfans.com/web2/M00/8B/BD/poYBAGPYk3eAFTd8AAHqW9qrr3s910.png)
基于RISC-V內(nèi)核單片機(jī)移植RTOS實(shí)時(shí)操作系統(tǒng)(二)
![基于<b class='flag-5'>RISC-V</b>內(nèi)核單片機(jī)<b class='flag-5'>移植</b>RTOS實(shí)時(shí)操作系統(tǒng)(<b class='flag-5'>二</b>)](https://file.elecfans.com/web2/M00/8C/45/pYYBAGPYq96ARIbwAAOAjPNk5hg719.png)
解鎖RISC-V技術(shù)力量丨曹英杰:RISC-V與大模型探索
![解鎖<b class='flag-5'>RISC-V</b>技術(shù)力量丨曹英杰:<b class='flag-5'>RISC-V</b>與大<b class='flag-5'>模型</b>探索](https://file.elecfans.com/web2/M00/37/4D/poYBAGI62smAAPRDAAAzYJ7Ib6o943.png)
評(píng)論