下面我們就來(lái)試一下 Qlib 的安裝和運(yùn)行內(nèi)置算法策略。
1.準(zhǔn)備
開(kāi)始之前,你要確保Python和pip已經(jīng)成功安裝在電腦上,如果沒(méi)有,請(qǐng)?jiān)L問(wèn)這篇文章:《超詳細(xì)Python安裝指南(傳統(tǒng))》或 《Python數(shù)據(jù)分析與挖掘好幫手—Anaconda》 進(jìn)行安裝,本文建議使用Anaconda。
由于qlib有許多許多依賴(lài),如果你不想安裝過(guò)程中出現(xiàn)問(wèn)題,或者引起其他程序的運(yùn)行問(wèn)題,建議使用Conda創(chuàng)建一個(gè)你的量化投資虛擬環(huán)境:
conda create -n my_quant python=3.8
Qlib 僅支持 Python3.7 以上的版本且暫不支持 Python3.10; 另外 Python 3.9 版本不支持模型性能繪制,因此我選擇創(chuàng)建Python3.8版本的虛擬環(huán)境。
(安裝方式一) pip 安裝:
pip install pyqlib
在pip安裝的過(guò)程中如果遇到任何問(wèn)題,請(qǐng)搜索引擎解決,如果無(wú)法解決,可以嘗試下面的源碼安裝:
(安裝方式二 (推薦)) 源碼安裝:
# 提前安裝一些依賴(lài)
pip install numpy
pip install --upgrade cython
# clone and install qlib
git clone https://github.com/microsoft/qlib.git && cd qlib
python setup.py install
Windows 機(jī)器在安裝的時(shí)候可能會(huì)遇到下面這個(gè)問(wèn)題:
這是因?yàn)榘惭b qlib 的依賴(lài) — tables 時(shí)出現(xiàn)了編譯錯(cuò)誤,原因很多,我選擇逃學(xué),因此建議使用 tables 的 wheel 文件進(jìn)行安裝,這樣就不需要編譯了:
https://www.lfd.uci.edu/~gohlke/pythonlibs/#pytables
在上述網(wǎng)站下載適合你系統(tǒng)的 wheel 文件:
下載完畢后,輸入以下命令:
pip install 你的文件路徑/tables-3.6.1-cp39-cp39-win_amd64.whl
即可完成 tables 的安裝,然后再執(zhí)行一遍 python setup.py install 即可。
2. 數(shù)據(jù)準(zhǔn)備
由于這套量化開(kāi)源平臺(tái)的作者是中國(guó)人,所以非常貼心地準(zhǔn)備好了A股數(shù)據(jù),大家可以輸入命令直接下載:
# 1天級(jí)別數(shù)據(jù)
python scripts/get_data.py qlib_data --target_dir ~/.qlib/qlib_data/cn_data --region cn
# 1分鐘級(jí)別數(shù)據(jù)
python scripts/get_data.py qlib_data --target_dir ~/.qlib/qlib_data/cn_data_1min --region cn --interval 1min
如果你需要其他分鐘級(jí)的數(shù)據(jù),修改interval即可。
你可以使用crontab定時(shí)自動(dòng)更新數(shù)據(jù)(來(lái)自雅虎財(cái)經(jīng)):
* * * * 1-5 python < script path > update_data_to_bin --qlib_data_1d_dir < user data dir >
手動(dòng)更新數(shù)據(jù):
python scripts/data_collector/yahoo/collector.py update_data_to_bin --qlib_data_1d_dir < user data dir > --trading_date < start date > --end_date < end date >
3. 運(yùn)行量化回測(cè)流程示例
Qlib 提供了一個(gè)名為 ** qrun
** 自動(dòng)運(yùn)行整個(gè)工作流程的工具(包括構(gòu)建數(shù)據(jù)集、訓(xùn)練模型、回測(cè)和評(píng)估)。
你可以按照以下步驟啟動(dòng)自動(dòng)量化研究工作流程并進(jìn)行圖形報(bào)告分析,Quant Research 工作流程:
**Qrun
** 運(yùn)行 lightgbm 工作流程的配置 workflow_config_lightgbm_Alpha158.yaml 如下所示:
cd examples # Avoid running program under the directory contains `qlib`
qrun benchmarks/LightGBM/workflow_config_lightgbm_Alpha158.yaml
結(jié)果如下:
可以看到這里包括三個(gè)統(tǒng)計(jì)分析:benchmark return (基準(zhǔn)收益) / excess return without cost(除去手續(xù)費(fèi)的超額收益)) / excess return with cost(包含手續(xù)費(fèi)的超額收益)。每個(gè)統(tǒng)計(jì)分析中都有如下5個(gè)參數(shù):
- mean: 異常收益的平均值
- std: 異常收益的標(biāo)準(zhǔn)差
- annualized_return: 年化回報(bào)
- information_ratio: 信息比率
- max_drawdown: 最大回撤
大家可以看到,這個(gè)內(nèi)置的算法和策略,在不包括手續(xù)費(fèi)的情況下,相比于基準(zhǔn)收益年化回報(bào)略高,但是在把手續(xù)費(fèi)等費(fèi)用算上之后,比滬深300基準(zhǔn)收益略遜一籌。
如果你想要自定義這個(gè)策略和算法的回測(cè)參數(shù),你可以查看 workflow_config_lightgbm_Alpha158.yaml 的內(nèi)容:
上滑查看更多代碼
qlib_init:
provider_uri: "~/.qlib/qlib_data/cn_data"
region: cn
market: &market csi300
benchmark: &benchmark SH000300
data_handler_config: &data_handler_config
start_time: 2008-01-01
end_time: 2020-08-01
fit_start_time: 2008-01-01
fit_end_time: 2014-12-31
instruments: *market
port_analysis_config: &port_analysis_config
strategy:
class: TopkDropoutStrategy
module_path: qlib.contrib.strategy
kwargs:
model: < MODEL >
dataset: < DATASET >
topk: 50
n_drop: 5
backtest:
start_time: 2017-01-01
end_time: 2020-08-01
account: 100000000
benchmark: *benchmark
exchange_kwargs:
limit_threshold: 0.095
deal_price: close
open_cost: 0.0005
close_cost: 0.0015
min_cost: 5
task:
model:
class: LGBModel
module_path: qlib.contrib.model.gbdt
kwargs:
loss: mse
colsample_bytree: 0.8879
learning_rate: 0.2
subsample: 0.8789
lambda_l1: 205.6999
lambda_l2: 580.9768
max_depth: 8
num_leaves: 210
num_threads: 20
dataset:
class: DatasetH
module_path: qlib.data.dataset
kwargs:
handler:
class: Alpha158
module_path: qlib.contrib.data.handler
kwargs: *data_handler_config
segments:
train: [2008-01-01, 2014-12-31]
valid: [2015-01-01, 2016-12-31]
test: [2017-01-01, 2020-08-01]
record:
-class: SignalRecord
module_path: qlib.workflow.record_temp
kwargs:
model: < MODEL >
dataset: < DATASET >
-class: SigAnaRecord
module_path: qlib.workflow.record_temp
kwargs:
ana_long_short: False
ann_scaler: 252
-class: PortAnaRecord
module_path: qlib.workflow.record_temp
kwargs:
config: *port_analysis_config
參數(shù)比較多,大家借助翻譯工具應(yīng)該都能看懂。這里摘取華泰的一個(gè)研究報(bào)告,里面對(duì)參數(shù)做了具體的翻譯:
為了方便用戶(hù)使用,微軟內(nèi)置了許多模型,如上文我們用到的 gbdt 位于克隆的文件夾下的 qlib/contrib/model/gbdt.py:
注意:pytorch 開(kāi)頭的模型需要預(yù)先安裝pytorch.
一個(gè)小問(wèn)題,Qlib里,策略和算法的區(qū)別是什么?
大家注意到,Qlib這里,必須定義策略和算法兩個(gè)配置,而在backtrader里面,我們更加重視策略,而非“算法”這個(gè)概念。那么這兩者在Qlib中的區(qū)別是什么?我們看默認(rèn)TOPK策略的源代碼:
**可以看到,默認(rèn)的這個(gè)策略,選擇了算法預(yù)測(cè)分?jǐn)?shù)結(jié)果中排名 TOP K 的股票,也就是策略從算法得到的結(jié)果中去做篩選需要交易的股票。**算法相當(dāng)于生成一個(gè)新的可用于判斷買(mǎi)入賣(mài)出的評(píng)判標(biāo)準(zhǔn)。這就是策略和AI算法這兩者的最重要區(qū)別。
最后,得益于松耦合的代碼設(shè)計(jì),我認(rèn)為 Qlib 是一個(gè)能夠讓不同層次的研究者各取所需的開(kāi)源項(xiàng)目,是一個(gè)不可多得的量化開(kāi)源平臺(tái),特別適合重度Python使用者,有興趣的朋友可以試一下,未來(lái)我也會(huì)考慮出 Qlib 相關(guān)的使用教程,敬請(qǐng)期待。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7170瀏覽量
89698 -
程序
+關(guān)注
關(guān)注
117文章
3798瀏覽量
81457 -
python
+關(guān)注
關(guān)注
56文章
4811瀏覽量
85075
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論