近日,Github 一位開發(fā)者 danaugrs 開源了一個新項目——Huskarl,一個專注研究和快速原型的深度強化學(xué)習(xí)框架。
此框架基于 TensorFlow 2.0 構(gòu)建,使用了 tf.keras API,保證了其簡潔性和可讀性。Huskarl 可以使多環(huán)境的并行計算變得很容易,這將對加速策略學(xué)習(xí)算法(比如 A2C 和 PPO)非常有用。此外,Huskarl 還可以與 OpenAI Gym 環(huán)境無縫結(jié)合,并將計劃支持多代理環(huán)境和 Unity3D 環(huán)境。
OpenAI Gym:2016 年 OpenAI 發(fā)布的一個可以開發(fā)、對比強化學(xué)習(xí)算法的工具包,提供了各種環(huán)境、模擬任務(wù)等,任何人都可以在上面訓(xùn)練自己的算法。
Unity3D:一個全面整合的專業(yè)游戲引擎,由 Unity Technologies 開發(fā)的一款可以讓玩家輕松創(chuàng)建三維視頻游戲、實時三維動畫等類型互動內(nèi)容的多平臺綜合型游戲開發(fā)工具。
目前,Huskarl 已經(jīng)支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(Advantage Actor-Critic)等算法,還有 DDPG(Deep Deterministic Policy Gradient)、PPO(Proximal Policy Optimization)、Curiosity-Driven Exploration 等算法在計劃中。
最重要的是,TF 2.0 的 nightly 已經(jīng)發(fā)布,這個開源工具也是基于 TF2.0 開發(fā)的,所以大家要先安裝一下 tf 2.0 nighty 版本。除此之外,還需要安裝以下工具和環(huán)境:
這個工具還是新鮮出爐燙手的呢,大家趕緊來嘗鮮試一下~
地址:
https://github.com/danaugrs/huskarl
-
強化學(xué)習(xí)
+關(guān)注
關(guān)注
4文章
268瀏覽量
11307 -
tensorflow
+關(guān)注
關(guān)注
13文章
329瀏覽量
60635 -
開源工具
+關(guān)注
關(guān)注
0文章
27瀏覽量
4528
原文標(biāo)題:新鮮開源:基于TF2.0的深度強化學(xué)習(xí)平臺
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
淺談適用規(guī)模充電站的深度學(xué)習(xí)有序充電策略
![淺談適用規(guī)模充電站的深度<b class='flag-5'>學(xué)習(xí)</b>有序充電策略](https://file1.elecfans.com//web3/M00/02/6E/wKgZO2dfgOuADE0aAABtvTmgxtY156.jpg)
螞蟻集團收購邊塞科技,吳翼出任強化學(xué)習(xí)實驗室首席科學(xué)家
PyTorch GPU 加速訓(xùn)練模型方法
如何使用 PyTorch 進行強化學(xué)習(xí)
使用TF卡的常見問題
谷歌AlphaChip強化學(xué)習(xí)工具發(fā)布,聯(lián)發(fā)科天璣芯片率先采用
20個數(shù)據(jù)可以訓(xùn)練神經(jīng)網(wǎng)絡(luò)嗎
預(yù)訓(xùn)練和遷移學(xué)習(xí)的區(qū)別和聯(lián)系
如何使用Tensorflow保存或加載模型
MATLAB如何使用訓(xùn)練好的網(wǎng)絡(luò)
深度學(xué)習(xí)模型訓(xùn)練過程詳解
通過強化學(xué)習(xí)策略進行特征選擇
![通過<b class='flag-5'>強化學(xué)習(xí)</b>策略進行特征選擇](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
名單公布!【書籍評測活動NO.30】大規(guī)模語言模型:從理論到實踐
一文詳解Transformer神經(jīng)網(wǎng)絡(luò)模型
![<b class='flag-5'>一</b>文詳解Transformer神經(jīng)網(wǎng)絡(luò)模型](https://file1.elecfans.com/web2/M00/C0/3D/wKgZomXUCF-ACTsDAABCrULoz_I157.png)
評論