資料介紹
針對分層強(qiáng)化學(xué)習(xí)需要人工給出層次結(jié)構(gòu)這一問題,同時考慮到基于狀態(tài)空間的自動分層方法在環(huán)境狀態(tài)中沒有明顯子目標(biāo)時分層效果并不理想的情況,提出一種基于動作空間的自動構(gòu)造層次結(jié)構(gòu)方法。首先,根據(jù)動作影響的狀態(tài)分量將動作集合劃分為多個不相交的子集;然后,分析Agent在不同狀態(tài)下的可用動作,并識別瓶頸動作;最后,由瓶頸動作與執(zhí)行次序確定動作子集之間的上下層關(guān)系,并構(gòu)造層次結(jié)構(gòu)。此外,對MAXQ方法中子任務(wù)的終止條件進(jìn)行修改,使所提算法構(gòu)造的層次結(jié)構(gòu)可以通過MAXQ方法找到最優(yōu)策略。實驗結(jié)果表明,所提算法可以自動構(gòu)造層次結(jié)構(gòu),而不會受環(huán)境變化的干擾。與Q學(xué)習(xí)、Sarsa算法相比,MAXQ方法根據(jù)該結(jié)構(gòu)得到最優(yōu)策略的時間更短,獲得回報更高。驗證了所提算法能夠有效地自動構(gòu)造MAXQ層次結(jié)構(gòu),并使尋找最優(yōu)策略更加高效。
- 基于層次值的皮膚創(chuàng)面形態(tài)學(xué)展開方法綜述 6次下載
- 基于POI分布的空間索引結(jié)構(gòu)TDG 10次下載
- 基于數(shù)據(jù)外包的空間查詢驗證方法 23次下載
- 可提取非線性結(jié)構(gòu)的子空間聚類方法 2次下載
- 基于層次值的皮膚創(chuàng)面形態(tài)學(xué)展開方法 31次下載
- DSP不同層次的低功耗設(shè)計研究思路綜述 19次下載
- 一種可行的分布式存儲系統(tǒng)安全構(gòu)造方法 21次下載
- 基于異質(zhì)網(wǎng)絡(luò)層次的基因節(jié)點表示學(xué)習(xí)方法 5次下載
- 可同步目標(biāo)導(dǎo)向行為和記憶空間結(jié)構(gòu)的視覺導(dǎo)航方法 11次下載
- 基于空間/通道注意力機(jī)制的化學(xué)結(jié)構(gòu)圖像識別方法 7次下載
- 基于層次社區(qū)結(jié)構(gòu)的大規(guī)模社會網(wǎng)絡(luò)K-出入度匿名算法 8次下載
- 一種層次結(jié)構(gòu)中多維屬性的可視化方法 0次下載
- 基于思維導(dǎo)圖層次結(jié)構(gòu)的本體庫創(chuàng)建方法 17次下載
- 層次原理圖設(shè)計 0次下載
- 結(jié)構(gòu)設(shè)計中的鋼筋混凝土構(gòu)造
- arcgis空間分析方法有哪些 2468次閱讀
- 在 MATLAB 中實現(xiàn)層次分析法的主要步驟 2552次閱讀
- 計算機(jī)網(wǎng)絡(luò)的層次結(jié)構(gòu) 7902次閱讀
- 聚類分析中的機(jī)器學(xué)習(xí)與統(tǒng)計方法綜述(二) 1262次閱讀
- Matplotlib圖表層次結(jié)構(gòu) 1887次閱讀
- 步進(jìn)電機(jī)零位標(biāo)定的方法 8014次閱讀
- 熱繼電器的結(jié)構(gòu)圖解 1.8w次閱讀
- C++:詳談拷貝構(gòu)造函數(shù) 2158次閱讀
- 組合開關(guān)構(gòu)造_組合開關(guān)選用 6787次閱讀
- 自動空氣開關(guān)的結(jié)構(gòu)和工作原理 1.5w次閱讀
- 如何通過MEC構(gòu)造基于深度學(xué)習(xí)的自動駕駛汽車緩存 4559次閱讀
- 自動神經(jīng)結(jié)構(gòu)搜索方法實現(xiàn)高效率卷積神經(jīng)網(wǎng)絡(luò)設(shè)計 5289次閱讀
- 一種利用強(qiáng)化學(xué)習(xí)來設(shè)計mobile CNN模型的自動神經(jīng)結(jié)構(gòu)搜索方法 3852次閱讀
- 哈夫曼算法的理解及原理分析,算法實現(xiàn),構(gòu)造哈夫曼樹的算法 3.4w次閱讀
- 利用狀態(tài)機(jī)的狀態(tài)機(jī)實現(xiàn)層次結(jié)構(gòu)化設(shè)計 3337次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費
- 2AN158 GD32VW553 Wi-Fi開發(fā)指南
- 1.51MB | 2次下載 | 免費
- 3AN148 GD32VW553射頻硬件開發(fā)指南
- 2.07MB | 1次下載 | 免費
- 4AN111-LTC3219用戶指南
- 84.32KB | 次下載 | 免費
- 5AN153-用于電源系統(tǒng)管理的Linduino
- 1.38MB | 次下載 | 免費
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費
- 7SM2018E 支持可控硅調(diào)光線性恒流控制芯片
- 402.24 KB | 次下載 | 免費
- 8AN-1308: 電流檢測放大器共模階躍響應(yīng)
- 545.42KB | 次下載 | 免費
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機(jī)智能手環(huán)心率計步器體溫顯示設(shè)計
- 0.10 MB | 130次下載 | 免費
- 4使用單片機(jī)實現(xiàn)七人表決器的程序和仿真資料免費下載
- 2.96 MB | 44次下載 | 免費
- 53314A函數(shù)發(fā)生器維修手冊
- 16.30 MB | 31次下載 | 免費
- 6美的電磁爐維修手冊大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測試電源的紋波
- 0.36 MB | 17次下載 | 免費
- 8感應(yīng)筆電路圖
- 0.06 MB | 10次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論