Please enable JavaScript.
Coggle requires JavaScript to display documents.
論文架構 - Coggle Diagram
論文架構
第三章
MDRs模型
問題描述
模型敘述(名稱?)
定義符號
數學模型
假設條件
求解過程
探索策略
模擬環境設計
模型整體運作機制
畫一個強化學習的圖表done
訓練資料說明 定義元素名稱done(!)
研究步驟流程done
MDRs機制+模擬環境講解done(!)
舊方法文獻Review(!)
Reward Functions(!)
探索目標 + 參考RL書籍
multi-pass(圖)
第四章
Plnats Simulation
說明
離散建模
Pytorch
不同方法比較
Q-Learning..
超參數設定假設
決策的時間步長的實驗
Replay Buffer 的兩種方式
神經網路架構
實驗假設
第一章
Smart Factory
CPS
RTS
MDRs and SDR
RL
....
算法
探索策略
Epsilon greedy
boltzmann exploration
Double
Dueling
DQN
Dueling+Double
第二章
ML
RL
SDR and MDRs
RL演化史
第五章
結論
Dueling + Double 最好
Double
Dueling
Nature D