Grid2op reward相關知識

2021-10-24 06:24:47 字數 552 閱讀 6670

grid2op reward相關知識

reward大致包含了6個函式

1、__init__函式一般是宣告引數,

2、initialize函式,初始化引數,尤其是reward_min和reward_max,

3、__call__函式是為了計算獎賞值,其中包含了電網動作中的不同情況,

has_error表示電網中的錯誤動作或者未完成的動作,

is_done表示完成的動作,

is_illegal,非法的動作,觸發grid2op.exceptions.illegalaction,在這種情況下,被do nothing替代,

is_ambiguous模糊的動作,觸發grid2op.exceptions.ambiguousaction,在這種情況下,被do nothing動作替代,

4、get_range函式,檢索最低和最高可能獎勵的函式,不建議重寫此函式。

5、set_range函式,設立最高獎賞值、最低獎賞值屬性的函式,不建議重寫該函式。

6、__iter__函式,生成器,給出name、reward_min、reward_max值。

Extjs2 3相關學習貼士 Grid相關

專案空閒,順便找了資料研究了一下example裡的幾個典型應用用於學習,做了一點相關記錄,分享之。願對您有所脾益。grid相關 body p div td 可能個是grid中的height屬性沒有設定 關於ext.data.store與ext.data.store store為store的子類具體用...

11g RAC R2 體系結構 Grid

從oracle 11.2開始出現了多使用者的概念,oracle開始使用一組多執行緒的daemon來同時支援多個使用者的使用 管理資源,這些daemon叫做agent。這些agent都是些常駐記憶體的程序.第一層第二層 ohasd的agent 第三層 資源 ohasd的oraagent所管理資源的相應...

Cocos2d x3 2 Grid3D網格動作

include cocos2d.h classgamescene publiccocos2d layer include gamescene.h using ns cc cocos2d scene gamescene createscene 初始化當前的圖層 boolgamescene init 備...