action -環境中的**(agent)執行決策(decision)的行為。
agent - 在訓練場景中執行觀察(observation)和行動(action)的unity元件,**的行動由與之相連的大腦(brain)做出的決策驅動。
brain - 給和大腦連線的**作出決策的unity元件。
decision - 對於被觀察的行動,由大腦做出的行為規範。
editor -包含很多功能面板 (e.g. hierarchy, scene, inspector)的unity編輯器。
environment - 乙個unity場景,包含唯一的學院,乙個或多個**和與之相連的大腦。
fixedupdate - unity裡每隔固定時間(預設0.02秒)執行一次的方法,ml-agents的邏輯應該在這個方法裡實現。
frame - 主攝像機進行渲染並顯示的乙個例項,對應於遊戲引擎每次呼叫的update方法。
observation - 為**提供一部分訓練環境狀態資訊。 (e.g. vector, visual, text)
policy - 由觀察結果產生決策的方法。
reward - 訓練過程中每一步的反饋訊號,用來判斷**在訓練環境當前的狀態下的行動對否符合預期。
state - 給定時間內訓練環境的基本屬性(包含其中所有的**)。
step - 對應引擎中每次呼叫的fixupdate方法,反映的(可能)是最小的原子狀態的變化。
update - unity每渲染一幀呼叫一次的方法,ml-agents的邏輯不應該在update裡實現(因為渲染一幀的時長是不固定的)。
external coordinator - 負責與外部程序通訊的ml-agents類 (本例中為python api)。
trainer - 負責訓練外部大腦(external brain)的python類 ,包含為外部大腦做出決策的tensorflow。
unity學習 unity技術
我們今天學習了,類和方法,如何給變數進行定義乙個類,還有就是把這個類進行呼叫 什麼叫作成員變數 表明物件的狀態,也稱之為例項變數。定義的格式 修飾符 資料型別 變數名 修飾符 private,protected,public預設 friendly 資料型別 基本資料型別,陣列,類,介面。宣告 此篇文...
unity學習 unity技術
今天,上午是在學校度過的。我們請了一天的假,從北京來到了保定,我們培訓老師,作為我們的後備軍,也來到了學校,想問問有沒有其他同學,也有這個unity開發興趣愛好培養,我們剛到學校就來到教室,先照的一寸畢業 再來就是到教室寫畢業生調查表,忙活了半天,才把這幾件瑣碎事辦完,一班在乙個小時內就完成了所有任...
unity學習 unity技術
今天我們學習了,如何進行方法過載.例如 int i 5,j 10,a sum 0 public void get public void get int n 這是呼叫了兩個函式方法,也可以定義多個名稱相同方法函式但構造引數不同,這就是方法過載。物件建立則是需要另一條語句 classname 物件名 ...