如上圖所示,alphago的策略網路和價值網路用於描述棋局當前局勢的49個特徵,棋盤上的361個點每個點都可以用這49個特徵進行描述,下面將一一進行解讀:
1、stonecolour:
這個點放的黑子、白子還是空點。
2、ones
賦值為常量1,具體作用不詳。
3、turns since
在周圍的八個點中,這一步棋有多少變化。
4、liberties
環繞這個點的八個點中,有幾個空點。
5、capture size
周圍的八個點中,有幾個點是對方的死子。
6、self-atari size
周圍的八個點中,有幾個點是自己一方的死子。
7、liberties after move
走過一步棋後,周圍八個點有幾個空點。
8、ladder capture
征子是否成功捕獲。
9、ladder escape
征子是否成功逃脫。
10、sensibleness
下步棋如果下這個點,是否合法(填在對方的眼裡,並且沒有氣,則為不合法),或者有沒有填自己的眼。
11、zeros
和ones一樣,賦值為常量0,具體作用不詳。
12、player color
下一步是否該黑棋下。
如何用機器學習演算法計算特徵重要性
1.決策樹 使用基尼係數 gi 和資訊增益 ig 為決策樹計算特徵重要性。1 資訊增益 information gain 假定當前樣本集合d中第k類樣本所佔我的比例為 假定離散屬性a有v個可能的取值 一般而言,資訊增益越大,則意味著使用屬性a來進行劃分所獲得的 純度提公升 越大。2 基尼指數 gin...
如何用C 寫乙個類
其實寫乙個類很簡單,但是要寫乙個符合各方面要求的類,卻不是一件容易的事情。下面總結一下需要考慮的一些問題,先把暫時想到的方面記下來,以後想到新的在增加吧。類的生死和初始化 1.copy ctor和copy assignment是不是需要private 單例常用 或者是不是要用private繼承來阻止...
如何用scanf讀取乙個句子
因此有下面兩種方法可以在使用scanf時完整輸入字串 1 利用strcat 函式來實現帶空格字串的輸入,可以用字串追加函式strcat 來連線每個單詞。strcat 一般格式 char strcat char dest,const char src 函式將字串src連線到dest的尾端,並返回字串d...