深度學習與圍棋遊戲 筆記 1

2021-09-17 21:50:39 字數 1008 閱讀 9596

最近,搞到一本書 deep learning and the game of go 。

歐美書商好像有種習慣,科技方面尤其程式設計相關的電子書,銷售一段時間後會公開放到網上,供人免費下載。這本書就來源於此。

估計,有社會資本支援書商的善舉。希望國內資本雄厚的企業,向西方學習,鼓勵支援國內書商也這樣做。

第1章, 簡明扼要地介紹人工智慧、機器學習、深度學習。

第2章, 介紹圍棋規則。

第3章, 用python實現你第乙個圍棋機械人,棋力很弱。

它們是搜尋樹、神經網路、強化學習。alpahgo使用它們效果很好。

搜尋樹

第4章,涉及最大最小值搜尋、alpha­-beta 剪枝、蒙特卡羅搜尋。

神經網路

第5章,神經網路入門。

第6章,用 keras 和卷積網路處理圍棋棋譜。

第7章,用業餘高手的棋譜訓練深度學習網路,並指出此技術的侷限。

第8章,介紹與人對弈的介面介面,和與其他機械人對弈的本地機或伺服器布置設定。

強化學習

第9章,圍棋強化學習入門。

第10章,強化學習的梯度策略。

第11章,強化學習的估值方法。用於選擇棋盤落子點位。

第12章,介紹強化學習的actor-critic方法,用於預估棋盤點位的長久價值,以選擇下一步棋。

第13章,上述第4-11章是建造 alpha go 的數學、技術原理。

第14章,介紹 alphago zero。

附錄 a, 數學基礎,涉及線性代數和微積分基本知識,以及如何用 numpy 對其運算。

附錄 b, 後向傳播演算法,解釋大多數神經網路學習程式的數學原理細節。

附錄 c, 與深入學習下圍棋相關的圍棋程式和伺服器。

附錄 d, 使用 amazon 雲伺服器訓練、部署你的機械人。

附錄 e, 將你的機械人提交 online go server (ogs), 與世界各地的棋手對弈,測試你的機械人。

深度學習與圍棋遊戲 筆記 2

教機器學習的內容 布局模型庫。由高手布局棋譜中的高頻率走步構成。建立棋局狀態搜尋樹。儘量減少備選的下一步棋。估算每步棋的價值。衡量機械人的棋力 傳統的日本級段制。與機械人或者人模擬賽測定。包括以下內容 建立目錄 dlgo,其下建 3 個檔案 檔案 init py內容為空。在模組 gotype.py ...

深度學習筆記(1)

4深度學習基礎 5流程6應用場景 7參考文獻 最近學習深度學習的基礎,這裡主要是將一些了解的概念和資料做了一下總結,方便查閱。最近隨著人工智慧這個概念的發展,並且作為國家戰略發展方向,機器學習,深度學習的概念也變得很火,許許多多的程式設計師都開始往這個方向發展,不過,還需要一些基礎才行。深度學習的概...

深度學習筆記(1)

深度學習是機器學習的分支,要學深度學習,首先要知道機器學習。1 模型是機器學習的最終輸出結果。2 機器學習是依賴模型自身獲得引數而非依賴人,通過訓練資料去找模型解決問題。3 針對某類問題,如果人能夠很容易地解決,那我們直接使用大腦中解決辦法所遵循的規則無非是極好的,難的是如何把這些規則抽象為計算機能...