機器學習基本概念

2021-08-29 02:54:26 字數 1034 閱讀 1591

機器學習:對於某類任務t和效能度量p,電腦程式在t上以p衡量的效能隨著經驗e而自我完善

以跳棋為例的設計流程:

一.選擇訓練經驗:

訓練經驗的三種屬性:

1.訓練經驗能否為系統的決策提供直接或間接的反饋,從直接的訓練反饋學習比間接的訓練反饋學習容易,因為間接樣例常涉及回溯和信用分配,比如棋類,對較早走子的正確性需要最終棋局結果來判定

2.學習器可以在多大程度上控制訓練樣例,有3種情況:訓練樣例以超乎學習器控制的隨機過程提供;學習器向施教者查詢;學習器通過自動搜尋環境蒐集訓練樣例

3.訓練樣例的分布能多好的表示實際樣例的分布

二.選擇目標函式

程式需要學會在合法的走子中選擇最佳走子,合法走子定義了乙個已知的巨大的搜尋空間,最佳的搜尋策略未知。要學習的資訊型別是乙個函式

這裡選擇評估函式,對棋盤的每個狀態進行評分,好的棋局賦值高分數,若學會了這個函式v,那麼就可以找到當前棋局對應的最佳走法,只要遍歷所有合法走子後的棋盤狀態,選擇分數最高的即可。定義v(b)如下:

若b是最終的勝局,那麼v(b)=100

若b是最終的敗局,那麼v(b)=-100

若b是最終的和局,那麼v(b)=0

若b不是最終棋局,那麼v(b)=v(b'),其中b'是從b開始雙方都採取最優對弈後可達到的棋局

這是乙個理想目標函式,用遞迴實現,很難學習,學習目標函式的過程其實是函式逼近,即期望學習到的是近似目標函式

三.選擇目標函式的表示

棋盤上黑子的數量

棋盤上紅字的數量

棋盤上黑王的數量

棋盤上紅王的數量

被紅子威脅的黑子數量

被黑子威脅的紅子數量

得到目標函式表示:

其中四.選擇函式逼近演算法

為了學習目標函式需要訓練樣例,每個樣例描述了當前棋盤狀態和訓練值,即乙個形如

調整權值:常用的方法是誤差平方和最小:

其中五.最終設計

核心元件如下:

機器學習基本概念

什麼是學習?如果乙個系統能夠通過執行某個過程改進它的效能,這就是學習。赫爾伯特 西蒙 什麼是機器學習?對於某給定的任務 t 在合理的效能度量方案 p的前提下,電腦程式可以通過自主學習任務 t 的經驗 e 隨著提供合適,優質,大量的經驗 e 該程式對於任務 t的效能逐步提高。任務,經驗,效能 什麼是統...

機器學習基本概念

1.基本的概念 領域集 乙個任意的集合 集合中的例項是我們希望能夠貼上標籤的資料。的元素稱為例項。標籤集 學習器所追求的結果集合。可以為,器想要得到的最終資料。訓練資料 帶標籤的領域及元素集合,通常會組成乙個區域性聚合s,也叫作訓練集。2.機器學習的一般流程 採集資料 標記 訓練 得到 器 乙個學習...

機器學習基本概念

1.基本概念 訓練集 測試集 特徵值 監督式學習 非監督學習 半監督學習 分類 回歸 2.概念學習 概念學習是指從某個布林函式的輸入輸出訓練樣例中推斷出該布林函式。3.樣例 天氣 溫度 濕度 風力 水溫 預報 享受運動 1 晴 暖 普通 強 暖 一樣 是 2 晴 暖 大 強 暖 一樣 是 3 雨 冷...