定義(arthur samuel 1959):
在不直接針對問題進行程式設計的情況下,賦予計算機學習能力的研究領域。
例:arthur的下棋程式,計算走每一步獲勝的概率,最終打敗程式作者本人。(感覺使用決策樹思想)
定義2(tom mitchell 1998):
乙個合理的學習問題應該這樣定義:對乙個電腦程式來說,給它乙個任務t和乙個效能測量方法p,如果在經驗e的影響下,p對t的測量結果得到了改進,那麼就說改程式從e中學習了。
如上例:e:程式不斷和自己下棋的經歷,t:下棋,p:和人類選手對弈的勝率
課程的四大部分:
1、 有監督學習
(1) 回歸問題
例:收集某地房屋**統計
房屋大小和**對應情況:
畫出一條擬合曲線,就可以通過房屋大小估計**。
- 有監督學習即給出乙個資料集(正確的房屋**及對應大小)
- 此例為回歸問題。回歸意味著需要**的變數是連續的
(2) 分類問題
分類問題中需要處理的變數是離散的
例:判斷腫瘤是惡性還是兩性
- 收集腫瘤大小和惡性/良性資料,大小為橫軸,是否是惡性為縱軸(只有0,1)畫圖
- 腫瘤可能由多個因素導致,引入年齡,大小為橫軸,年齡為縱軸,惡性以叉表示,良性以圓圈表示畫圖,分析患腫瘤的區域
- 還可引入更多屬性,畫在多維空間中
- 無限維空間如何處理?將無限維對映到記憶體的演算法?
2、 學習理論
學習理論即解釋學習型演算法有效的原因(學習演算法的理論基礎)
尋找什麼樣的演算法能很好地近似不同的函式,訓練集的規模是否合適
3、 無監督學習
例:如上述腫瘤例子,圖中的點不知道正確答案,而是由你從中找去一定的結構,即聚類。
應用於生物基因工程,影象處理,計算機視覺等領域
例:雞尾酒會問題
在嘈雜的雞尾酒會中,將你感興趣的聲音提取出來
運用兩個不同位置的麥克分開來自不同位置的聲音
還能應用於文字處理等領域
使用ica演算法,matlab一行**即可解決
4、 強化學習
通過決策產生的結論或對或錯,故產生一系列的決策。
例:對乙個模型飛機編寫乙個起飛程式,飛機在程式做了一連串錯誤決策是才會墜毀,只要做出連續的整體還不錯的決策,即可保持飛機正常飛行
強化學習的基本概念:回報函式(正反饋及負反饋),程式做出正確決策時給出正反饋,反之亦然。
程式不斷做出決策,在不斷嘗試獲得盡量多的正反饋時,逐漸學習並做出正確決策
關鍵在於要定義什麼是正確決策,什麼是錯誤決策,再設計演算法獲取盡量多的正反饋
機器學習 學習筆記 1
一 問題的引入 回歸分析大多屬於監督學習的一種方法。這種方法主要是根據從貼有便簽的理算資料通,通過統計等方法得到數學模型,然後將模型運用於 或者分類。通常是多維的,如果存在高維空間時,可通過核函式等方法優化處理。例如房屋的價錢和很多因素有關,而每乙個因素也成為乙個維度。這裡和多臂 問題 multi ...
機器學習 學習筆記1
什麼是機器學習?監督學習 supervised learning 如神經網路,提供資料和資料的標籤進行訓練 非監督學習 unsupervised learning 只提供資料而不提供對應的標籤進行訓練 半監督學習 利用少量有標籤樣本和大量無標籤樣本進行訓練,來對無標籤樣本進行分類 強化學習 rein...
機器學習學習筆記1
周志華機器學習 flyu6 time 2016 6 12 假設空間 歸納偏好 監督學習 所謂的監督學習其實就是在資料集d中有格式為 x,y 的形式,可以看出我們有明確的目標值或者標籤 y 與x的資料集有關關聯關係。我們可以通過尋找x與y的關係來確定乙個關係化的模型。在這個模型的學習中,我們是通過真是...