統計學習是概率論、統計學、資訊理論、計算理論、最優化理論及電腦科學等多個領域的交叉學科;它從資料出發,提取出資料的特徵,抽象出資料的模型,發現資料中的知識,又回到對資料的分析與**中去。
如果乙個系統能夠通過執行某個過程改進他的效能,這就是學習——herbert a. simon監督學習
從標註資料中學習1). 輸入空間、特徵空間和輸出空間監督學習的本質是學習輸入到輸出的對映的統計規律
2). 聯合概率分布
監督學習假設輸入與輸出的隨機變數\(x\)和\(y\)遵循聯合概率分布\(p(x,y)\)。統計學習假設資料存在一定的統計規律,\(x\)和\(y\)具有聯合概率分布就是監督學習關於資料的基本假設。3). 假設空間
模型屬於優輸入控制項到輸出空間的對映的集合,這個集合就是假設空間。監督學習的模型可以是概率模型或非概率模型,由條件概率分布\(p(y|x)\)或決策函式\(y = f(x)\)表示。對具體的輸入進行相應的輸出**是,寫作\(p(y|x)\)或\(y = f(x)\)
在**過程中,**系統對於給定的測試樣本集中的輸入\(x_\),由模型\(y_ = \arg\max\limits_\hat(y|x_)\)或\(y_ = \hat(x_)\)給出相應的\(y_\)
4). 問題的形式化
2. 無監督學習
從無標註資料中學習強化學習本質是學習資料中的統計規律或潛在結構
強化學習是指智慧型系統在與環境的連續互動中學習最有行為策略的機器學習問題。假設智慧型系統與環境的互動基於馬爾可夫決策過程,智慧型系統能觀測到的是與環境互動得到的資料序列。
強化學習的本質是學習最有的序貫決策。
在每一步\(t\),智慧型系統從環境中觀測到乙個狀態\(s_t\)與乙個獎勵\(r_t\),採取乙個動作\(a_t\)。環境根據智慧型系統選擇的動作,決定下一步\(t+1\)的狀態\(s_\)與獎勵\(r_\)。
要學習的策略表示為給定的狀態下採取的動作。智慧型系統的目標不是短期獎勵的最大化,而是長期積累獎勵的最大化。
強化學習過程中,系統不斷的試錯,以達到學習最優策略的目的。
馬爾可夫決策過程
少量標註資料、大量未標註資料機器不斷主動給出實力讓教師進行標註。監督學習可以看作是「被動學習」,主動學習的目標是找出對學習最有幫助的例項讓教師標註,以較小的標註代價,達到較好的學習效果。條件概率分布最大化後得到函式,函式歸一化後得到條件概率分布。引數化模型假設模型引數的維度固定,非引數化模型假設模型引數的維度不固定或者說無窮大。引數化模型適合簡單問題,現實問題使用非引數化模型更加有效。第一章 統計學習及監督學習概論(五)
學習方法的泛化能力是指由該方法學習到的模型對未知資料的 能力,是學習方法本質上的重要性質。現實中採用最多的就是通誤差來評價學習方法的泛化能力。公式表示為 r f e p l y,f x x xyl y,f x p x,y dx dyr hat e p l y,hat x int l y,hat x ...
統計學習方法 第一章 統計學習及監督學習 筆記
本章講述監督學習方法。監督學習是從標註資料中學習模型的機器學習問題。統計學習 statistical learning 是關於計算機基於資料構建概率統計模型並運用模型對資料進行 與分析的一門學科。統計學習也稱為統計機器學習 statistical machine learning 主要特點 以計算機...
統計學習及監督學習概論(4)
統計學習方法 第二版 1.6 1.8 用學到的模型 hat f 對未知資料 的誤差即為泛化誤差 generalization error 泛化誤差反映了學習方法的泛化能力。事實上,泛化誤差就是所學習到的模型的期望風險。泛化誤差上界 generalization error bound 性質 是樣本容...