1、實現統計學習的方法的步驟如下:
(1)得到乙個有限的訓練資料集合,假設這些資料是獨立同分布的。
(2)確定包含所有可能的模型的假設空間,即學習模型的集合。
(3)確定模型選擇的準則,即學習的策略。
(4)實現求解最優模型的演算法,即學習的演算法。
(5)通過學習方法選擇最優模型。
(6)利用學習的最優模型對新資料進行**和分析。
2、回歸、分類和標註問題
回歸:輸入變數和輸出變數均為連續變數的**問題稱為回歸問題。
分類:輸出變數為有限個離散變數的**問題稱為分類問題。
標註:輸入變數和輸出變數均為變數序列的**問題稱為標註問題。
3、損失函式與風險函式
損失函式度量模型一次**的好壞,風險函式度量平均意義下模型**的好壞。
損失函式:在假設空間中選取模型f作為決策函式,對於給定的輸入x,由f(x)給出相應的輸出y,這個輸出的**值f(x)與真實值y可能一致也可能不一致,用乙個損失函式或代價函式來度量**錯誤的程度。
損失函式值越小,模型就越好。
統計學習方法概述
監督學習的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 輸入空間和輸出空間是輸入和輸出的所有可能取值的集合,可以是有限個元素,也可以是整個歐式空間。每個輸入由特徵向量表示,所有特徵向量的空間為特徵空間。特徵向量的每一維對應乙個特徵。輸入空間和特徵空間不一定一致。模型輸入...
統計學習方法筆記 概述
小知識點 法向量 垂直於平面的直線所表示的向量為該平面的法向量 法向量一般是方程的係數,比如 ax by cz d 0,那麼法向量就是 a,b,c 證明如下 一 範數 l0範數 向量中非0元素的個數 l1範數 向量中各元素的絕對值之和 l2範數 向量中各元素的平方和然後求平方根 二 經驗風險與結構化...
統計學習方法筆記 01概述
統計學習是計算機運用資料及統計方法提高效能的機器學習 herbert a.simon.如果乙個系統能夠通過執行某個過程改進它的效能,這就是學習。物件是資料 從資料出發,提取資料特徵,抽象資料模型,發現資料知識,回到資料的分析與 中。前提假設 同類資料具有一定的統計規律性。比如用隨機變數來描述資料特徵...